下一級(jí)推理加速已經(jīng)到來(lái)
我們正面向未來(lái)砥礪前行。在未來(lái),人工智能將會(huì)觸及并改善與客戶的每一次互動(dòng)、每一種產(chǎn)品以及每一項(xiàng)服務(wù)。認(rèn)識(shí)到未來(lái)需要一個(gè)能夠加速現(xiàn)代人工智能各種應(yīng)用的計(jì)算平臺(tái),使企業(yè)能夠創(chuàng)造新的客戶體驗(yàn),重新構(gòu)想他們?nèi)绾螡M足和超越客戶需求,并經(jīng)濟(jì)高效地?cái)U(kuò)展他們基于人工智能的產(chǎn)品和服務(wù)。
NVIDIA® Tesla® T4 GPU 是世界上極其先進(jìn)的推理加速器。搭載 NVIDIA Turing™ Tensor Core 的 T4 提供革命性的多精度推理性能,以加速現(xiàn)代人工智能的各種應(yīng)用。T4 封裝在節(jié)能的小型 70 瓦 PCIe 中,可針對(duì)橫向擴(kuò)展服務(wù)器進(jìn)行優(yōu)化,并且旨在實(shí)時(shí)提供極其先進(jìn)的推理。
極具突破性的推理性能
Tesla T4 引入革命性的 Turing Tensor Core 技術(shù),具備人工智能推理的多精度計(jì)算性能。從 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的性能比 CPU 高出 40 倍,實(shí)現(xiàn)性能的重大突破。
先進(jìn)的實(shí)時(shí)推理
響應(yīng)性是提高用戶參與度的關(guān)鍵,范圍涉及諸多服務(wù),例如:會(huì)話式人工智能、推薦系統(tǒng)和可視化搜索。隨著模型準(zhǔn)確性和復(fù)雜性的提高,目前立即交付正確答案所需的計(jì)算能力也在呈指數(shù)級(jí)提升。Tesla T4 可提供 優(yōu)于 40 倍的低延時(shí)高吞吐量,進(jìn)而可以實(shí)時(shí)滿足更多的請(qǐng)求。
視頻轉(zhuǎn)碼性能
隨著在線視頻的數(shù)量呈指數(shù)級(jí)增長(zhǎng),人們對(duì)有效搜索以及從視頻中獲取洞察力的解決方案的需求也與日俱增。Tesla T4 為人工智能視頻應(yīng)用提供極具突破性的性能,其專用的硬件轉(zhuǎn)碼引擎將解碼性能提升至上一代 GPU 的兩倍。T4 可以解碼多達(dá) 38 個(gè)全高清視頻流,從而可以輕松地將可擴(kuò)展的深度學(xué)習(xí)集成到視頻管線中,以提供創(chuàng)新的智能視頻服務(wù)。