近日,比特大陸第二代人工智能芯片BM1682,這款產品能否打破外界的非議呢?接下來讓我們看看這款產品的細節。
2017年第4季度,比特大陸正式推出了其人工智能品牌算豐(SOPHON),發布了全球首款公開發售的TPU(Tensor Processing Unit張量計算單元)芯片BM1680,專門用于人工智能中的深度學習加速。
時隔不足一年,2018年3月,比特大陸又推出其第二款TPU芯片BM1682,根據初步披露的資料顯示,BM1682是一塊專門用于圖像/視頻處理方向的人工智能芯片。
BM1682與BM1680使用了相同的深度學習算法的硬件加速模塊,但相比BM1680而言,BM1682具有更強大的深度學習算法執行能力,此外BM1682還增加了視頻處理子模塊,以及適用于具體應用場景的諸多功能模塊。
BM1682定位更細分
從頂層架構圖上可以看到,BM1680比BM1682額外集成了高度定制的BMDNN Chip Link Subsystem。該子模塊可以在高速SerDes上提供穩定、靈活、低延遲的鏈路。用戶可以通過該鏈路將多個BM1680芯片連接成一個統一的整體,使其協同工作,大大提高系統的運算能力。
從頂層架構圖上可以看到與BM1680相比,BM1682芯片的整體架構發生了不小的變化,其定位則更加細分明確。
BM1682設計更豐富
從架構圖看,BM1682明顯復雜了很多。其額外增加了AP (Application Processor) Subsystem和Video Subsystem(視頻處理系統)。Video Subsystem(視頻子系統)則主要專注于視頻預處理的相關任務。
BM1682的Video Subsystem提供了2個H.264視頻解碼器,1個H.265解碼器。
比較貼心的是,BM1682提供了Video Post-Processing功能,該子模塊用于對采用H.264或H.265編碼的視頻進行渲染處理,這些渲染處理主要包括顏色空間轉換、視頻剪裁、縮放操作、仿射變換、多幀拼接等常規操作。經過Video Post-Processing對外界進入的視頻數據進行硬件加速預處理后,Video Subsystem會將處理后的數據通過總線傳輸給NPUs、DRAM、AP System或外接存儲設備,然后進行后續的深度學習處理等操作。
此外,BM1682提供了豐富的外界交互接口,如高速接口PCIE、以太網、SDIO3.0、WIFI等。BM1682將數據處理完畢后可以很方便地通過PCIE接口、以太網接口、或者WIFI接口將數據傳輸到總服務器。
BM1682極大提升
BM1682中每個NPU含有32個EUs,BM1680未知。根據BM1680、BM1682數據手冊顯示,單片BM1680單精度運算速度為2TFLops;單片BM1682單精度運算速度為3TFLops。BM1682的單片運算速度高出BM1680 50%。
BM1680單片的運行速度低于BM1682,但BM1680支持級聯工作模式,數個BM1680可以通過高速的Chip Link Subsystem組成一個集群式的系統,進行更高處理量的運算處理任務。BM1682不具備級聯功能。
BM1682更專注圖像、視頻處理
整個BM1682芯片搭載了視頻處理所需要的全部核心模塊,以及對其具體應用場景適應性的輔助模塊。BM1682對于需要進行圖像/視頻處理的市場應用可謂是十分便捷了。BM1682的輔助功能配置模塊自帶有線與無線網絡功能,對于視頻監控方向的市場應用十分方便,無線功能更是省略了網線布線的繁瑣施工,并且可用于實現遠程監控。
對于一些沒有網絡的場合,如科研領域的野外視頻收集處理、閉路視頻監控等,BM1682可以輕松的添加外置存儲裝置進行數據備份收集。BM1682作為圖像/視頻方向深度學習的SoC片上系統,市場前景很是廣闊,這款新品還是很值得期待的。
BM1684即將到來
此外,據比特大陸此前透露,BM1680的后續芯片早已開始進入研發階段,BM1682已經在去年12月成功流片,BM1684將會在2018年的9月完成流片。其中BM1684預計在2018年4季度成功量產,其性能指標將達到6T運算力、30W功耗、同時還支持FP16、INT8等低精度計算。其還將使用TSMC提供的12nm最新工藝。
比特大陸產品戰略總監湯煒偉表示,按照規劃每隔9個月左右就會推出新的算豐AI芯片,而再過一兩代,比特大陸有信心在深度學習推理上超過GPU的實際性能。