光速圖像識(shí)別了解一下：低于1納秒的那種

量子位

+ 關(guān)注

2022-06-15 10:51

822次閱讀

Alex 發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

比深度神經(jīng)網(wǎng)絡(luò)速度還快的是什么？

或許光子DNN可以回答這個(gè)問題。

現(xiàn)在，美國(guó)研究者開發(fā)的一個(gè)光子神經(jīng)網(wǎng)絡(luò) (photonic deep neural network，PDNN)，讓圖像識(shí)別僅需1納秒。

1納秒是什么概念？它等于10^-9秒，這與最先進(jìn)的微芯片單時(shí)鐘周期（最小的時(shí)間單位）相當(dāng)。

此外，研究者測(cè)試發(fā)現(xiàn)，PDNN對(duì)圖像進(jìn)行2分類和4分類的準(zhǔn)確率分別高達(dá)93.8%和89.8%。

誠(chéng)然，如今的大型多層神經(jīng)網(wǎng)絡(luò)高效且運(yùn)算能力很強(qiáng)，但其也受到硬件的限制，往往需要消耗大量的電力資源等。

而賓夕法尼亞大學(xué)的工程師們研發(fā)的PDNN，能夠直接分析圖像，不需要時(shí)鐘、傳感器或大型存儲(chǔ)模塊，以有效降低耗能。

這項(xiàng)研究成果的相關(guān)論文在6月1日登上了Nature雜志。

光子DNN比傳統(tǒng)DNN更快

和傳統(tǒng)DNN相比，光子DNN的原理和性能有何不同？

先來看看傳統(tǒng)DNN：

圖a是傳統(tǒng)DNN的結(jié)構(gòu)示意圖，包括一個(gè)數(shù)據(jù)排列單元，然后是輸入層、幾個(gè)隱藏層，和一個(gè)提供分類輸出的輸出層。

圖b展示了傳統(tǒng)N輸入神經(jīng)元的結(jié)構(gòu)：輸入的線性加權(quán)和，通過一個(gè)非線性激活函數(shù)，產(chǎn)生神經(jīng)元的輸出。

光速圖像識(shí)別了解一下：低于1納秒的那種

圖c和圖d分別是一個(gè)PDNN芯片的神經(jīng)網(wǎng)絡(luò)示意圖和N輸入神經(jīng)元結(jié)構(gòu)。

首先在一個(gè)5×6光柵耦合器上形成輸入圖像，然后將其排列成4個(gè)重疊的子圖像，子圖像的像素被傳送到第一層神經(jīng)元，形成一個(gè)卷積層。

后面的神經(jīng)元與它們的前一層完全連接，該網(wǎng)絡(luò)產(chǎn)生2個(gè)輸出，可最多為4種圖像信息分類。

對(duì)于這些神經(jīng)元，其輸入都是光學(xué)信號(hào)。

光速圖像識(shí)別了解一下：低于1納秒的那種

在每個(gè)神經(jīng)元中，線性計(jì)算是通過光學(xué)方式進(jìn)行的，而非線性激活函數(shù)是通過光電子方式實(shí)現(xiàn)的，從而可使分類時(shí)間低于570ps（=0.57ns）。

論文的通訊作者，電氣工程師Firooz Aflatouni對(duì)這個(gè)PDNN的性能補(bǔ)充描述道：它每秒可以對(duì)近18億張圖像進(jìn)行分類，而傳統(tǒng)的視頻幀率是每秒24至120幀。

這里的PDNN芯片電路被集成在僅9.3 mm² 的面積內(nèi)，不需要時(shí)鐘、傳感器以及大型存儲(chǔ)模塊。

一個(gè)激光器被耦合到芯片內(nèi)，為各個(gè)神經(jīng)元提供光源；該芯片包含兩個(gè)5×6的光柵耦合器，分別作為輸入像素陣列和校準(zhǔn)陣列。

光速圖像識(shí)別了解一下：低于1納秒的那種

不過，均勻分布的供給光每個(gè)神經(jīng)元光提供了相同的輸出范圍，顯然這將允許將其擴(kuò)展到更大規(guī)模的PDNN。

光子DNN芯片的圖像分類測(cè)試

研究者們讓這個(gè)PDNN微芯片識(shí)別手寫字母。

一組實(shí)驗(yàn)測(cè)試了PDNN芯片的二分類性能：需要對(duì)共計(jì)216個(gè)“p”和“d”字母組成的數(shù)據(jù)集進(jìn)行分類。

該芯片準(zhǔn)確率高于93.8%。（（92.8%+94.9%）/2）

光速圖像識(shí)別了解一下：低于1納秒的那種

另一組實(shí)驗(yàn)測(cè)試了PDNN芯片的四分類性能：需對(duì)共計(jì)432個(gè)“p”、“d”、“a”、“t”字母組成的數(shù)據(jù)集進(jìn)行分類。

該芯片分類準(zhǔn)確率高于89.8%。

光速圖像識(shí)別了解一下：低于1納秒的那種

這些結(jié)果表明，即使有更多的類（如分四類情況），且存在打印機(jī)引起的變化和噪聲，PDNN芯片仍取得了較高的分類精度。

為了比較這個(gè)PDNN和傳統(tǒng)DNN的圖像分類準(zhǔn)確性，研究者還測(cè)試了在Python中使用Keras庫實(shí)現(xiàn)的190個(gè)神經(jīng)元組成的DNN，結(jié)果顯示：它在相同圖像上的分類準(zhǔn)確率為96%。

作者簡(jiǎn)介

光速圖像識(shí)別了解一下：低于1納秒的那種

論文一作，F(xiàn)arshid Ashtiani現(xiàn)任美國(guó)賓夕法尼亞大學(xué)電氣和系統(tǒng)工程系博士后研究員，主要研究方向是光子-電子聯(lián)合/混合集成系統(tǒng)。

光速圖像識(shí)別了解一下：低于1納秒的那種

論文的其他作者也都來自賓大的電氣和系統(tǒng)工程系。

去年，就有一位日本NTT研究所的科學(xué)家表示，光子計(jì)算可以降低神經(jīng)網(wǎng)絡(luò)計(jì)算的能耗，擁有巨大潛力，很可能成為深度學(xué)習(xí)的未來重點(diǎn)發(fā)展對(duì)象。

該研究的賓大工程師們則表示，PDNN對(duì)光學(xué)數(shù)據(jù)的直接、無時(shí)鐘處理消除了模擬-數(shù)字轉(zhuǎn)換和對(duì)大型內(nèi)存模塊的要求，使下一代深度學(xué)習(xí)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)更快、更節(jié)能。

對(duì)于光子深度神經(jīng)網(wǎng)絡(luò)的前景和應(yīng)用，你怎么看？

論文地址：
https://www.nature.com/articles/s41586-022-04714-0#article-info
參考鏈接：
https://spectrum.ieee.org/photonic-neural-network

本文來自微信公眾號(hào)“量子位”（ID：QbitAI），36氪經(jīng)授權(quán)發(fā)布。