關於深度學習 cpu gpu ，我們在網路上蒐集到這些相關的討論、資訊與評價

「深度學習 cpu gpu」的推薦目錄：

關於深度學習 cpu gpu 在 Inside 硬塞的網路趨勢觀察 Facebook 的最讚貼文
關於深度學習 cpu gpu 在台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
關於深度學習 cpu gpu 在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

關於深度學習 cpu gpu 在志祺七七 X 圖文不符 Youtube 的最佳解答

關於深度學習 cpu gpu 在 31 深度学习硬件：CPU 和GPU【动手学深度学习v2】 - YouTube 的評價
關於深度學習 cpu gpu 在深度學習裝機指南：從GPU到顯示器，全套硬體最新推薦的評價

深度學習 cpu gpu 在 Inside 硬塞的網路趨勢觀察 Facebook 的最讚貼文

2021-07-30 14:18:39 有 4 人按讚

#2021INSIDE未來日｜AIoT 可說是眾多科技關鍵字裡，改變世界力量最強、產值也最大的現在進行式之一。顧名思義，AIoT 是人工智慧（AI）加上物聯網（IoT）混合產出的架構。

然而，這兩個概念其實原本都不新。但 2012 年 Alex Krizhevsky、Ilya Sutskever 兩位多倫多大學的學生改變了這一切，他們直接使用 NVIDIA 的 GPU 套上卷積式神經網路的深度學習模型，運算速度比 CPU 快上 70 倍。一舉拿下 ImageNet 冠軍，讓以機器學習為主的 AI 技術迅速普及至世間。

不過，講到這裡，你真的了解 AIoT 嗎？

#INSDIE未來日將在9/24（五）重啟，讓你一次看懂 AI + IoT，你準備好跟著AIoT數位轉型了嗎？現在就來登記參加免費線上論壇：https://lihi1.cc/Q2Pp6

Tags: 深度學習 cpu gpu 2021INSIDE未來日 INSDIE未來日

Inside 硬塞的網路趨勢觀察

About author

主站： http://www.inside.com.tw 網路產業求才看板： http://jobs.inside.com.tw

社群媒體、行動網路、區塊鏈、AI、網路行銷、有趣技術、網路創業相關議題，請上 http://www.inside.com.tw/

深度學習 cpu gpu 在台灣物聯網實驗室 IOT Labs Facebook 的最佳解答

By 台灣物聯網實驗室 IOT Labs

2021-07-27 11:56:34 有 1 人按讚

摩爾定律放緩　靠啥提升AI晶片運算力？

作者 : 黃燁鋒，EE Times China
2021-07-26

對於電子科技革命的即將終結的說法，一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續，也就意味著資訊技術的整棟大樓建造都將出現停滯，那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有的，但這波革命始終也沒有結束。AI技術本質上仍然是第三次科技革命的延續……

人工智慧(AI)的技術發展，被很多人形容為第四次科技革命。前三次科技革命，分別是蒸汽、電氣、資訊技術(電子科技)革命。彷彿這“第四次”有很多種說辭，比如有人說第四次科技革命是生物技術革命，還有人說是量子技術革命。但既然AI也是第四次科技革命之一的候選技術，而且作為資訊技術的組成部分，卻又獨立於資訊技術，即表示它有獨到之處。

電子科技革命的即將終結，一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續，也就意味著資訊技術的整棟大樓建造都將出現停滯，那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有，但這波革命始終也沒有結束。

AI技術本質上仍然是第三次科技革命的延續，它的發展也依託於幾十年來半導體科技的進步。這些年出現了不少專門的AI晶片——而且市場參與者相眾多。當某一個類別的技術發展到出現一種專門的處理器為之服務的程度，那麼這個領域自然就不可小覷，就像當年GPU出現專門為圖形運算服務一樣。

所以AI晶片被形容為CPU、GPU之後的第三大類電腦處理器。AI專用處理器的出現，很大程度上也是因為摩爾定律的發展進入緩慢期：電晶體的尺寸縮減速度，已經無法滿足需求，所以就必須有某種專用架構(DSA)出現，以快速提升晶片效率，也才有了專門的AI晶片。

另一方面，摩爾定律的延緩也成為AI晶片發展的桎梏。在摩爾定律和登納德縮放比例定律(Dennard Scaling)發展的前期，電晶體製程進步為晶片帶來了相當大的助益，那是「happy scaling down」的時代——CPU、GPU都是這個時代受益，不過Dennard Scaling早在45nm時期就失效了。

AI晶片作為第三大類處理器，在這波發展中沒有趕上happy scaling down的好時機。與此同時，AI應用對運算力的需求越來越貪婪。今年WAIC晶片論壇圓桌討論環節，燧原科技創始人暨CEO趙立東說：「現在訓練的GPT-3模型有1750億參數，接近人腦神經元數量，我以為這是最大的模型了，要千張Nvidia的GPU卡才能做。談到AI運算力需求、模型大小的問題，說最大模型超過萬億參數，又是10倍。」

英特爾(Intel)研究院副總裁、中國研究院院長宋繼強說：「前兩年用GPU訓練一個大規模的深度學習模型，其碳排放量相當於5台美式車整個生命週期產生的碳排量。」這也說明了AI運算力需求的貪婪，以及提供運算力的AI晶片不夠高效。

不過作為產業的底層驅動力，半導體製造技術仍源源不斷地為AI發展提供推力。本文將討論WAIC晶片論壇上聽到，針對這個問題的一些前瞻性解決方案——有些已經實現，有些則可能有待時代驗證。

XPU、摩爾定律和異質整合

「電腦產業中的貝爾定律，是說能效每提高1,000倍，就會衍生出一種新的運算形態。」中科院院士劉明在論壇上說，「若每瓦功耗只能支撐1KOPS的運算，當時的這種運算形態是超算；到了智慧型手機時代，能效就提高到每瓦1TOPS；未來的智慧終端我們要達到每瓦1POPS。這對IC提出了非常高的要求，如果依然沿著CMOS這條路去走，當然可以，但會比較艱辛。」

針對性能和效率提升，除了尺寸微縮，半導體產業比較常見的思路是電晶體結構、晶片結構、材料等方面的最佳化，以及處理架構的革新。

(1)AI晶片本身其實就是對處理器架構的革新，從運算架構的層面來看，針對不同的應用方向造不同架構的處理器是常規，更專用的處理器能促成效率和性能的成倍增長，而不需要依賴於電晶體尺寸的微縮。比如GPU、神經網路處理器(NPU，即AI處理器)，乃至更專用的ASIC出現，都是這類思路。

CPU、GPU、NPU、FPGA等不同類型的晶片各司其職，Intel這兩年一直在推行所謂的「XPU」策略就是用不同類型的處理器去做不同的事情，「整合起來各取所需，用組合拳會好過用一種武器去解決所有問題。」宋繼強說。Intel的晶片產品就涵蓋了幾個大類，Core CPU、Xe GPU，以及透過收購獲得的AI晶片Habana等。

另外針對不同類型的晶片，可能還有更具體的最佳化方案。如當代CPU普遍加入AVX512指令，本質上是特別針對深度學習做加強。「專用」的不一定是處理器，也可以是處理器內的某些特定單元，甚至固定功能單元，就好像GPU中加入專用的光線追蹤單元一樣，這是當代處理器普遍都在做的一件事。

(2)從電晶體、晶片結構層面來看，電晶體的尺寸現在仍然在縮減過程中，只不過縮減幅度相比過去變小了——而且為緩解電晶體性能的下降，需要有各種不同的技術來輔助尺寸變小。比如說在22nm節點之後，電晶體變為FinFET結構，在3nm之後，電晶體即將演變為Gate All Around FET結構。最終會演化為互補FET (CFET)，其本質都是電晶體本身充分利用Z軸，來實現微縮性能的提升。

劉明認為，「除了基礎元件的變革，IC現在的發展還是比較多元化，包括新材料的引進、元件結構革新，也包括微影技術。長期賴以微縮的基本手段，現在也在發生巨大的變化，特別是未來3D的異質整合。這些多元技術的協同發展，都為晶片整體性能提升帶來了很好的增益。」

他並指出，「從電晶體級、到晶圓級，再到晶片堆疊、引線接合(lead bonding)，精準度從毫米向奈米演進，互連密度大大提升。」從晶圓/裸晶的層面來看，則是眾所周知的朝more than moore’s law這樣的路線發展，比如把兩片裸晶疊起來。現在很熱門的chiplet技術就是比較典型的並不依賴於傳統電晶體尺寸微縮，來彈性擴展性能的方案。

台積電和Intel這兩年都在大推將不同類型的裸晶，異質整合的技術。2.5D封裝方案典型如台積電的CoWoS，Intel的EMIB，而在3D堆疊上，Intel的Core LakeField晶片就是用3D Foveros方案，將不同的裸晶疊在一起，甚至可以實現兩片運算裸晶的堆疊、互連。

之前的文章也提到過AMD剛發佈的3D V-Cache，將CPU的L3 cache裸晶疊在運算裸晶上方，將處理器的L3 cache大小增大至192MB，對儲存敏感延遲應用的性能提升。相比Intel，台積電這項技術的獨特之處在於裸晶間是以混合接合(hybrid bonding)的方式互連，而不是micro-bump，做到更小的打線間距，以及晶片之間數十倍通訊性能和效率提升。

這些方案也不直接依賴傳統的電晶體微縮方案。這裡實際上還有一個方面，即新材料的導入專家們沒有在論壇上多說，本文也略過不談。

1,000倍的性能提升

劉明談到，當電晶體微縮的空間沒有那麼大的時候，產業界傾向於採用新的策略來評價技術——「PPACt」——即Powe r(功耗)、Performance (性能)、Cost/Area-Time (成本/面積-時間)。t指的具體是time-to-market，理論上應該也屬於成本的一部分。

電晶體微縮方案失效以後，「多元化的技術變革，依然會讓IC性能得到進一步的提升。」劉明說，「根據預測，這些技術即使不再做尺寸微縮，也會讓IC的晶片性能做到500~1,000倍的提升，到2035年實現Zetta Flops的系統性能水準。且超算的發展還可以一如既往地前進；單裸晶儲存容量變得越來越大，IC依然會為產業發展提供基礎。」

500~1,000倍的預測來自DARPA，感覺有些過於樂觀。因為其中的不少技術存在比較大的邊際遞減效應，而且有更實際的工程問題待解決，比如運算裸晶疊層的散熱問題——即便業界對於這類工程問題的探討也始終在持續。

不過1,000倍的性能提升，的確說明摩爾定律的終結並不能代表第三次科技革命的終結，而且還有相當大的發展空間。尤其本文談的主要是AI晶片，而不是更具通用性的CPU。

矽光、記憶體內運算和神經型態運算

在非傳統發展路線上(以上內容都屬於半導體製造的常規思路)，WAIC晶片論壇上宋繼強和劉明都提到了一些頗具代表性的技術方向(雖然這可能與他們自己的業務方向或研究方向有很大的關係)。這些技術可能尚未大規模推廣，或者仍在商業化的極早期。

(1)近記憶體運算和記憶體內運算：處理器性能和效率如今面臨的瓶頸，很大程度並不在單純的運算階段，而在資料傳輸和儲存方面——這也是共識。所以提升資料的傳輸和存取效率，可能是提升整體系統性能時，一個非常靠譜的思路。

這兩年市場上的處理器產品用「近記憶體運算」(near-memory computing)思路的，應該不在少數。所謂的近記憶體運算，就是讓儲存(如cache、memory)單元更靠近運算單元。CPU的多層cache結構(L1、L2、L3)，以及電腦處理器cache、記憶體、硬碟這種多層儲存結構是常規。而「近記憶體運算」主要在於究竟有多「近」，cache記憶體有利於隱藏當代電腦架構中延遲和頻寬的局限性。

這兩年在近記憶體運算方面比較有代表性的，一是AMD——比如前文提到3D V-cache增大處理器的cache容量，還有其GPU不僅在裸晶內導入了Infinity Cache這種類似L3 cache的結構，也更早應用了HBM2記憶體方案。這些實踐都表明，儲存方面的革新的確能帶來性能的提升。

另外一個例子則是Graphcore的IPU處理器：IPU的特點之一是在裸晶內堆了相當多的cache資源，cache容量遠大於一般的GPU和AI晶片——也就避免了頻繁的訪問外部儲存資源的操作，極大提升頻寬、降低延遲和功耗。

近記憶體運算的本質仍然是馮紐曼架構(Von Neumann architecture)的延續。「在做處理的過程中，多層級的儲存結構，資料的搬運不僅僅在處理和儲存之間，還在不同的儲存層級之間。這樣頻繁的資料搬運帶來了頻寬延遲、功耗的問題。也就有了我們經常說的運算體系內的儲存牆的問題。」劉明說。

構建非馮(non-von Neumann)架構，把傳統的、以運算為中心的馮氏架構，變換一種新的運算範式。把部分運算力下推到儲存。這便是記憶體內運算(in-memory computing)的概念。

記憶體內運算的就現在看來還是比較新，也有稱其為「存算一體」。通常理解為在記憶體中嵌入演算法，儲存單元本身就有運算能力，理論上消除資料存取的延遲和功耗。記憶體內運算這個概念似乎這在資料爆炸時代格外醒目，畢竟可極大減少海量資料的移動操作。

其實記憶體內運算的概念都還沒有非常明確的定義。現階段它可能的內涵至少涉及到在儲記憶體內部，部分執行資料處理工作；主要應用於神經網路(因為非常契合神經網路的工作方式)，以及這類晶片具體的工作方法上，可能更傾向於神經型態運算(neuromorphic computing)。

對於AI晶片而言，記憶體內運算的確是很好的思路。一般的GPU和AI晶片執行AI負載時，有比較頻繁的資料存取操作，這對性能和功耗都有影響。不過記憶體內運算的具體實施方案，在市場上也是五花八門，早期比較具有代表性的Mythic導入了一種矩陣乘的儲存架構，用40nm嵌入式NOR，在儲記憶體內部執行運算，不過替換掉了數位週邊電路，改用類比的方式。在陣列內部進行模擬運算。這家公司之前得到過美國國防部的資金支援。

劉明列舉了近記憶體運算和記憶體內運算兩種方案的例子。其中，近記憶體運算的這個方案應該和AMD的3D V-cache比較類似，把儲存裸晶和運算裸晶疊起來。

劉明指出，「這是我們最近的一個工作，採用hybrid bonding的技術，與矽通孔(TSV)做比較，hybrid bonding功耗是0.8pJ/bit，而TSV是4pJ/bit。延遲方面，hybrid bonding只有0.5ns，而TSV方案是3ns。」台積電在3D堆疊方面的領先優勢其實也體現在hybrid bonding混合鍵合上，前文也提到了它具備更高的互連密度和效率。

另外這套方案還將DRAM刷新頻率提高了一倍，從64ms提高至128ms，以降低功耗。「應對刷新率變慢出現拖尾bit，我們引入RRAM TCAM索引這些tail bits」劉明說。

記憶體內運算方面，「傳統運算是用布林邏輯，一個4位元的乘法需要用到幾百個電晶體，這個過程中需要進行資料來回的移動。記憶體內運算是利用單一元件的歐姆定律來完成一次乘法，然後利用基爾霍夫定律完成列的累加。」劉明表示，「這對於今天深度學習的矩陣乘非常有利。它是原位的運算和儲存，沒有資料搬運。」這是記憶體內運算的常規思路。

「無論是基於SRAM，還是基於新型記憶體，相比近記憶體運算都有明顯優勢，」劉明認為。下圖是記憶體內運算和近記憶體運算，精準度、能效等方面的對比，記憶體內運算架構對於低精準度運算有價值。

下圖則總結了業內主要的一些記憶體內運算研究，在精確度和能效方面的對應關係。劉明表示，「需要高精確度、高運算力的情況下，近記憶體運算目前還是有優勢。不過記憶體內運算是更新的技術，這幾年的進步也非常快。」

去年阿里達摩院發佈2020年十大科技趨勢中，有一個就是存算一體突破AI算力瓶頸。不過記憶體內運算面臨的商用挑戰也一點都不小。記憶體內運算的通常思路都是類比電路的運算方式，這對記憶體、運算單元設計都需要做工程上的考量。與此同時這樣的晶片究竟由誰來造也是個問題：是記憶體廠商，還是數文書處理器廠商？(三星推過記憶體內運算晶片，三星、Intel垂直整合型企業似乎很適合做記憶體內運算…)

(2)神經型態運算：神經型態運算和記憶體內運算一樣，也是新興技術的熱門話題，這項技術有時也叫作compute in memory，可以認為它是記憶體內運算的某種發展方向。神經型態和一般神經網路AI晶片的差異是，這種結構更偏「類人腦」。

進行神經型態研究的企業現在也逐漸變得多起來，劉明也提到了AI晶片「最終的理想是在結構層次模仿腦，元件層次逼近腦，功能層次超越人腦」的「類腦運算」。Intel是比較早關注神經型態運算研究的企業之一。

傳說中的Intel Loihi就是比較典型存算一體的架構，「這片裸晶裡面包含128個小核心，每個核心用於模擬1,024個神經元的運算結構。」宋繼強說，「這樣一塊晶片大概可以類比13萬個神經元。我們做到的是把768個晶片再連起來，構成接近1億神經元的系統，讓學術界的夥伴去試用。」

「它和深度學習加速器相比，沒有任何浮點運算——就像人腦裡面沒有乘加器。所以其學習和訓練方法是採用一種名為spike neutral network的路線，功耗很低，也可以訓練出做視覺辨識、語言辨識和其他種類的模型。」宋繼強認為，不採用同步時脈，「刺激的時候就是一個非同步電動勢，只有工作部分耗電，功耗是現在深度學習加速晶片的千分之一。」

「而且未來我們可以對不同區域做劃分，比如這兒是視覺區、那兒是語言區、那兒是觸覺區，同時進行多模態訓練，互相之間產生關聯。這是現在的深度學習模型無法比擬的。」宋繼強說。這種神經型態運算晶片，似乎也是Intel在XPU方向上探索不同架構運算的方向之一。

(2)微型化矽光：這個技術方向可能在層級上更偏高了一些，不再晶片架構層級，不過仍然值得一提。去年Intel在Labs Day上特別談到了自己在矽光(Silicon Photonics)的一些技術進展。其實矽光技術在連接資料中心的交換機方面，已有應用了，發出資料時，連接埠處會有個收發器把電訊號轉為光訊號，透過光纖來傳輸資料，另一端光訊號再轉為電訊號。不過傳統的光收發器成本都比較高，內部元件數量大，尺寸也就比較大。

Intel在整合化的矽光(IIIV族monolithic的光學整合化方案)方面應該是商業化走在比較前列的，就是把光和電子相關的組成部分高度整合到晶片上，用IC製造技術。未來的光通訊不只是資料中心機架到機架之間，也可以下沉到板級——就跟現在傳統的電I/O一樣。電互連的主要問題是功耗太大，也就是所謂的I/O功耗牆，這是這類微型化矽光元件存在的重要價值。

這其中存在的技術挑戰還是比較多，如做資料的光訊號調變的調變器調變器，據說Intel的技術使其實現了1,000倍的縮小；還有在接收端需要有個探測器(detector)轉換光訊號，用所謂的全矽微環(micro-ring)結構，實現矽對光的檢測能力；波分複用技術實現頻寬倍增，以及把矽光和CMOS晶片做整合等。

Intel認為，把矽光模組與運算資源整合，就能打破必須帶更多I/O接腳做更大尺寸處理器的這種趨勢。矽光能夠實現的是更低的功耗、更大的頻寬、更小的接腳數量和尺寸。在跨處理器、跨伺服器節點之間的資料互動上，這類技術還是頗具前景，Intel此前說目標是實現每根光纖1Tbps的速率，並且能效在1pJ/bit，最遠距離1km，這在非本地傳輸上是很理想的數字。

還有軟體…

除了AI晶片本身，從整個生態的角度，包括AI感知到運算的整個鏈條上的其他組成部分，都有促成性能和效率提升的餘地。比如這兩年Nvidia從軟體層面，針對AI運算的中間層、庫做了大量最佳化。相同的底層硬體，透過軟體最佳化就能實現幾倍的性能提升。

宋繼強說，「我們發現軟體最佳化與否，在同一個硬體上可以達到百倍的性能差距。」這其中的餘量還是比較大。

在AI開發生態上，雖然Nvidia是最具發言權的；但從戰略角度來看，像Intel這種研發CPU、GPU、FPGA、ASIC，甚至還有神經型態運算處理器的企業而言，不同處理器統一開發生態可能更具前瞻性。Intel有個稱oneAPI的軟體平台，用一套API實現不同硬體性能埠的對接。這類策略對廠商的軟體框架構建能力是非常大的考驗——也極大程度關乎底層晶片的執行效率。

在摩爾定律放緩、電晶體尺寸微縮變慢甚至不縮小的前提下，處理器架構革新、異質整合與2.5D/3D封裝技術依然可以達成1,000倍的性能提升；而一些新的技術方向，包括近記憶體運算、記憶體內運算和微型矽光，能夠在資料訪存、傳輸方面產生新的價值；神經型態運算這種類腦運算方式，是實現AI運算的目標；軟體層面的最佳化，也能夠帶動AI性能的成倍增長。所以即便摩爾定律嚴重放緩，AI晶片的性能、效率提升在上面提到的這麼多方案加持下，終將在未來很長一段時間內持續飛越。這第三(四)次科技革命恐怕還很難停歇。

資料來源：https://www.eettaiwan.com/20210726nt61-ai-computing/?fbclid=IwAR3BaorLm9rL2s1ff6cNkL6Z7dK8Q96XulQPzuMQ_Yky9H_EmLsBpjBOsWg

Tags: 深度學習 cpu gpu

台灣物聯網實驗室 IOT Labs

About author

本專頁將不定時網羅搜集國內外與物聯網相關新聞及技術，並無條件與 IOT 從業人員或對物聯網有興趣的大眾分享，若有任何不足或建議之處，歡迎隨時留言，一起研究研究。^.^

深度學習 cpu gpu 在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

By 台灣物聯網實驗室 IOT Labs

2021-05-10 16:26:09 有 1 人按讚

邊緣AI 2026將成 IoT晶片發展核心

04:102021/05/02 工商時報集邦科技資深分析師曾伯楷

隨著智慧工廠、城市等場景對數據分析越發需要精準、即時且大量處理的需求，AI與IoT結合已是現在進行式。在AI晶片助益下，IoT邊緣與終端裝置可透過機器學習或深度學習等技術加值，同時帶出無延遲、低成本、高隱私等優勢，顯示出AI晶片的重要性。預估全球AI晶片產值至2025年將達720億美元。

與此同時，邊緣運算透過AI使終端設備於運行上更加智慧，不僅保有邊緣運算於延遲性、隱私性、連接性、功耗、成本等優勢，並進一步使系統具有主動性與智慧性。若以場景角度切入，邊緣AI相較傳統邊緣運算，其主要帶來的效益包括數據處理過濾和邊緣智慧分析，此也將成為兩技術持續結合的動能。

一、MCU、連接晶片、AI晶片為IoT晶片產業鏈三大關鍵零組件。　物聯網在傳統上多以感知層、網路層、系統層與應用層作為架構堆疊，主要經濟效益雖來自應用層的智慧情境發展，然感知層所需的產業鏈之上游零組件仍是支撐終端場景運作重要核心，其中又以微控制器（MCU）、連接晶片與AI晶片最關鍵。

MCU方面，建立在高效能、低功耗與高整合發展主軸下，IoT MCU現行從通用MCU演化成特定為IoT應用或場景所打造，如2021年3月STMicroelectronics推出新一代超低功耗微控制器STM32U5系列，可用於穿戴裝置與個人醫療設備；Silicon Labs同期推出PG22 32位元MCU，主打空間受限且須低功耗的工業應用、Renesas RA4M2 MCU著眼IoT邊緣運用等。

連接晶片方面，受物聯網設備連線技術與標準各異影響，通訊成物聯網晶片中相當重要的一環，從蜂巢式的4G、5G、LTE-M、NB-IoT，到非蜂巢式的LoRa、Sigfox、Wi-Fi、Wi-SUN等，從智慧城市、工廠、家庭至零售店面皆被廣泛運用，範圍擴及至太空，如2020年下旬聯發科與國際航海衛星通訊公司（Inmarsat）合作，成功以NB-IoT晶片完成全球首次5G物聯網高軌衛星資料傳輸測試。AI晶片方面，隨著智慧工廠、城市等場景對數據分析越發需要精準、即時且大量處理的需求，AI與IoT結合已是現在進行式。此外，Microsoft在其2021年3月舉辦的年度技術盛會Ignite 2021上指出，2022年邊緣運算市場規模將達到67.2億美元，與深度學習晶片市場相當吻合，亦提及市場預估至2025年全球深度學習晶片市場將有望達663億美元。同時，Microsoft認為至2026年全球AI晶片有3／4將為邊緣運算所用，顯示出IoT晶片於邊緣運算的發展將成未來廠商重要布局之一。

二、邊緣AI效益顯著，成長動能仰賴數據處理過濾、邊緣智慧分析。

首先，從邊緣運算定義來看，市場雖已談論數年但定義與類別始終未統一，原因是各廠商於邊緣託管工作的目的不盡相同。例如對電信商而言，初步處理數據的微型數據中心是其邊緣端，而對製造商來說邊緣裝置可能是生產線的感測器，此也造就邊緣運算的分類方式略有出入。另外，例如IBM有雲端邊緣、IoT邊緣與行動邊緣的類別，ARM多將邊緣視為雲端與終端間的伺服器等裝置，亦有個人邊緣、業務邊緣、多雲邊緣等類型。

其次，從邊緣運算類別來看，現行分類趨勢和研究方式尚有以數據產生源為核心，藉由設備與數據源的物理距離作為分類參考，並將其分為厚邊緣（Thick Edge）、薄邊緣（Thin Edge）與微邊緣（Micro Edge）。厚邊緣多用以表示處理高數據流量的計算資源，並配有高階CPU、GPU等，例如數據中心的數據儲存與分析；薄邊緣則包含網路設備、工業電腦等以整合數據為主要目的，除了配有中間處理器外，也不乏GPU、ASIC等AI晶片；微邊源因與數據源幾無距離，故常被歸類為生成數據的設備或感測器，計算資源雖較為匱乏，但也可因AI晶片發揮更大效益。

整體而言，邊緣運算透過AI使終端設備於運行上更加智慧，不僅保有邊緣運算於延遲性、隱私性、連接性、功耗、成本等優勢，並進一步使系統具有主動性與智慧性，在平台管理、工作量合併與分布式應用也更有彈性。若以場景角度切入，邊緣AI相較傳統邊緣運算，其主要帶來的效益提升包括數據處理過濾和邊緣智慧分析，此也將成為兩技術持續結合的動能。

數據處理與邊緣分析於過往邊緣運算時已可做到，並在AI加值下進一步提升效益。以前者而言，數據透過智慧邊緣計算資源可在邊緣處預先處理數據，且僅將相關資訊發送至雲端，從而減少數據傳輸和儲存成本；從邊緣分析效能來看，過往多數邊緣運算資源處理能力有限，運行功能時往往較為單一，而邊緣智慧分析透過AI晶片賦能，進而能執行更為繁複、低延遲與高數據吞吐量的作業。

三、全球大廠搶攻IoT晶片市場，中國加重AI晶片發展力道。

IoT晶片於邊緣運算所產生的效益，使其成為廠商重要策略布局領域，雲端大廠如Google、AWS等紛紛投身晶片自製；傳統晶片大廠如ARM最新產品即鎖定邊緣AI於攝影機和火車的辨識應用、Intel亦投資1.3億美元於十餘家新創AI晶片設計廠商，NXP Semiconductors、Silicon Labs、ST則陸續在其MCU或SoC添加邊緣AI功能。此外，新創企業Halio、EdgeQ、Graphcore皆以AI晶片為主打。整體而言，若以區域來看，歐美大廠聚焦加速AI運算效能，但最積極發展AI晶片產業的則屬產官學三方皆支持的?心，代表性廠商包含地平線、華為旗下海思等代表；台灣則由產業聯盟領頭與聯發科和耐能等重要廠商。

（一）中國產官學助力，2023年AI晶片產值估將逼近35億美元。

AI產業是中國發展重點之一，其輔助政策如2017年《新一代人工智能發展規劃》、《2019年促進人工智能和實體經濟深度融合》，至「十四五」與「新基建」，都將AI視為未來關鍵國家競爭力。各大廠也因此陸續跟進，如百度發布AI新基建版圖著眼智慧雲伺服器；阿里宣布未來至2023年將圍繞作業系統、晶片、網路等研發和建設，騰訊則聚焦區塊鏈、超算中心等領域。

產官學研加重AI的發展力道也反映於AI晶片上，ASIC（特殊應用基體電路）廠商比比皆是。其中，AI晶片布局物聯網領域的廠商眾多，包含瑞芯微、雲天勵飛、平頭哥半導體、全志科技等，主要面向雲端運算、行動通訊、物聯網與自動駕駛四大領域。其中，物聯網領域進一步聚焦於智慧家庭、智慧交通、智慧零售與智慧安防部分，執行語音、圖像、人臉與行為辨識等應用。若進一步聚焦於邊緣運算領域，則以地平線、寒武紀、華為海思、比特大陸、鯤雲科技等最為積極。整體而言，TrendForce預估，中國AI晶片市場有望從2019年13億美元增長至2023年近35億美元。

綜觀中國AI晶片發展，雖有中美貿易摩擦導致設計工具、製造封測等環節較受限制，且開發成本始終居高不下，然而，藉由產官合作以及中國內需市場需求動能，仍能有效支撐該產業成長。若以邊緣運算來看，鑒於AIoT市場持續茁壯，特定應用的ASIC將是重要發展趨勢，尤以汽車、城市與製造業來看，相關場景應用如人身語音行為辨識、人車流量辨識、機器視覺等需求皆相當明朗，預期也將成廠商中長期發展主軸。

（二）台灣人工智慧晶片聯盟積極整合，監控與機器人為邊緣AI應用兩大方向。

台灣廠商聯發科和耐能同樣結合邊緣運算與AI兩技術作策略布局，就整體產業而言，2019年由聯發科、聯詠、聯電、日月光、華碩、研揚等廠商共同組成的台灣人工智慧晶片聯盟（AITA）發展迄今已越趨成形，各關鍵技術委員會（SIG）亦訂定短中長期發展目標。

邊緣AI發展則由AI系統應用SIG推動，其第一階段至2020年著眼半通用AI晶片發展與智慧監控系統應用平台的裝置端推論，2021年則聚焦以裝置端學習系統參考設計，以及軟硬體發展平台的裝置端學習為主，並規劃在2023年能以多功能機器人為主體，發展多感知人工智慧和智慧機器人AI晶片發展平台。

換言之，藉由業界在智慧裝置、系統應用與AI晶片的串聯，短期至2022年都將是台灣邊緣AI大力發展階段，並朝智慧監控、多功能機器人深化，預期此也將帶動系統整合的凌群、博遠，終端設備的奇偶、晶睿碩，以及晶片設計的聯發科、瑞昱等邊緣AI商機；但相較中國廣大內需市場，台灣仍需藉由打造讓晶片廠和系統商充分整合的互補平台，以利降低晶片開發成本，並從其中尋求更多可供切入的大廠產業鏈。

附圖：2019～2023年中國AI晶片市場推估
AI於IOT流程主要著眼數據處理與分析之效
台灣人工智慧晶片聯盟系統應用SIG發展架構

資料來源：https://www.chinatimes.com/newspapers/20210502000153-260511?fbclid=IwAR0zlvUv8MKpcHrbgpa3xRAFaQXaxZuep9TCeZ-75myILNjuDV4SWEIdKZ8&chdtv

Tags: 深度學習 cpu gpu

台灣物聯網實驗室 IOT Labs

About author

深度學習 cpu gpu 在志祺七七 X 圖文不符 Youtube 的最佳解答

By 志祺七七 X 圖文不符

2019-05-03 19:20:36 有 22,199 人看過有 616 人喜歡

＃記得打開ＣＣ字幕　＃DIGI ＃除了幫忙面試人工智慧還可以做什麼？
✔︎ 訂閱志祺七七頻道： http://bit.ly/shasha77_subscribe
✔︎ 追蹤志祺の IG ：https://www.instagram.com/shasha77.daily
✔︎ 志祺七七の粉專：http://bit.ly/shasha77_fb

各節重點：
01:07 【人工智慧到底是什麼？】
01:50 【AI 的發展跟應用】
04:15 【未來充滿 AI 的生活】
04:56 【AI 這麼重要，那臺灣準備好了嗎？】
06:35 【我們的觀點】
07:40 提問TIME
07:54 掰比～別忘了訂閱

【製作團隊】

｜企劃：鯉鼬
｜腳本：鯉鼬
｜剪輯後製：Pookie
｜剪輯助理：絲繡＆夯吉
｜演出：志祺

——

【本集參考資料】

→招聘面試：你喜歡機器人還是真人做你的面試官？：https://bbc.in/2Wg0t3a
→了解人工智慧的第一本書：機器人和人工智慧能否取代人類？：https://bit.ly/2vA8jc0
→從人到人工智慧，破解AI革命的68個核心概念：實戰專家全圖解 × 人腦不被電腦淘汰的關鍵思考：https://bit.ly/2VAhJ64
→機器是如何學習與進步？人工智慧的核心技術與未來：https://bit.ly/2Ce1KQa
→An executive’s guide to AI：https://mck.co/2vZepWE
→陽光失了玻璃窗史上第一本人工智慧詩集：https://bit.ly/2IWsU2R
→國際人工智慧政策推動現況：https://bit.ly/2GZ4pA1
→懶人包_台灣 AI 行動計畫：https://2030.tw/2m3nBVr
→維基百科：人工智慧：https://bit.ly/2fUdaOV
→維基百科：人工智慧史：https://bit.ly/2vx2T1l
→臺灣智駕測試實驗室：https://bit.ly/2WqRgFn
→沙崙自駕車測試場正式揭幕盼無人載具產業鏈接軌國際：https://2030.tw/2lXfjyk
→無人載具科技創新實驗條例：https://bit.ly/2Wk6vzL
→張忠謀：AI激化貧富差距與失業：https://bit.ly/2Y0uhkB
→數位國家創新經濟(DIGI+)季刊第二期：AI、5G、8K—2020年東京奧運實現數位想像：https://2030.tw/2kAPB2a
→我國數位科技引領產業創新之現況與展望：以臺灣 AI 行動計畫為例：https://2030.tw/2knX0Sr
→台灣 AI 行動計畫簡報：https://2030.tw/2knX84n
→臺灣 AI 行動計畫(2018-2021 年)合訂本：https://2030.tw/AI_Taiwan
→「AI on Chip示範計畫籌備小組」啟動政院邀產官學研合作推升台灣AI晶片產業發展打造世界級人工智慧大腦：https://2030.tw/2lUi3MR
→台灣AI行動計畫—掌握契機，全面啟動產業AI化：https://2030.tw/2kinhBC
→賴揆：積極推動AI與產業需求接軌加速「5+2」產業創新：https://2030.tw/2knXfNl
→微軟在台成立AI研發中心賴揆：串連產業推動智慧國家：https://2030.tw/2kkX0Cx
→法國公布人工智能發展計畫：http://bit.ly/2VAkDaY
→【英國AI未來戰略大揭露】第一步先從資料共享打基礎，英國要成為全球AI實驗場域：http://bit.ly/2UTp8ZD
→SRB會議圓滿落幕林揆期許台灣智慧科技邁向全球第一：https://2030.tw/2lU8MEm
→智慧科技SRB登場首日聚焦產業利基與應用發展：https://2030.tw/2lXeC8c
→美國啟動AI大戰略的啟示：http://bit.ly/2GPkpTW
→數位國家·創新經濟發展方案(2017-2025 年)：https://2030.tw/DIGI_Taiwan
→中國大陸人工智慧產業發展現況研析及對臺灣之影響初探：http://bit.ly/2Lfew7P
→行政院數位國家創新經濟推動小組：http://bit.ly/2DLOB1o
→川普發起「美國人工智慧倡議」，五大原則確保美國維持 AI 發展優勢：http://bit.ly/2ITNLUB
→DIGI⁺ Taiwan：http://bit.ly/2VFDVM4
→AI Taiwan：http://bit.ly/2URGt5n
→台灣AI行動計畫—掌握契機，全面啟動產業AI化：http://bit.ly/2VABTNn
→「台灣人工智慧實驗室」啟動　科技部：AI元年從此刻開始！：http://bit.ly/2GXLiGH
→日本Yahoo策略長揭露，AI未來20年三大方向：http://bit.ly/2Wli35M
→英國AI發展現況-與世界各國比較：http://bit.ly/2Ja1Mgh
→從AI 100看全球AI商業化趨勢及發展：http://bit.ly/2VHOYo6
→AI時代將臨　各國策略及企業佈局特點分析：http://bit.ly/2IVfRyQ
→AI 專家與 AI Sophia 互動，杜奕瑾：見過雅婷嗎？：http://bit.ly/2UQvfOs
→台灣人工智慧實驗室：http://bit.ly/2WhZBL7
→雅婷AI Pianist－首張同名概念專輯〈Yating〉：http://bit.ly/2VHPjHo
→誠品網路書店：http://bit.ly/2JbOu2I
→Chihuahua or muffin? My search for the best computer vision API：http://bit.ly/2UW8ubR
→TOPBOTS Vision API Benchmarking：http://bit.ly/2Y3Jul8
→從人工智慧、機器學習到深度學習，你不容錯過的人工智慧簡史：http://bit.ly/2IXlPPM
→翻轉人類未來的 AI 科技：機器學習與深度學習：http://bit.ly/2Vc6cKS

＼每週７天，每天７點，每次７分鐘，和我們一起了解更多有趣的生活議題吧！／

🥁七七仔們如果想寄東西關懷七七團隊與志祺，傳送門如下：
106台北市大安區羅斯福路二段111號8樓

記得打開ＣＣ字幕 DIGI 除了幫忙面試人工智慧還可以做什麼

志祺七七 X 圖文不符

About author

Hiho 大家好，我是志祺。你現在收看的是志祺七七， 365 天不斷更的時事議題評論型頻道！在這裡，你會看到⋯⋯ ? // 即時議題・堅持每日發片的時事分析 // 遇到各種議題的時候，社會上總是充滿對立。常常不同立場之間，只剩下謾罵，無法互相溝通、討論。志祺七七，剖析不同立場觀點，能讓關心社會上重要議題、擔心立場極化的你，了解不同立場的不同想法。 ? // 多元議題・不同立場都說讚 ? // 人權、同婚、兩岸關係、中美貿易戰、能源議題、政治評論... 志祺七七不畏懼各種敏感議題，全盤呈現多樣化主題與觀點。同時，也獲得不同政治立場的一致好評！成為台灣唯一訪問過蔡英文、郭台銘、韓國瑜、朱立倫等一線政治人物的新世代時事評論員 ✨ 　　＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿＿ ?　探索世界・現在就開啟右上角鈴鐺訂閱志祺七七吧　? 　　￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣ ? 如果你想與志祺七七合作，歡迎寫信到：[email protected] 與我們聯繫【關於團隊】 YouTube ｜志祺七七｜是由台灣最強資訊設計團隊「圖文不符」所開發策劃，融鑄多年議題設計經驗，由團隊共同創辦人張志祺作為節目主持人，以時下最熱門的 YouTube 影音頻道形式做呈現。 FaceBook｜圖文不符｜推出台灣第一個製作時事議題懶人包的團隊，被譽為懶人包始祖，在 FB 上創造總瀏覽量超過三千萬人次。現正活躍於台灣在地文化採集與設計轉譯，期望將更多關於台灣、關於生活、關於土地的知識帶給社會大眾，期望透過設計帶來更好的內容環境。定期籌備大型議題策劃，喜歡精緻細膩的設計作品，閱讀台灣之美的你不可錯過。圖文不符 FB 專頁：www.facebook.com/simpleinfo Our Brand｜簡訊設計｜是我們成立的商業設計品牌，橫跨議題—設計—行銷，服務涵蓋社群內容經營、網站設計、動畫設計與整合行銷專案。曾獲 2 座德國紅點 Best of the Best 大獎。合作洽談請至：[email protected] - 贊助志祺七七，讓我們可以走得更久更遠：https://bit.ly/support-shasha77 如有遇到金流問題，麻煩請聯繫：[email protected]

社群媒體上有些相關的討論：

深度學習 cpu gpu 在 31 深度学习硬件：CPU 和GPU【动手学深度学习v2】 - YouTube 的推薦與評價

动手学深度学习 v2 - 从零开始介绍深度学习算法和代码实现课程主页：https://courses.d2l.ai/zh-v2/教材：https://zh-v2.d2l.ai/ ... <看更多>

深度學習 cpu gpu 在深度學習裝機指南：從GPU到顯示器，全套硬體最新推薦的推薦與評價

用戶更需要關注的是CPU和主機板組合支持同時運行的GPU數量。 CPU和PCIe. 人們對PCIe通道的執念近乎瘋狂！而實際上，它對深度學習性能幾乎沒有影響。 ... <看更多>

你可能也想看看

搜尋相關連結

#1. CPU vs. GPU：差異是什麼？ - Intel

瞭解CPU 與GPU 之間的差異、探索用途與架構優勢，以及兩者在加速深度學習與AI 方面扮演的角色。

#2. GPU運算與深度學習 - Leadtek

這種平行的特質與GPU 不謀而合，也會比用CPU 運算的訓練速度大為提升。深度學習就是大量及稠密的矩陣運算，如矩陣相乘、相加或向量內積，而在處理這樣大量的矩陣運算 ...

#3. GPU與CPU比較，GPU為什麼更適合深度學習？ - 每日頭條

GPU 能做什麼？關於圖形方面的以及大型矩陣運算，如機器學習算法等方面，GPU就能大顯身手。簡而言之，CPU擅長統領 ...

#4. CPU和GPU跑深度学习差别有多大？ - 知乎

Intel曾经用自己最强的CPU和NVIDIA的GPU做过性能对比。首先是ResNet-50的推理性能对比：. 可见，两块Xeon 9282（五十六核处理器）的性能是与一块V100非常接近的，但是 ...

#5. TensorFlow深度學習運用GPU與CPU執行效能比較

Tensorflow GPU版本:主要是透過NVIDIA提供的CUDA和CudNN，才能運用GPU執行深度學習訓練。如下圖: 上圖說明如下: Keras:是Tensorflow的高階API ...

#6. 深度學習用GPU好還是CPU好深度學習用GPU好還是CPU好？5

深度學習用GPU好還是CPU好深度學習用GPU好還是CPU好？5,1樓匿名使用者個人覺得，這個課題，可以通過實踐去驗證分別用cpu和gpu進行一下試驗， ...

#7. 深度學習與硬體加速 - 計中首頁

本文將針對深度學習應用常見的硬體和加速方式，包括CPU、GPU、和TPU進行介紹。前言隨著各式各樣的深度學習研究出爐，深度學習也廣泛地應用在人們的日常 ...

#8. 請問深度學習做數據預處理吃cpu還是gpu呀？ - GetIt01

打算用輕薄本在colab上學習，請問可行嗎？需要購置遊戲本嗎？實驗室有機子不過就是要排隊正常情況會在CPU上計算。現在Nvidia的DALI庫也可以做數據預處理的G...

#9. 深度學習筆記27 深度學習硬體CPU GPU_其它 - 程式人生

舉個例子，為什麼不能用CPU做深度學習？就拿Intel的i7來說，她每秒鐘的運算是0.15TFLOPS，而NVIDIA的TitanX是12TFLOPS，兩者差出80倍之多。

#10. GPU与CPU比较，GPU为什么更适合深度学习？ - 51CTO博客

GPU 与CPU比较，GPU为什么更适合深度学习？，一、CPU与GPU对比CPU是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强，计算能力则位于 ...

#11. 本機深度學習解決方案 - Nvidia

它具備超過800 顆CPU 的深度學習能力，在單一節點提供1 petaFLOPS 的人工智慧效能。DGX-1 採用8 張NVIDIA Tesla V100 GPU，使用混合式網狀架構NVIDIA NVLink 拓撲 ...

#12. 為什麼GPU比CPU在深度學習領域要更有用 - 櫻桃知識

Cloud Machine Learning管理平臺結合TensorFlow，其一大亮點是支持異構設備分佈式計算，它能夠在各個平臺上自動運行模型，從中國、單個CPU / GPU到成百上 ...

#13. AI & Big Data的演變趨勢(中)—運算能力篇 - TAcc+

GPU 和CPU的不同點在於，GPU能夠透過一種指令，同時運算其他筆類似的 ... NVIDA(英偉達)在發現GPU 的並行計算架構可以加速深度學習的訓練過程後，就抓 ...

#14. 深度學習用cpu訓練和用gpu訓練有什麼區別 - 迪克知識網

首先cpu主要用於序列運算，而gpu則是大規模並行運算，由於深度學習中樣本量巨大，引數量也很大，所以gpu的作用就是加速網路運算；.

#15. 硬體選擇-- Part 2 - iT 邦幫忙

那些年我們一起學過的深度學習系列第4 篇 ... 昨天已經提過了最重要的GPU 了，那今天會著重在其他的零件上，像是CPU 以及主機板的選擇條件等等。

#16. == #hivetalks #3 CPU、GPU，還有什麼U==. 這麼多年了 ...

在AI的時代，深度學習網絡需要不斷地計算，針對模型要做上億次的計算，確認對錯，把算法優化。如果用傳統CPU的架構，這種重複的計算是要花上很多時間才能有效果。

#17. 深度学习与硬件——CPU、GPU和TPU - CSDN博客

深度学习与CPU一般不用CPU训练深度学习模型。很多if…else出现时，CPU会比GPU快。如果需要加速，可以通过Cython访问C++。对于大部分硬件（GPU、

#18. 建議的GPU 執行個體- 深度學習AMI

Amazon EC2 G5g 執行個體具有ARM 型AWSGraviton2 處理器。 DLAMI 實例提供工具來監控和優化您的GPU 流程。如需監控GPU 進程的詳細資訊，請參GPU 監控 ...

#19. 5.6. GPU — 动手学深度学习2.0.0-beta0 documentation

如果已经安装了MXNet的CPU版本，我们需要先卸载它。例如，使用 pip uninstall mxnet 命令，然后根据你的CUDA版本安装相应的MXNet的GPU版本。

#20. 引進深度學習專用處理器終端裝置ML兼顧省電高效 - 新通訊

與CPU、GPU及DSP相比，機器學習處理器具有最佳化的設計，透過高效率的卷積、稀疏與壓縮技術，效率可大幅提升。以Arm針對機器學習工作負載推出的異質 ...

#21. CPU比GPU训练神经网络快十几倍，英特尔：别用矩阵运算了

在深度学习与神经网络领域，研究人员通常离不开GPU。得益于GPU 极高内存带宽和较多核心数，研究人员可以更快地获得模型训练的结果。与此同时， ...

#22. 模型训练太慢？显存不够？这个方法让你的GPU联手CPU

随着深度学习模型复杂度和数据集规模的增大，计算效率成为了不可忽视的问题。GPU 凭借强大的并行计算能力，成为深度学习加速的标配。然而，由于服务器的显存非常有限， ...

#23. AI深度學習-GPU 加速運算及CUDA語法與深度學習概論 - DIGI+ ...

NVIDIA 深度學習入門解密深度學習（Deep Learning）的技術採用了神經網路（Neural ... 加上現今CPU與GPU平行處理能力的大幅增長，更促進了目前深度學習被開發的腳步。

#24. Cloud 圖形處理器(GPU)

Cloud GPU. Google Cloud 的高效能GPU，適合執行機器學習、科學運算和3D 視覺化作業。 ... 加速許多深度學習模型的訓練程序，例如圖片分類、影片分析和自然語言處理。

#25. [深度應用]·主流深度學習硬件速度對比（CPU，GPU，TPU）

主流深度學習硬件速度對比（CPU，GPU，TPU） ... 歡迎大家關注小宋公眾號《極簡AI》帶你學深度學習：. 基於深度學習的理論學習與應用開發技術分享，筆者會 ...

#26. 人工智能GPU運算- Neousys 宸曜科技

GPU 加速運算通常與CPU 結合，以加速深度學習Deep Learning、分析和複雜的工程應用；現今，GPU 加速運算已經廣泛應用於各種產業領域，比如醫療造影成像、VR 科學模擬等 ...

#27. 深度學習GPU更勝CPU 出錯率與正確率皆具優勢 - DigiTimes

近期研究發現，在訓練深度學習系統時，相較於只用CPU，同時使用CPU與GPU不僅速度較快、過程中錯誤率較低，結果也更為精確。儘管研究只針對特定的深度 ...

#28. AI 運算，企業伺服器一定要用上超高階顯卡嗎？ - 公民報橘

... 或是深度學習與AI 運算，都需要靠高階圖形處理器（GPU）及強大運算力才 ... 機架式伺服器，內含2 個CPU，最高可支援3 片雙倍寬度GPU 卡，而在前述 ...

#29. 用GPU AI 就找AI-STACK

管、可共享、可橫向擴容的機器學習/深度學習運算環境資源. 池，為GPU運算資源帶來 ... 使用者可自行選擇資源規格，依需選取所需的GPU張數、CPU core數量、Memory數量。

#30. 十款主流AI處理器大比拚- 電子技術設計 - EDN Taiwan

在CES會展上搶盡風頭的Nvidia展示了DRIVE Xavier，這個AI晶片由一個特別定制的8核心CPU、一個全新的512核心Volta GPU、一個全新深度學習加速器、全新 ...

#31. 深度学习与硬件——CPU、GPU和TPU_beilizhang的博客

深度学习与CPU一般不用CPU训练深度学习模型。很多if…else出现时，CPU会比GPU快。如果需要加速，可以通过Cython访问C++。对于大部分硬件（GPU、

#32. 研究主題 - 國立成功大學資訊工程學系電腦架構及晶片設計實驗室

因此，本研究計畫的主要目的便是設計高效能及省電的深度學習電腦架構及電路，以 ... 此外隨著資訊科技的進步，各種運算設備如Intel CPU, ARM CPU, NVIDIA GPU 等種類 ...

#33. CPU利用率很低，且模型訓練速度很慢的問題總結與分析

在深度學習模型訓練過程中，在伺服器端或者本地pc端，輸入nvidia-smi來觀察顯示卡的GPU記憶體佔用率（Memory-Usage），顯示卡的GPU利用 ...

#34. 什麼是GPU(圖形處理器)? - GIGABYTE 技嘉科技

類似中央處理器（簡稱CPU），圖形處理器（簡稱GPU）是電腦或伺服器內的處理器， ... 說，應稱GPGPU），能處理各種不同運算工作，包括電腦視覺、機器學習與深度學習。

#35. 應用無所不在AI晶片戰況升溫- 電子工程專輯

像TPU、NNA或深度學習加速器(DLA)之類的ASIC，旨在以超高效率運作AI任務 ... 技術成分指的是，思考哪些應用應該運作在CPU、GPU或者其他處理器架構上。

#36. 硬件支持(CPU/GPU)

如果将NVIDIA CUDA®工具包安装在其默认位置，（C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1），则深度学习工具会自动找到所需内容。

#37. 嵌入式GPU和CPU的深度学习网络部署 - MATLAB EXPO

MATLAB深度学习框架. 访问数据. 设计+ 训练. 部署. ▫ 管理大型图像集. ▫ 自动化图像标签. ▫ 轻松访问模型. ▫ 使用GPU Coder自动生成代. 码到GPU和CPU：.

#38. GPU 邊緣運算| GPU Computing 解決方案| 凌華科技

隨著邊緣系統對反應能力與準確性的要求越來越高，CPU 與GPU 的組合逐漸成為主流， ... 企業如果打算盡可能地利用深度學習和AI來創新並提高生產力，應考慮使用最佳化的 ...

#39. 深度學習中GPU和顯存分析 - 人人焦點

顯存占用和GPU利用率是兩個不一樣的東西，顯卡是由GPU計算單元和顯存等組成的，顯存和GPU的關係有點類似於內存和CPU的關係。這裡推薦一個好用的小工具： ...

#40. （深度學習）GPU比CPU慢？快看這裡！ - w3c菜鳥教程

（深度學習）GPU比CPU慢？快看這裡！,gpu由於擅長矩陣運算，在深度學習尤其是計算機視覺方面得到了廣泛的應用。前幾天在我廢了好大勁在我的的電腦上 ...

#41. GPU与CPU比较，GPU为什么更适合深度学习？_IAlexanderI的专栏 ...

_IAlexanderI的专栏-程序员八零_cpu gpu 深度学习. 一、CPU与GPU对比. CPU是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强，计算能力则位于其次。

#42. CPU和GPU跑深度学习差别有多大？ - 程序员大本营

3. 在Ubuntu这种重启一下就会掉驱动的系统里搞深度学习，装CUDA和显卡驱动是必备技能，多装几次就熟练了。参考：. Intel的CPU和Nvidia的GPU能耗对比.

#43. 要如何確保目前執行Keras是使用電腦的GPU在跑? - Cupoy

各位專家好：. 想請問若是今天在跑深度學習的Keras的程式碼. 要如何才能知道目前是用電腦的GPU在跑還是CPU? 另外若是CPU在跑的話，要如何轉換成GPU.

#44. 深度学习中，CPU、GPU、NPU、FPGA如何发挥优势（转）

目前，除通用CPU外，作为硬件加速的GPU、NPU、FPGA等一些芯片处理器在深度学习的不同应用中发挥着各自的优势，但孰优孰劣?

#45. Supermicro 擴展GPU 系統產品組合加快AI、HPC 和雲端工作 ...

各種AI、渲染和VDI應用都能從這種CPU和GPU的平衡設計中受益。 ... 模式時負荷龐大的資料流量，滿足高度需求的AI／ML應用程式、深度學習訓練和推論。

#46. 深度学习训练如何更快些？GPU性能的I/O优化你试过吗？

这些操作可能包括将图像或文本转换为张量形式、或者调整图像大小等。数据传输至GPU内存—— 将处理后的数据从CPU内存复制到GPU内存。以下各节将对优化步骤 ...

#47. Supermicro 推通用GPU 系統，支援主要CPU - 奇摩新聞

Super Micro 今（22）日宣布推出通用GPU 伺服器，其可簡化大規模GPU 部署，可為資源節約型伺服器提供彈性，為人工智慧、深度學習和高效能運算提供模組 ...

#48. GPU 與CPU 比較，為什麼說GPU 更適合深度學習？ - 蘋果問答

CPU 與GPU核心對比示意圖由此不難看出，CPU完成單次運算的速度很快，但是由於一批次僅能算出數 ... 其實相比gpu，npu才是更加適合深度學習演算法的晶片.

#49. 深度學習之GPU、CPU、CUDA、Cudnn - 台部落

我們知道做深度學習離不開GPU，不過一直以來對GPU和CPU的差別，CUDA以及cuDNN都不是很瞭解，所以找了些資料整理下，希望不僅可以幫助自己理解， ...

#50. 深度學習,GPU,自動駕駛,Tensorflow,TensorRT,NVIDIA - CTIMES

NVIDIA 從傳統圖形處理器(GPU)設計起家，近年來將觸角廣泛深入至深度學習、人工智慧、ADAS等領域，NIVIDIA日前在矽谷舉辦GPU技術大會（GTC 2018）， ...

#51. Intel公布在AI上的硬體戰略，強調FPGA將比GPU更省電

趨勢,Intel,人工智慧,CPU,TPU,GPU,FPGA,TensorFlow (intel-fpga) ... 並且可藉由Intel 旗下深度學習編譯器nGraph 持續相容未來更多學習框架，同時透過 ...

#52. Intel釋出oneAPI 2022工具組擴展跨CPU、GPU架構應用功能

而在人工智慧效能方面，則可藉由Optimization for TensorFlow與Optimization for PyTorch提升深度學習框架效能，相比先前版本約可在加速效能提高10倍。

#53. 什麼是GPU運算？

GPU 運算是使用GPU（圖形處理單元）作為協處理器來加速CPU，以加快科學、分析、 ... 浮點運算能力強等特點，適用於視頻解碼、圖形渲染、深度學習、科學運算等應用場景。

#54. 如何使用GPU加速深度學習,為什麼GPU能加速深度學習

1樓：匿名使用者. gpu概念gpu英文全稱graphic processing unit，中文翻譯為“圖形處理器”。gpu是相對於cpu的一個概念，由於在現代的計算機中（特別是 ...

#55. 深度學習應該怎麼選擇gpu和cpu？ - 小貓問答

在當前2018年Q4的時間點來看，深度學習計算效能方面GPU相對CPU的加速比在擴大而不是縮小，所以大方向上來說能用GPU的就不要使用CPU通常造成GPU利用效率低的原因有1 ...

#56. GPU 運算與深度學習協同合作：慧與和NVIDIA | HPE 台灣

我們的解決方案以備受肯定的AI 專業知識、規模最大的深度學習生態系統以及AI 軟體框架，展現與眾不同的價值。我們透過有關NVIDIA GPU 加速應用程式的線上研討會和講師指導 ...

#57. 深度學習硬體這件事,gpu,cpu,fpga到底誰最合適 - 嘟油儂

用gpu和cpu伺服器深度學習,哪個合算? 3樓:ai撲社. gpu合算. cpu擅長邏輯控制,序列的運算。 gpu擅長的是大規模併發 ...

#58. 31 深度学习硬件：CPU 和GPU【动手学深度学习v2】 - YouTube

动手学深度学习 v2 - 从零开始介绍深度学习算法和代码实现课程主页：https://courses.d2l.ai/zh-v2/教材：https://zh-v2.d2l.ai/

#59. 初创公司推出新算法！让通用CPU深度学习速度比英伟达GPU ...

来源：EETOP编译整理当谈到人工智能/机器学习（AI/ML）时，开发人员通常会求助于基于GPU 的加速器，而不是通用处理器(CPU)。这些开发人员必须在专用 ...

#60. CPU和GPU跑深度學習差別有多大？ - 雪花台湾

希望有量化一點的數據說明，我裝cuda把ubuntu裝崩一次，已經有陰影了，想買騰訊伺服器最高級的CPU跑CNN。 Intel曾經用自己最強的CPU和NVIDIA的GPU做過 ...

#61. 深度学习笔记27 深度学习硬件CPU GPU - 爱和九九- 博客园

举个例子，为什么不能用CPU做深度学习？就拿Intel的i7来说，她每秒钟的运算是0.15TFLOPS，而NVIDIA的TitanX是12TFLOPS，两者差出80倍之多。

#62. 無敵級-10塊GPU/雙Xeon/並行存儲的深度學習工作站 - 壹讀

圖靈計算工作站GX650M是一款支持PCIe4.0接口的最高10塊GPU超算卡，配備雙Xeon3代可擴展處理器、海量並行存儲於一體、基於辦公靜音環境、具有 ...

#63. 使用iMAC的AMD GPU進行深度學習訓練

只要一行便能安裝完畢，可以看出PlaidML其實是一版修改過的Keras。 Setup. 安裝成功後，接著執行plaidml-setup便可以設定加速用的GPU/CPU，此設定資訊會存 ...

#64. 如何配置一台深度学习工作站?

CPU. 由于最近AMD 和Intel 频繁更新CPU，因此大家选择新款的CPU 比较好。 CPU 与GPU 的关系. CPU 瓶颈 ...

#65. 【平行運算】CUDA教學(一) 概念介紹 - 都會阿嬤

也正是因為GPU 的運算效能，才讓深度學習可以有今天的表現。因此了解GPU、CUDA、平行運算的技術是非常重要的！ 1. CUDA 平行加速工作流程. 在host(CPU) ...

#66. 为什么GPU 能加速深度学习 - lxkaka

接触过深度学习的同学都知道在训练和推理中使用GPU 能加速，但是相对于CPU 来说为什么GPU 能在深度学习中提供更快的处理速度？我把自己学习和总结 ...

#67. CPU比GPU訓練神經網路快十幾倍，英特爾：別用矩陣運算了

在深度學習與神經網路領域，研究人員通常離不開GPU。得益於GPU 極高記憶體頻寬和較多核心數，研究人員可以更快地獲得模型訓練的結果。與此同時，CPU 受限 ...

#68. [深度应用]·主流深度学习硬件速度对比（CPU，GPU，TPU）

[深度应用]·主流深度学习硬件速度对比（CPU，GPU，TPU）. 2021年08月26日00:35 · 阅读640. 关注 ...

#69. 深度學習用cpu訓練和用gpu訓練有什麼區別 - 燦爛人生

1、深度學習用cpu訓練和用gpu訓練的區別. （1）CPU主要用於序列運算；而GPU則是大規模並行運算。由於深度學習中樣本量巨大，引數量也很大，所以GPU的作用就是加速網路 ...

#70. 嵌入式GPU和CPU的深度学习网络部署Video - MathWorks

由于嵌入式设备与生俱来的资源限制，设计并部署深度学习或计算机视觉应用到嵌入式 CPU 或者 GPU 平台中，是一个颇具挑战的工作。基于MATLAB ® 的工作流程便于设计这类应用 ...

#71. 最全深度学习显卡推荐分析 - 享淘乐

最全深度学习显卡分析，集显可纯CPU或google colab，AMD显卡可通过ROCm学习Tensorflow及PyTorch，RX 580性价比超群，NVIDIA首选2070， ...

#72. CPU、GPU、NPU、FPGA 在深度学习中分别扮演什么角色

随着AI的广泛应用，深度学习已成为当前AI研究和运用的主流方式。面对海量数据的并行运算，AI对于算力的要求不断提升，对硬件的运算速度及功耗提出了新的挑战。

#73. 深度学习gpu比cpu快多少_帮助文档 - 华为云

安装深度学习框架. 述有错误，从pip源下载cpu版本需要显式指定tensorflow-cpu，如果不指定cpu，默认下载的是gpu版本。即官网的“Tensorflow==1.15：仅支持CPU 的版本” ...

#74. CPU和GPU跑深度學習差別有多大 - 知識的邊界

CPU 和GPU跑深度學習差別有多大,1樓匿名使用者gpu的架構與cpu很不一樣。首先，gpu並不具備多功能性。其次，與消費級cpu個位數的核心數目不同， ...

#75. 深度学习用cpu训练和用gpu训练有什么区别 - 百度知道

首先CPU主要用于串行运算，而GPU则是大规模并行运算，由于深度学习中样本量巨大，参数量也很大，所以GPU的作用就是加速网络运算；. 目前GPU运算主要集中在矩阵乘法和卷 ...

#76. CPU上运算比GPU还快？美国莱斯大学最新研究克服硬件障碍

这个名为SLIDE 的算法是第一个在CPU 上比GPU 更快地训练深度神经网络的算法。在奥斯汀召开的2020 机器学习系统会议MLSys上，来自莱斯大学的计算机科学家 ...

#77. 圖形處理器- 维基百科，自由的百科全书

相反，GPU是一种特殊类型的处理器，具有数百或数千个内核，经过优化，可并行运行大量计算。虽然GPU在游戏中以3D渲染而闻名，但它们对运行分析、深度学习和机器学习算法尤其 ...

#78. TPU为何能超越GPU，成为深度学习首选处理器？ - EDN China

很多读者可能分不清楚CPU、GPU 和TPU 之间的区别，因此Google Cloud 将在这篇文章中简要介绍它们之间的区别，并讨论为什么TPU 能加速深度学习。

#79. 芯片之争：CPU、GPU、DSP、NPU，到底哪个更适用于深度 ...

这多的深度学习处理器都有什么特点，又有什么优势和劣势呢？

#80. 比较GPU 和CPU 训练深度学习算法的效率 - 开发者头条

一、GPU、CPU加速效果比较. 近日，得到实验室GPU加速的深度学习服务器账号一枚。因为之前的模型训练过程实在太慢饱受模型调参，和模型调整的训练之苦。

#81. 主流深度学习硬件速度对比（CPU，GPU，TPU） - 腾讯云

主流深度学习硬件速度对比（CPU，GPU，TPU） ... 我们基于CNN实现Cifar10 数据集分类把这段相同的代码在不同主流深度学习进行测试，得到训练速度的对比数据 ...

#82. GPU与CPU比较，GPU为什么更适合深度学习?_数据 - 搜狐

而GPU相当于一个接受CPU调度的“拥有大量计算能力”的员工。 ... 深度学习是模拟人脑神经系统而建立的数学网络模型，这个模型的最大特点是，需要大数据 ...

#83. 【GPU程式設計系列之一】從深度學習選擇什麼樣的gpu來談談 ...

轉自：從深度學習在2012年大放異彩，gpu計算也走入了人們的視線之中 ... 複製引擎(圖中沒有表示出來)，它完成gpu記憶體和cpu記憶體之間的複製傳遞。

#84. cpu，gpu，dsp，npu到底哪個更適用於深度學習 - 第一問答網

cpu ，gpu，dsp，npu到底哪個更適用於深度學習,1樓匿名使用者gpucpudsp，npu沒用過。在並行性比較好的，gpu可以達到cpu的千倍，dsp並行性最差。

#85. GPU、CPU深度学习平台哪家强？有人做了一个基准测试研究

GPU 、TPU、CPU 都可以用于深度学习模型的训练，那么这几个平台各适用于哪种模型，又各有哪些瓶颈？在本文中，来自哈佛的研究者设计了一个用于深度学习 ...

#86. GTC PowerAI 深度學習加速平台與案例分享

NVLink 2.0 – Next generation of GPU/CPU bandwidth and integration. POWER9. PowerAccel. • Extreme Processor / Accelerator Bandwidth and Reduced Latency.

#87. Keras/Tensorflow選擇GPU/CPU執行 - IT人

首先，匯入os，再按照PCI_BUS_ID順序，從0開始排列GPU，import ... Python深度學習（使用Keras 回撥函式和TensorBoard 來檢查並監控深度學習模型）-- ...

#88. CPU、GPU、FPGA、ASIC等AI晶片特性及對比 - 今天頭條

目前，智能駕駛領域在處理深度學習AI算法方面，主要採用GPU、FPGA 等適合併行計算的通用晶片來實現加速。同時有部分晶片企業開始設計專門用於AI算法的ASIC ...

#89. GPU、CPU深度學習平臺哪家強？有人做了一個基準測試研究

ParaDnn 能夠爲全連接（FC）、卷積（CNN）和循環（RNN）神經網絡生成端到端的模型。研究者使用6 個實際模型對谷歌的雲TPU v2/v3、英偉達的V100 GPU、 ...

#90. 我們如何將Bert 擴展到可以在CPU 上單日處理超過10 億個請求

我們在2019 年初期開始使用了當時嶄新的Bert 深度學習模組來開發我們新時代的文字 ... 在我們的模型訓練過程中，GPU 的處理速度無疑地比CPU 快很多。

#91. 2012年令深度學習和NVIDIA股價火爆起來的真正關鍵 GPU

沒想到採用GPU 運算的深度學習能有如此殺傷力強大的效果，運算速度是CPU 的70 倍以上，終於讓深度學習真正火爆起來。2012 年之後的ImageNet 競賽，大家都 ...

#92. 深度学习中，CPU、GPU、NPU、FPGA如何发挥优势

目前，除通用CPU外，作为硬件加速的GPU、NPU、FPGA等一些芯片处理器在深度学习的不同应用中发挥着各自的优势，但孰优孰劣？

#93. 深度學習裝機指南：從GPU到顯示器，全套硬體最新推薦

用戶更需要關注的是CPU和主機板組合支持同時運行的GPU數量。 CPU和PCIe. 人們對PCIe通道的執念近乎瘋狂！而實際上，它對深度學習性能幾乎沒有影響。

#94. 听说用CPU就能做深度学习！再也不用攒钱买GPU了？ - 阿里云 ...

2017年，MIT教授Nir Shavit 在研究一个需要借助深度学习重建老鼠大脑图像的项目时，由于不知道如何在图形卡或GPU上编程，于是他选择了CPU。

#95. COMPUTER-22 中階人工智慧工作站- 立達軟體科技股份有限公司

硬體規格 · 1. GPU: NVIDIA RTX-A6000-48G (48 GB ECC 記憶體, 10752 CUDA 核心) 最多可支援兩張 · 2. CPU: AMD Ryzen 9 5950X, 3.4GHz, 16核心, 32執行緒 (PCI-E 4.0).

#96. Google和NVIDIA的人工智慧晶片之戰，到底在吵什麼？

Google近日發表報告，比較旗下深度學習運算晶片TPU與NVIDIA圖像處理 ... 把TPU跟Intel的Haswell CPU及NVIDIA Tesla K80 GPU這兩款CPU與GPU的效能表現 ...

#97. 莱斯大学&英特尔新算法证明CPU加速深度学习优于GPU！老黄 ...

研究人员称，SLIDE是第一个基于CPU的深度学习智能算法，并且，在具有大型全连接架构的行业级推荐数据集上，SLIDE训练深度神经网络的速度甚至超过了GPU ...

#98. GPU与深度学习| 码农家园

[cc] GPU与深度学习[/cc]一．为什么深度学习要使用CPU深度学习：深度学习是模拟人脑神经系统而建立的数学网络模型，最大特点是需要大数据来训练，也...

關於 深度學習 cpu gpu ，我們在網路上蒐集到這些相關的討論、資訊與評價

「深度學習 cpu gpu」的推薦目錄：

深度學習 cpu gpu 在 Inside 硬塞的網路趨勢觀察 Facebook 的最讚貼文

About author

深度學習 cpu gpu 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答

About author

深度學習 cpu gpu 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

About author

深度學習 cpu gpu 在 志祺七七 X 圖文不符 Youtube 的最佳解答

About author

你可能也想看看

搜尋相關連結

關於深度學習 cpu gpu ，我們在網路上蒐集到這些相關的討論、資訊與評價

深度學習 cpu gpu 在台灣物聯網實驗室 IOT Labs Facebook 的最佳解答

深度學習 cpu gpu 在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

深度學習 cpu gpu 在志祺七七 X 圖文不符 Youtube 的最佳解答