日韩无码一级视频,久久久久久人妻一区精品,欧美va亚洲va日韩va,国产高清在线精品一区二区app电影,天堂影院一区二区三区四区

AI為啥要用GPU計(jì)算,而不是CPU?

發(fā)布時(shí)間:2023-05-10 閱讀量:6783 來(lái)源: 面包板社區(qū) 發(fā)布人: Doris

一、前言



GPT的發(fā)布讓AI再次熱了起來(lái),與上次阿爾法狗不同的是,現(xiàn)在人人都可以跟聊上幾句,給它出出難題,還能調(diào)戲下。同期英偉達(dá)發(fā)布了針對(duì)AI領(lǐng)域的全新GPU H100,有的童鞋會(huì)疑惑,這個(gè)英偉達(dá)不是做顯卡打游戲的嗎,怎么就跟AI扯上關(guān)系了。其實(shí)英偉達(dá)的顯卡不是簡(jiǎn)單的與AI有關(guān)系,而是大有關(guān)系。


二、圖形處理與GPU


GPU的起源確實(shí)是基于圖形處理的需求。早期還沒有專門GPU時(shí),我們打游戲所有的邏輯處理都放在CPU執(zhí)行,CPU的處理能力越來(lái)越強(qiáng),但經(jīng)不

住游戲畫面增長(zhǎng)的更快,這就對(duì)圖形處理提出了更高的要求。


而圖形處理的本質(zhì)其實(shí)就是光影的計(jì)算,以下圖為例,在屏幕上畫一個(gè)圓非常簡(jiǎn)單。


image.png

但如過(guò)要讓這個(gè)圓“立體”起來(lái),其實(shí)就是要給它加上光影,像下圖這樣。

image.png


游戲畫面也是這樣的邏輯,一個(gè)畫面優(yōu)質(zhì)的游戲一定是有豐富的光影效果,而光影效果的本質(zhì)其實(shí)就是在虛擬的3維空間里,模擬光的照射。屏幕中的畫面其實(shí)就是特定角度下,由計(jì)算機(jī)計(jì)算出的,你應(yīng)該看到的光影效果。


image.png


需要特別注意的是,游戲中你會(huì)不停的移動(dòng),也就是所有光影的效果都需要實(shí)時(shí)的計(jì)算出來(lái)。假設(shè)屏幕分辨率為1920*1080,即2073600(207.36萬(wàn))個(gè)像素,游戲中每個(gè)像素都需要根據(jù)光影參數(shù)來(lái)計(jì)算顯示的顏色和明暗。假設(shè)一個(gè)常見的Inter I5 CPU主頻為3.2GHz,即最多每秒可做32億次運(yùn)算。但這里的一次運(yùn)算只是做了一次簡(jiǎn)單的二進(jìn)制加減法或數(shù)據(jù)讀取,一個(gè)像素的光影計(jì)算我們可以假設(shè)需要100次運(yùn)算,即CPU一秒約處理3200萬(wàn)次像素運(yùn)算,大概15張圖片,用專業(yè)點(diǎn)的說(shuō)法,這個(gè)游戲流暢度大概是每秒15幀的樣子。


那我們能不能繼續(xù)提升CPU的主頻呢,可以但是能提升的空間非常有限。所謂主頻本質(zhì)上其實(shí)就是一個(gè)節(jié)拍器,CPU執(zhí)行命令時(shí)其實(shí)是要按照一個(gè)特定的節(jié)拍來(lái)同步其各模塊的操作。可以想象CPU其實(shí)就是個(gè)工廠流水線,1+1=2的本質(zhì)其實(shí)至少包含了3個(gè)步驟:


1、將第一個(gè)1和第二個(gè)1從內(nèi)存提取到CPU
2、兩個(gè)1在CPU中相加得到2
3、將2從CPU存放到內(nèi)存


本質(zhì)上來(lái)說(shuō),所有的指令操作、圖形計(jì)算,最終到達(dá)CPU時(shí)都會(huì)被拆分成類似于1+1=2這樣的加法運(yùn)算。而每一個(gè)節(jié)拍又只能執(zhí)行其中的一步,如果我們可以將節(jié)拍打的更快一些,上述3個(gè)步驟執(zhí)行的也就越快,那我們就說(shuō)CPU的頻率越高。但再往下看,我們打節(jié)拍又受到了晶體管開關(guān)速度的限制。簡(jiǎn)單來(lái)說(shuō),節(jié)拍打的越快,晶體管的開關(guān)速度也就更高,這就直接導(dǎo)致了CPU的發(fā)熱問題。所以目前高性能CPU的頻率始終被限制在5GHz,可見從CPU頻率上已沒有太多空間可以提升。工程師們就想到“其實(shí)任何一個(gè)像素的計(jì)算與其他像素的計(jì)算結(jié)果關(guān)系不大”,那為啥不多整幾個(gè)計(jì)算核心“并行”計(jì)算呢,于是GPU就出現(xiàn)了。


一個(gè)典型的顯卡GTX1060,主頻是1.5GHz大概是Inter I5一半左右,但是它具備1280個(gè)計(jì)算核心。每個(gè)計(jì)算核心每秒可做15億次運(yùn)算,1280個(gè)核心每秒就是19200億次運(yùn)算,那一秒可以處理192億次像素計(jì)算,大概925張圖片,是CPU計(jì)算能力的61倍!但GPU的特性只能應(yīng)用于圖形計(jì)算這種可以并行的任務(wù),若是做普通的串行任務(wù)其速度遠(yuǎn)遠(yuǎn)不如CPU。


image.png

那我們能不能把CPU和GPU結(jié)合起來(lái),讓他頻率高,核心數(shù)量還多呢?還是不得行,上千個(gè)核心提升一點(diǎn)點(diǎn)的主頻就會(huì)帶來(lái)一些列問題,比如撒熱、抖動(dòng)、穩(wěn)定性等等。所以內(nèi)核數(shù)與頻率就是不可能三角,CPU與GPU都只能側(cè)重于其中一面,在不同的領(lǐng)域發(fā)揮作用。


AI的本質(zhì)其實(shí)與游戲差不多,也是大量的計(jì)算,只是計(jì)算的數(shù)據(jù)量會(huì)更龐大。


三、AI訓(xùn)練與矩陣計(jì)算


所謂訓(xùn)練AI,其實(shí)就是向神經(jīng)網(wǎng)絡(luò)中投喂大量的數(shù)據(jù)。比如我想要生成美女圖片,以前的做法是建設(shè)一個(gè)有足夠素材的庫(kù),讓美女的各個(gè)元素(手、腳、嘴巴、眼睛、身材等等)隨機(jī)組合在一起,結(jié)果可能差強(qiáng)人意。現(xiàn)在則只需要向神經(jīng)網(wǎng)絡(luò)里導(dǎo)入大量的美女圖片,當(dāng)你導(dǎo)入的圖片數(shù)量足夠多時(shí),神經(jīng)網(wǎng)絡(luò)也就“學(xué)會(huì)”了什么是美女,這樣它就能自動(dòng)產(chǎn)出美女。相對(duì)應(yīng)的,如果你一直輸入的是猛男,那它也只能生產(chǎn)猛男了。


我們知道其實(shí)圖片就是像素構(gòu)成的,比如下面這張圖的像素是8x8(簡(jiǎn)化示意),也就是64個(gè)像素點(diǎn),我們可以用1x64這樣的數(shù)組來(lái)表示它。

image.png


以下圖這樣的3層神經(jīng)網(wǎng)絡(luò)為例(原本是7個(gè)輸入,我們修改為64個(gè)輸入),所謂的數(shù)據(jù)“投喂”其實(shí)就是將圖片以64個(gè)數(shù)字表示,然后輸入到網(wǎng)絡(luò)中。

image.png
具體怎么輸入呢,其實(shí)就是以A0(圖片原始數(shù)據(jù))為基礎(chǔ),來(lái)計(jì)算A1,接著以A1為基礎(chǔ)計(jì)算A2、A3及最終結(jié)果A4。計(jì)算過(guò)程遵循以下公式:


A1 = W1*A0 + b1
A2 = W2*A1 + b2
A3 = W3*A2 + b3
A4 = W3*A3 + b4


其中W1\W2\W3\W4、A1\A2\A3\A4的數(shù)據(jù)量大小由每一層神經(jīng)元的個(gè)數(shù)決定,比如我們每一層設(shè)置為64個(gè)神經(jīng)元,則W1是一個(gè)64x64的數(shù)字矩陣,A1則是1x64的數(shù)字矩陣(與輸入一樣)。下圖是一個(gè)矩陣相乘的示意。

image.png


所以對(duì)神經(jīng)網(wǎng)絡(luò)的投喂問題就變成了A0與W1兩個(gè)數(shù)據(jù)矩陣的乘法問題,那么每一層神經(jīng)網(wǎng)絡(luò)的計(jì)算就需要至少4096次乘法計(jì)算,3層網(wǎng)絡(luò)就需要至少12288次乘法計(jì)算。這還只是64x64像素的圖片,如果是1280x1280的像素,就需要數(shù)百萬(wàn)次計(jì)算。


我們很容易就能想到也可以用GPU(顯卡)來(lái)執(zhí)行這些計(jì)算,因?yàn)槊恳粡垐D片的輸入都可以獨(dú)立運(yùn)行,那么我們給顯卡的每一個(gè)核都輸入一張圖片,那同時(shí)就可以有上千張圖片一起在計(jì)算,這樣的計(jì)算效率自然是杠杠的。


五、AI與算力


綜上所述,AI的發(fā)展離不開大量的算力資源,以GPT4來(lái)說(shuō),每1000字的算力大約需要0.06美元(約0.4元)。在小規(guī)模使用時(shí)可能還看不出成本的高低,當(dāng)AI成為基礎(chǔ)設(shè)施,比如搜索引擎,每天上億次的搜索頻率,成本可能也會(huì)去到上億的數(shù)量級(jí),這還只是其中一個(gè)應(yīng)用。所以未來(lái)AI的發(fā)展離不開算力,英偉達(dá)則是在顯卡的基礎(chǔ)上,專門針對(duì)AI開發(fā)了特殊的GPU以滿足算力需求,但可見的未來(lái)還是遠(yuǎn)遠(yuǎn)不夠的。


參考前幾年的數(shù)字挖礦,顯卡的價(jià)格將迎來(lái)一波上漲。除計(jì)算性能外,另外還有更大的成本就是電力。所以可以預(yù)見的是,國(guó)內(nèi)會(huì)出現(xiàn)一批專門做AI芯片設(shè)計(jì)的公司(參考比特大陸),還會(huì)有一批將數(shù)據(jù)中心建設(shè)到大西北以獲取更廉價(jià)電力的小團(tuán)隊(duì)(普通人的機(jī)會(huì)),這些還都是國(guó)家大力支持的。所以發(fā)財(cái)?shù)穆纷右呀?jīng)有了,諸位加油。

作者:布蘭姥爺

來(lái)源:面包板社區(qū)

https://mbb.eet-china.com/blog/3887969-441194.html

本文已獲授權(quán)




相關(guān)資訊
無(wú)源晶振YSX321SL應(yīng)用于高精度HUD平視顯示系統(tǒng)YXC3225

在現(xiàn)代汽車行業(yè)中,HUD平視顯示系統(tǒng)正日益成為駕駛員的得力助手,為駕駛員提供實(shí)時(shí)導(dǎo)航、車輛信息和警示等功能,使駕駛更加安全和便捷。在HUD平視顯示系統(tǒng)中,高精度的晶振是確保系統(tǒng)穩(wěn)定運(yùn)行的關(guān)鍵要素。YSX321SL是一款優(yōu)質(zhì)的3225無(wú)源晶振,擁有多項(xiàng)卓越特性,使其成為HUD平視顯示系統(tǒng)的首選。

擁有卓越性能的高精度超薄低功耗心電貼—YSX211SL

隨著醫(yī)療技術(shù)的進(jìn)步,心電監(jiān)護(hù)設(shè)備在日常生活和醫(yī)療領(lǐng)域中起到了至關(guān)重要的作用。而無(wú)源晶振 YSX211SL 作為一種先進(jìn)的心電貼產(chǎn)品,以其獨(dú)特的優(yōu)勢(shì)在市場(chǎng)上備受矚目。

可編程晶振選型應(yīng)該注意事項(xiàng)

對(duì)于可編程晶振選型的話,需要根據(jù)企業(yè)的需求選擇。在選擇可編程晶振的時(shí)候注重晶振外觀、晶振的頻率、晶振的輸出模式、晶振的型號(hào)等等,這些都是要注意的,尤其是晶振的頻率和晶振輸出模式以及晶振的型號(hào)都是需要注意的。

性能高的服務(wù)器—寬電壓有源晶振YSO110TR 25MHZ,多種精度選擇支持±10PPM—±30PPM

在現(xiàn)代科技發(fā)展中,服務(wù)器扮演著越來(lái)越重要的角色,為各種應(yīng)用提供強(qiáng)大的計(jì)算和數(shù)據(jù)存儲(chǔ)能力。而高品質(zhì)的服務(wù)器組件是確保服務(wù)器穩(wěn)定運(yùn)行的關(guān)鍵。YSO110TR寬電壓有源晶振,作為服務(wù)器的重要組成部分,具備多項(xiàng)優(yōu)勢(shì),成為業(yè)界必備的可靠之選。

差分晶振怎么測(cè)量

其實(shí)對(duì)于差分晶振怎么測(cè)量方式有很多種,主要還是要看自己選擇什么樣的方式了,因?yàn)檫x擇不同的測(cè)量方式步驟和操作方式是不同的。關(guān)于差分晶振怎么測(cè)量的方式,小揚(yáng)給大家詳細(xì)的分享一些吧!

岚皋县| 安庆市| 齐河县| 杂多县| 大丰市| 和顺县| 阿合奇县| 东乡| 霍山县| 衡水市| 南木林县| 万州区| 昭苏县| 延吉市| 抚州市| 开原市| 崇义县| 贵定县| 元朗区| 海城市| 长沙县| 衡阳市| 海阳市| 泸州市| 平武县| 岢岚县| 抚远县| 承德市| 溧水县| 新泰市| 寻乌县| 克拉玛依市| 德钦县| 阳城县| 阜阳市| 长治县| 密云县| 建瓯市| 元朗区| 武邑县| 应用必备|