林遠將所有問題歸納為兩點:計算、採集。
對於計算問題,林遠一直很算力系統的實際效能。這系統的1p算力到底約等於現實世界的多少算力。
以前他沒有專業算力裝置來測試,但現在因為測試任務,好團的算力裝置不就是現成的嘛。
好團的紫金分部這邊有一個h100和a100 gpu混搭的測試用算力平臺,林遠成功申請到了一塊a100的使用權。雖然a100比h100差了不少,但這畢竟是正兒八經的算力卡,妥妥能秒殺市面上的各種rtx和hd等電腦用顯示卡。
林遠先跑了次針對tf32資料的通用測試,a100對tf32的計算效能基本穩定在35t/s以上。自己的算力系統要到達同級別表現只需要將近10t/s的算力功率。
林遠據此總算標定了算力系統當前的算力效能:大約比現實世界的算力優秀三倍。也就是說,同樣是1t單位的算力,算力系統的相當於現實世界的3t。
也就是說:系統和現實世界的算力匯率是1比3。
林遠頓時有了種“老子是發達國家,整個現實世界都是第三世界”的感覺,因為老子的算力值錢啊。
可即便如此,林遠也對用算力系統去跑演算法最佳化也沒什麼信心。因為算力系統的算力匯率也就才是3倍,自己這1000p累積算力根本就不夠看的。
但是,哪怕是出於好奇心,試還是要試一下的。
林遠隨即就準備給算力系統載入一份採集好的資料。這份資料是一段時間內一大群騎手的真實配送資料。
林遠很快就遇到問題:特麼的他要怎麼錄入資料。這份資料太大了,足足有10個g,光靠自己眼睛錄入要到猴年馬月啊。
【系統,我都跟你說了,給我腦子裡弄個wifi,以後你就能和電子裝置通訊了。】
但是,系統並沒有搭理他。
直到林遠打算放棄的時候,系統這才主動彈了個提示。
【資料已載入完畢,是否開始訓練?】
‘什麼時候載入完畢的?’
林遠驚奇地在系統面板上看到了眼前伺服器上一模一樣的資料,這10多個g的資料就那麼幾下功夫就被系統讀取了,整個過程林遠都沒有察覺到。
【原來你特麼不光是隻能靠眼睛錄入資料。】
林遠忽然意識到:難道系統本身就和現實世界有聯絡?來不及多想,林遠帶著這份好奇心開始了系統的ai模型訓練。
他將算力功率設定在了50t/s,這是一個很安全不會導致他頭暈的功率值。
出乎林遠意料,系統僅僅用時一分鐘就完成了一次資料訓練。50t/s*60s=3000t,也就是才3p的算力消耗。
而林遠清楚知道,a100滿負荷跑同樣的一次資料訓練卻需要十分鐘。
已知,a100的滿負荷算力為:35t/s,則a100滿負荷執行十分鐘產生的算力是:35t/s*600=21000t=21p。
也就是說,完成同樣的工作量。算力系統只用了3p算力,而a100則用了21p。由於a100的算力值是現實世界的算力值,因此哪怕是用h100算力卡,其工作效率雖然會提升,但是消耗的總算力不會改變。
進而得出:訓練這份10g資料集,算力系統1p的算力相當於現實世界的7p。那算力匯率就變成1比7了。
這不就和之前的1比3對不上了嘛。
這系統雖然神奇,但目前為止林遠並沒有發現這系統有突破自然法則的跡象。
ai的模型訓練其實就是資料計算,既然是資料計算,那就不存在那會兒算的慢這會兒算的快的情況,因為林遠用的資料型別沒變,都是tf32。