林遠打算連夜將改過的演算法部署到公司的虛擬機器上測試。
他今晚忙了一晚上就是為了處理九分甜奶茶店這樣異常情況對演算法的影響。處理的方法也不復雜——刪掉就行。
可刪掉這些異常資料,並非就只是像刪除電腦上某個檔案那麼簡單。而是需要對採集到的資料進行過濾。
專業點來說,就是需要給資料預處理增加一個過濾器。
如果把塞進ai模型訓練的資料比作是沙子,那這個過濾器就是一個篩子,它的作用是篩掉像九分甜奶茶店這類大石子。
九分甜奶茶店因為夏葉七點上班帶來的階段性不講理式的資料波動,顯然不應該被作為訓練資料塞給ai。倒不是這類資料ai就不能拿來訓練,而是需要考慮成本問題。也就是需要考慮算力問題。
要去擬合這種奇葩資料,所耗費的算力能效比顯然是不划算的。
算力的消耗並非是線性的,存在收益邊際的概念。
簡單來說,九分甜奶茶的資料就是個“刺頭”。考慮到算力系統眼下有限的算力,合理的做法還是先不去管這類刺頭。
這也是讓林遠方才詬病系統的原因。
這系統唯一的可以穩定獲得算力的方式,竟然是分解林遠自己週期產出的那幾毫升dna。
一想到這出,林遠就下意識腰疼。
所以,算力系統榮膺“最lo統”稱號,一點也不冤。
林遠甚至認為,【你丫乾脆把你自己面板上“系統”那兩個字擦了吧。】
吐槽歸吐槽,可事情還是得繼續做。
隨著算力系統的算力越發捉襟見肘,林遠不得不另闢蹊徑。
他不是沒想過用現實世界的算力裝置完全取代算力系統得了。叫你傲嬌,老子還不伺候了。
可是,他用公司的那臺a100算力卡試了後,發現現實世界的算力卡和算力系統的差別遠不只是“算力匯率”這一個因素而已。
或者說,算力匯率只是在名字裡面有個“匯率”而已,這個匯率是體現在系統和現實算力裝置,做同樣工作量時的算力消耗對比上。
就好比:做同樣的工作量,小a需要十分鐘,小b只需要一分鐘。那小a和小b的工作效率匯率就是1:10。可這是建立在小a和小b都會做這件事的前提下。
如果小a不會做這件事呢?那就不存在對比。因為小a最後根本就做不完。理論上二人的工作效率匯率就是1:無窮大。
對照到ai模型層面。
就是在沒有算力系統輔助的情況下,如果遇到模型構建層面本身的問題,那你別指望現實的算力裝置能改正的了。其訓練過程就像一條沒有眼睛的貪吃蛇,滿場亂轉。
其訓練產出的誤差忽大忽小,最後整個訓練就陷入了震盪之中。就像大a股受到一點風吹草動時候的樣子。
好在林遠還是想到了辦法--職責分離。
他將那些純粹計算的工作剝離出來,交給現實的算力裝置去計算。而在遇到卡點時,再將此時的中間態模型丟回給算力系統。
主打一個,算力系統啃硬骨頭,現實的算力裝置打順風局。
這也讓林遠增進了對算力系統的認知。
【人家的系統負責幹活,宿主只需要負責裝逼。而你,我的朋友,你無時無刻不在考驗我對你的活學活用。】——不同於林遠這邊的思想火花飛濺,另外一邊的夏葉聽著風林雨聲睡的香甜。
小房間空調指示燈的微弱燈光下,夏葉的臉上微微帶著笑意,嘴角掛著一條不窄的口水痕跡。
只是這張二人蝸居的小床,明顯過於擁擠。
。