學霸的算力系統

第4章 審題

林遠心道:‘這考核也太隨性了,鬼知道是哪個混蛋想出來的。’既然考核只有三四個小時,那考核必然有考察的重點。

林遠仔細思索了一小會兒。

對於ocr字元識別來說,採集資料特徵完全就是公式化的步驟。因為ocr識別不是什麼新的領域,那必然就不可能是考核的重點。所以,這部分程式碼,抄就完事兒了。

剩下的計算誤差和回饋誤差,也沒什麼可創新的。更準確來說,校方這整的是研究生入學考核,又不是招募國寶級科學家,難道還指望透過這次考核發現什麼天才?所以,這次考核的重點,必然是聚焦於考察考生平日裡的修行。

簡單來說,就是考察你平時都在幹些什麼。對計算機和ai到底感不感興趣啊。如果你感興趣,那你就肯定會經常寫寫程式碼。經常寫寫程式碼那自然就會很熟練。

而興趣是科研的首要條件。

雖然林遠此時並沒有對科研報以很大的興趣,但是他對透過走科研一途改變命運很有興趣。

嗯~~,也算是殊途同歸吧。

既然要考核平日修行,又不指望你水平能有多高。那自然也就不可能去考核計算誤差和回饋誤差這兩個步驟,因為這兩個步驟有太多現成的套路方案,體現不出人與人的差異性。

那就只剩最後一個步驟--訓練資料。

這個步驟綜合了線性代數、微積分、計算機程式設計能力、影象學,算是很綜合的一個步驟。

‘一定是這樣的。’林遠思慮既定,當即快速定位到原有專案工程中“訓練資料”部分的程式碼。他打算重構這部分程式碼,至於其它部分的嘛,就原封不動了。

林遠接著深入思考。

現今的ai訓練無非就是基於深度神經網路,但是總共也就才三個多小時,既要寫程式碼又要除錯出結果,根本就不可能把網路設計的有多深。

而在瞭解影象基本原理,掌握線性代數和微積分的基礎上,如果用現成的數學計算工具庫。比如:tensorflo者pytorch搭建一個三層左右的神經網路。三個小時時間夠好差不多。

至此,林遠恍然了。

‘審題結束。原來就是一道綜合考查題。出題人挺壞的,算是把應試的人徹底篩出去了。名校的研究生入學考試,果然不是光靠做題就行的。’

得益於往日裡對ocr識別專案的瞭解,林遠自信兩小時就能完成程式碼編寫和除錯。

可麻煩的是這臺t440沒法用gpu訓練。

現代的ai訓練用數學工具庫需要的硬體入門條件太高,林遠無奈只得轉而用cpu跑訓練。

他並未因此有什麼擔憂,因為訓練的過程是持續的。只要訓練出的結果誤差在不斷縮小,那即便時間上來不及,也能透過展示出來的潛力來讓老師們同意延長時間。

這就好比在爬山的時候,雖然還沒有看到雲遮霧繞的山頂,但透過腳底的感受就能清晰知道:此刻所處的地方並非是山頂,上面還有更高的地方。

由於這次考核的參試者每個人的筆記本效能都是不一樣的,因此林遠篤定:考核的重點決對不會是訓練時間的長短,而是最終訓練結果的準確率。

也就是說:這次考核不是考你爬的有多快,而是考你最後能爬的多高。

念及於此,林遠不自禁嘴角一笑,‘難怪剛剛那個張教授一直強調的是結果的準確率。’

他的推測和張教授起初公佈的評判結果完美匹配上了。

思慮既定,林遠隨即開始了忙碌的複製+黏貼。

📖
目錄
⚙️
設定
🌙
夜間
閱讀設定
背景主題
字型大小
A-
18px
A+
夜間模式
首頁 書架 閱讀記錄 書籍資訊