第4章審題

林遠心道：‘這考核也太隨性了，鬼知道是哪個混蛋想出來的。’既然考核只有三四個小時，那考核必然有考察的重點。

林遠仔細思索了一小會兒。

對於ocr字元識別來說，採集資料特徵完全就是公式化的步驟。因為ocr識別不是什麼新的領域，那必然就不可能是考核的重點。所以，這部分程式碼，抄就完事兒了。

剩下的計算誤差和回饋誤差，也沒什麼可創新的。更準確來說，校方這整的是研究生入學考核，又不是招募國寶級科學家，難道還指望透過這次考核發現什麼天才？所以，這次考核的重點，必然是聚焦於考察考生平日裡的修行。

簡單來說，就是考察你平時都在幹些什麼。對計算機和ai到底感不感興趣啊。如果你感興趣，那你就肯定會經常寫寫程式碼。經常寫寫程式碼那自然就會很熟練。

而興趣是科研的首要條件。

雖然林遠此時並沒有對科研報以很大的興趣，但是他對透過走科研一途改變命運很有興趣。

嗯~~，也算是殊途同歸吧。

既然要考核平日修行，又不指望你水平能有多高。那自然也就不可能去考核計算誤差和回饋誤差這兩個步驟，因為這兩個步驟有太多現成的套路方案，體現不出人與人的差異性。

那就只剩最後一個步驟--訓練資料。

這個步驟綜合了線性代數、微積分、計算機程式設計能力、影象學，算是很綜合的一個步驟。

‘一定是這樣的。’林遠思慮既定，當即快速定位到原有專案工程中“訓練資料”部分的程式碼。他打算重構這部分程式碼，至於其它部分的嘛，就原封不動了。

林遠接著深入思考。

現今的ai訓練無非就是基於深度神經網路，但是總共也就才三個多小時，既要寫程式碼又要除錯出結果，根本就不可能把網路設計的有多深。

而在瞭解影象基本原理，掌握線性代數和微積分的基礎上，如果用現成的數學計算工具庫。比如：tensorflo者pytorch搭建一個三層左右的神經網路。三個小時時間夠好差不多。

至此，林遠恍然了。

‘審題結束。原來就是一道綜合考查題。出題人挺壞的，算是把應試的人徹底篩出去了。名校的研究生入學考試，果然不是光靠做題就行的。’

得益於往日裡對ocr識別專案的瞭解，林遠自信兩小時就能完成程式碼編寫和除錯。

可麻煩的是這臺t440沒法用gpu訓練。

現代的ai訓練用數學工具庫需要的硬體入門條件太高，林遠無奈只得轉而用cpu跑訓練。

他並未因此有什麼擔憂，因為訓練的過程是持續的。只要訓練出的結果誤差在不斷縮小，那即便時間上來不及，也能透過展示出來的潛力來讓老師們同意延長時間。

這就好比在爬山的時候，雖然還沒有看到雲遮霧繞的山頂，但透過腳底的感受就能清晰知道：此刻所處的地方並非是山頂，上面還有更高的地方。

由於這次考核的參試者每個人的筆記本效能都是不一樣的，因此林遠篤定：考核的重點決對不會是訓練時間的長短，而是最終訓練結果的準確率。

也就是說：這次考核不是考你爬的有多快，而是考你最後能爬的多高。

念及於此，林遠不自禁嘴角一笑，‘難怪剛剛那個張教授一直強調的是結果的準確率。’

他的推測和張教授起初公佈的評判結果完美匹配上了。

思慮既定，林遠隨即開始了忙碌的複製+黏貼。

。

第4章 審題