這或許就是緣分吧。林遠很快就透過ds在github上的開源專案,給對方的賬號發了封站內信過去。雖然作為開源專案,林遠是可以直接提交專案貢獻請求的。
可是呢,林遠還是想低調一點。
一旦公開提交請求,那以後所有人都能看到某個賬號給ds的大語言模型提交了關鍵程式碼更新,萬一有一天有人扒出來這個提交更新的賬號就是林遠的。
之後要是好巧不巧,林遠做空nvidia的操作又被人發現了,然後兩廂關聯,林遠不就成了處心積慮做空nvidia了嘛。
雖然林遠是想透過做空nvidia來反擊musk出口惡氣,可事情做歸做,留不留痕跡卻是另外一回事。一旦留下了明顯的痕跡,那麻煩事可就一堆。
成功的做空和操縱股價之間的界限鬼知道是如何區分的。
因此林遠只是發了個私信,而且還是用臨時申請的賬號發的。
私信中林遠給對方提供了一個關鍵思路,一個基於推理演進的關鍵思路。
根據算力系統對眼下各大ai大語言模型的深度掃描,系統給出的評語是:訓練過程中過於強調算力的重要性,從而忽略了推理的價值。
用人話說就是:不過腦子就知道蠻幹。
林遠對此的理解是,就好比做數學題,你知道加減乘除的規律之後,就可以在此基礎上做任意多位數的加減乘除運算,這就是推理的過程。
而與之相對的,就是硬湊答案。
當然,算力系統實際所指出的眼下市面上的ai大語言模型的缺陷自然不會是如此淺薄的拙劣。可是道理大差不差。
於是,林遠就將算力系統的見解經過加工之後給對方發了過去。
他當然不至於僅僅發一段不著邊際的有關強調推理過程的話,而是針對ds-v2版本程式碼中的某一組神經網路進行了針對性最佳化。
林遠將這一組神經網路作為參照物,以此為根基修改程式碼,用例項詮釋了算力系統有關強調推理的論點。
經過修改之後,這組神經網路就附帶了動態自動可調節屬性。以便在回答實際問題的時候,會從邏輯鏈入手,向使用者展示模型自身的推理過程。
這一點是至關重要的,因為如果ai反饋的推理過程都是錯的,那你直接就可以中斷ai的回答,而不需要等ai回答完畢之後透過閱讀答案再去判斷。
這種推理過程猶如是答案的綱領,讓人類能感知到ai的推理細節,從而實現雙向奔赴。
因為ai所希望你問問題的方式,經常並非是人類實際的提問方式。再者人類的語言體系中本就存在一個隨著談話深入不停深化主題的概念,也就是說,人與人之間的談話是需要聯絡上下文的。
這在日常對話中就很好理解,兩個陌生人對話的前期總是免不了建立共同語境的過程。既然如此,那人與ai的對話也是如此。
強調推理,就是強調讓ai抓緊這種推理邏輯鏈。
。