學霸的算力系統

第12章 憧憬未來1

很無奈,林遠眼下還是隻得撿起了他黃色的“王冠”。他開啟了房門,然後保持了這個動作約摸十秒鐘。林遠終究是沒有邁出去。

‘我不能被一份通知書制約嘛,不就是一張紙嘛。有它沒它我都將是紫金航院的碩士研究生。不如。。。’

林遠坐到了電腦前,用搜尋引擎開始了檢索--圖片搜尋:紫金航校計算系研究生的入學通知書。

很快,藍底的碩士入學通知書圖片映入眼簾。

不愧是航校,連入學通知書都是藍天的顏色。

林遠忍不住幻想自己接到入學通知書的那一刻,想想就很激動。

但是,此時他先需要手搓一份。

暑假很快就要到了,家教的黃金季節就要來了。林遠已經腦補完成了自己的家教簡歷,就差這一張錄取通知書。

錄取通知書不是印鈔,林遠想來應該隨便找家廣告公司應該就能夠列印出來。不就是一張彩印的硬質卡片嘛。

問題就在於電子版的錄取通知書不好搞。

網上是可以找到很多相關的圖片,在那些圖片上用ps改個名字和照片也是很容易的事情。但問題是,如果要追求逼真的話,那錄取通知書的色彩以及尺寸還是得儘量準確。

但想從網上檢索到的圖片中獲取通知書各個部位的色彩色號,以及大小尺寸,這並非是一件簡單的事情。

首先,哪怕是同一張通知書,不同的人在不同的時候用不同的手機攝像頭,都會拍出不同的色號來。

其次,想從圖片裡面還原出通知書實際的尺寸,也是要費一點功夫的。

林遠隨後開啟了pycharm,他準備用python祭起爬蟲指令碼。

學好數理化,走遍天下都不怕。

你看,這個時候就用到了。

為了解決色號的問題,林遠打算用爬蟲指令碼來大批次爬取網上的紫金航校研究生錄取通知書圖片。然後綜合匯總之後做個篩選,再取個平均值。

篩選是必須的。因為這年頭拍照用美顏太普遍了,鬼知道會把實物的色號改的如何面目全非。

至於什麼是“色號”。顧名思義:就是標識每一種色彩的編號,相當於顏色的身份證。

由於計算機世界的一切資料都是數字,那顏色自然也就不例外。最常見的顏色定義格式就是rgb三基色,r、g、b紅綠藍三基色可以調製出各種不同顏色。

當然,除此之外還有cmyk、hsb等等。但在計算機世界中,還是rgb格式使用更廣。

這個級別的爬蟲並不難寫。林遠只需要爬取某度搜尋引擎的搜尋結果,然後從中摘取出圖片,再透過ocr字元識別過濾一遍,把帶有紫金航校研究生錄取通知書字樣的圖片挑選出來。

接著來一個目標識別--將圖片中的錄取通知書所在區域摳圖摳出來。然後再做一份數字影象直方圖,就是把錄取通知書圖片中每種色號做個統計。

接下去再對統計結果做一個排布。就好比跳水比賽的打分,去掉最高分和最低分,取箇中間值即可。

這種方式相對簡單,其實就是篩選出中間值。

但是這個過程還是涉及了一些計算機和數字影象處理方面的內容,好在如今這個年代得益於摩爾定律的強大推動,計算效能的天花板被一再突破,電腦科學與ai技術發展飛快。

20年前在大型實驗室裡才能嘗試的影象目標識別,如今僅憑一臺古董級別的t440就能執行。

當然,這並非是影象目標識別這件事情簡單,而是在無數的人開源貢獻之下,讓這項技術使用起來變得簡單。

📖
目錄
⚙️
設定
🌙
夜間
閱讀設定
背景主題
字型大小
A-
18px
A+
夜間模式
首頁 書架 閱讀記錄 書籍資訊