520個水杯、每個杯子里不多不少450ML清水,由嘉賓挑選出其中一杯,經由挑戰者王昱珩觀察后放回原處。圖為王昱珩在辨認架旁觀察、記錄目標杯形態
在江蘇衛視《最強大腦》中,觀眾目睹了驚人的一幕:有一位“鬼才”王昱珩,他能用肉眼在520杯同質同量同批次的清水中,經過無碰觸地觀察,指認出某位嘉賓任意選中的其中一杯水。令人稱奇地是,這位鬼才用掃描儀般地眼睛迅速掠過一杯杯毫無差異的水,最快時秒掃4-5杯水。
王昱珩在“掃描式觀察”了部分水杯(并未全部觀察完520杯水)之后,成功鎖定了目標水杯并做指認
“水哥”王昱珩曾在其他電視節目中揭露過自己這項秘技的神奇原理:將包括水杯中的氣泡、塵埃、殘存的指紋(盡管輕微)在內的全部信息匯集到大腦中,并在腦中生成形象的畫面,比如一只鸚鵡或一張孩子的臉。這樣他就等于拿著一張照片尋找人臉目標。在他的腦中,兩杯水之間的“長相”差距甚至比兩張人臉的差異還要大。
這種神技的工作“機理”跟機器視覺系統非常相像。機器視覺檢測系統是采用CCD、CMOS工業相機將被檢測的目標轉換成圖像信號,傳送給專用的圖像處理系統,根據像素分布和亮度、顏色等信息,轉變成數字化信號,圖像處理系統對這些信號進行各種運算來抽取目標的特征,如面積、數量、位置、長度,再根據預設的允許度和其他條件輸出結果,包括尺寸、角度、個數、合格/不合格、有/無等,實現自動識別功能。
識別、檢測、定位、記錄——自動化圖像處理如今已走進工業生產中的許多領域,機器視覺也已為人們所熟知。其實,機器視覺不僅僅是工業相機,還包括網絡組件、觸發裝置和圖像處理軟件在內的整體視覺解決方案,也就是圖像收集,圖像分析,和圖像傳輸三個部分。
當然,在工業領域機器善長的工作在于檢測,也就是把一個個產品目標物與給定的標準進行比對,把不符合標準的目標物由執行設備進行剔除。由于現階段的機器視覺系統只能是逐個連續拍照并逐個傳輸至分析設備內,做不到直接鎖定,更無法具備人類所擁有的,將抽象的雜亂信息重構成畫面的想象力,因此若以“微觀辨水”的規則來場人機大戰的話,王昱珩必勝無疑(應該能為李世石報“一箭之仇”)。
如今,最牛的計算機在視覺識別上已經能夠做到各種各樣的事情,從識別網絡上的貓到在諸多的照片中識別特定的面孔。不過,雖然基本的圖像分類已經變得更加容易,但是當它涉及到從抽象的場景中提取意義和信息時,機器人仍然面臨著一系列新的問題,該類技術顯然還有很長的路要走。
是否可以依賴人工智能來搞定:將塵埃、氣泡和紋理想象成一張孩子的臉或一只鸚鵡,筆者不敢斷言。但類似“微觀辨水”——在千百甚至上萬個被檢測物體中快速精準地鎖定目標物,這樣的應用場景則是我們一直渴求的,其實也是機器視覺系統供應商所為之奮斗的目標。