- 相關(guān)推薦
小議計(jì)算機(jī)視覺的應(yīng)用
Magic Leap年初獲阿里巴巴領(lǐng)投的7.9 億美元,一時(shí)風(fēng)光無二 。那么小編帶領(lǐng)大家從Magic Leap談?wù)動(dòng)?jì)算機(jī)視覺的應(yīng)用。
刷屏的視頻
Magic Leap的演示視頻里,帶上Magic Leap眼鏡,就能看到躍起的鯨魚或者看見天花板上漂浮的水母。
神秘的Magic Leap似乎遭遇了危機(jī),產(chǎn)品也至今沒有發(fā)布,但是背后的技術(shù)其實(shí)并不神秘。
Magic Leap管自己的產(chǎn)品不叫“增強(qiáng)現(xiàn)實(shí)”,而是叫“混合現(xiàn)實(shí)”(Mixed Reality,簡稱MR)。這一下子就讓人頭疼了,虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)就已經(jīng)夠亂的了,現(xiàn)在又搞出來了一個(gè)混合現(xiàn)實(shí)(MR)。這之間到底是什么關(guān)系?又有什么區(qū)別呢?
我們一個(gè)一個(gè)說
虛擬現(xiàn)實(shí),雖然名字里有個(gè)“現(xiàn)實(shí)”,但跟現(xiàn)實(shí)沒啥關(guān)系。用戶帶上頭套,直接就進(jìn)入了另一個(gè)世界,連自己的手都看不見。谷歌的Cardboard就是典型的虛擬現(xiàn)實(shí)。戴上以后,你看到的是埃菲爾鐵塔腳下,別人看到的是你戴了個(gè)硬紙殼兒四處轉(zhuǎn)腦袋。
虛擬現(xiàn)實(shí)有個(gè)缺點(diǎn),就是用戶不能戴著它四處晃悠。畢竟用戶看不見周圍的真實(shí)環(huán)境,四處走的話,容易撞到墻。
增強(qiáng)現(xiàn)實(shí),就跟現(xiàn)實(shí)有點(diǎn)關(guān)系了。用戶帶上眼鏡,原來能看見的現(xiàn)在還都能看見,只不過加了一層“平面投影”。比如你看見一個(gè)人,增強(qiáng)現(xiàn)實(shí)就能給這個(gè)人注上姓名、職位之類的信息?匆娨粋(gè)商店,增強(qiáng)現(xiàn)實(shí)可以給你注上商店名字、地址、是否正在營業(yè)。
最后就是這個(gè)Magic Leap提出的“混合現(xiàn)實(shí)”;旌犀F(xiàn)實(shí)直接把立體的虛擬物體投射到真實(shí)環(huán)境里。比如那個(gè)藏在桌子底下的機(jī)器人,它可以和真實(shí)的桌子互動(dòng)。如果“混合現(xiàn)實(shí)”做到極致,虛擬物體會(huì)和真實(shí)物體看起來一模一樣,完全可以以假亂真。
簡單來說,虛擬現(xiàn)實(shí)就是“看不見現(xiàn)實(shí)”,增強(qiáng)現(xiàn)實(shí)就是“加了標(biāo)注的現(xiàn)實(shí)”,混合現(xiàn)實(shí)就是“根本分不清是虛擬還是現(xiàn)實(shí)”。
虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、混合現(xiàn)實(shí)的區(qū)別
其實(shí)不少人認(rèn)為“混合現(xiàn)實(shí)”純屬概念炒作,和增強(qiáng)現(xiàn)實(shí)沒什么本質(zhì)的區(qū)別。盡管Magic Leap一再強(qiáng)調(diào)我們做的是“混合現(xiàn)實(shí)”,而大量媒體還是把它歸到了“增強(qiáng)現(xiàn)實(shí)”的范疇里。
Magic Leap目前并沒有透露任何技術(shù)細(xì)節(jié),不過他們一直在招聘計(jì)算機(jī)視覺的相關(guān)人才。計(jì)算機(jī)視覺雖然近幾年才火起來,但它卻是個(gè)古老的科技。它講起來并不艱深,只不過有些瑣碎。
什么是計(jì)算機(jī)視覺
所謂“計(jì)算機(jī)視覺”,就是教計(jì)算機(jī)“看懂”圖像或者影像。給一只貓的圖片,電腦能判斷出它是一只貓。給一個(gè)天安門廣場的照片,電腦能數(shù)出來廣場上一共有多少人。
任何一個(gè)圖像,都是三個(gè)二維數(shù)列(或者叫二維矩陣),比如下面這張圖,上邊是人看到的,下邊是計(jì)算機(jī)看到的。人很容易識(shí)別出來這是一只羊駝,但計(jì)算機(jī)看到的只有數(shù)字,根本沒什么規(guī)律。如何識(shí)別出它是不是羊駝,就需要計(jì)算機(jī)視覺來做了。
計(jì)算機(jī)視覺的一大困難,就是把平面圖像還原成立體物體。還是以上圖為例,人眼看起來,羊駝的頭比屁股離屏幕更近,但計(jì)算機(jī)看來,頭和屁股在同一層上。一個(gè)平面圖形,怎么區(qū)別遠(yuǎn)近呢?
計(jì)算機(jī)視覺有幾種思路
第一種就是像人類一樣,長出兩只眼睛。人左眼和右眼看到的圖像是不一樣的,大腦根據(jù)左右眼的圖像,還原出一個(gè)立體的場景。計(jì)算機(jī)也一樣,它可以用多個(gè)攝像頭捕捉圖像,根據(jù)圖像差異計(jì)算出物體的遠(yuǎn)近。Magic Leap就是用兩個(gè)裝有攝像頭的鏡片,通過數(shù)學(xué)方法還原3D環(huán)境。
不過體視的缺點(diǎn)是計(jì)算量太大,而且物體如果太遠(yuǎn),距離就量不準(zhǔn)了。這就是為什么微軟的HoloLens干脆搞出了一個(gè)“距離傳感器”。攝像頭只管看圖像,距離傳感器負(fù)責(zé)探測每個(gè)像素點(diǎn)的距離。
第二種就是看陰影。計(jì)算機(jī)可以根據(jù)圖片的明暗分布,判斷光源位置,進(jìn)而判斷誰在前誰在后。還是看那張羊駝的圖片,計(jì)算機(jī)可以很迅速地判斷光源在羊駝的正上方。既然光源在正上面,羊的后背亮,肚子暗,那么后背的這些像素和肚子的這些像素就不在同一層。
第三種就是靠攝像頭自己動(dòng)。帶上AR眼鏡,人不可避免會(huì)亂動(dòng)。人一動(dòng),攝像機(jī)就可以對(duì)單一物體進(jìn)行“跟拍”。下圖中,一個(gè)攝像機(jī)在三個(gè)位置拍出三張照片,那么根據(jù)這三張照片就能還原出這個(gè)物體的立體形態(tài)。
這些東西,學(xué)名叫做“計(jì)算機(jī)視覺的三維重建”。三維重建的方法還有很多,這里就不一一贅述。為什么要講三維重建,因?yàn)檫@可能是Magic Leap最大的特長。
增強(qiáng)現(xiàn)實(shí)只需要識(shí)別一下圖片,在眼鏡的平面上做一個(gè)標(biāo)注就可以了。而Magic Leap所謂的“混合現(xiàn)實(shí)”,需要把虛擬物體直接放到真實(shí)環(huán)境中。要想和真實(shí)環(huán)境接觸,必須把真實(shí)環(huán)境用計(jì)算機(jī)重建出來。這個(gè)過程,就需要上面講的各種“三維重建”方法了。
目前Magic Leap還并沒有把整個(gè)計(jì)算機(jī)整合到眼鏡上,他們的展示視頻是用一個(gè)裝了攝像頭的眼鏡,連接著電腦拍出來的。
Magic Leap的CEO羅尼·阿伯維茨(Rony Abovitz)并沒有透露具體何時(shí)把Magic Leap的眼鏡開發(fā)出來,不過阿伯維茨在接受WIRED采訪時(shí)說,發(fā)布之前,我們的產(chǎn)品必須做到完美無瑕。
這就不知道要等到哪天了。Facebook、谷歌、微軟等一系列公司都在AR領(lǐng)域進(jìn)行“生死競速”,加班加點(diǎn)地研發(fā)新產(chǎn)品。
面對(duì)當(dāng)前的這些不利因素,或許Magic Leap會(huì)像谷歌眼鏡一樣,經(jīng)歷了長時(shí)間的開發(fā),最后宣告失敗。也或許Magic Leap能像他們的名字一樣,一下子“神奇地躍過”了這些大公司,推出了一個(gè)“完美無瑕”的眼鏡,成為增強(qiáng)現(xiàn)實(shí)的霸主。
【小議計(jì)算機(jī)視覺的應(yīng)用】相關(guān)文章:
對(duì)于未來計(jì)算機(jī)視覺應(yīng)用的深思08-24
學(xué)好計(jì)算機(jī)應(yīng)用06-02
計(jì)算機(jī)應(yīng)用基礎(chǔ)教案06-19
計(jì)算機(jī)應(yīng)用專業(yè)簡介10-21
計(jì)算機(jī)基礎(chǔ)應(yīng)用試題08-11
色彩的視覺知識(shí)10-26