Apple Vision Pro的工作原理是什么呢?

自從Vision Pro發(fā)布后,掀起了一波熱潮,已經(jīng)成為蘋果首款頭戴式AR設(shè)備,這款產(chǎn)品有可能加速新一代操作系統(tǒng)的演進,國內(nèi)AR的步伐也在推進,那么Apple Vision Pro的工作原理是什么呢?接下來集英科技小編就給大家簡單的介紹一下。

Apple Vision Pro

一、什么是VR、AR、MR?

VR(Virtual Reality)虛擬現(xiàn)實,是模擬生成三維空間虛擬環(huán)境,并為用戶提供多種逼真的感官體驗(包括視覺、聽覺、觸覺等)。

AR(Augmented Reality)增強現(xiàn)實,是實時計算攝像機的位置及姿態(tài),并在攝像機捕捉到的真實場景畫面上疊加相應(yīng)虛擬信息。

MR(Mixed Reality)混合現(xiàn)實,MR與AR相近,都是一半現(xiàn)實一半虛擬,如果虛擬信息只能簡單疊加在現(xiàn)實事物上,那就是增強現(xiàn)實。而混合現(xiàn)實則需要在一個能與現(xiàn)實世界各事物相互交互的環(huán)境中。

雖然網(wǎng)上有爭論,Vision Pro到底是AR還是MR,但蘋果從來不會拉低自己身份,直接跳過VR、AR、MR的概念,將自己重新定義為“空間計算設(shè)備”!不過小編還是傾向于認為Vision Pro是一款A(yù)R產(chǎn)品。

二、AR的系統(tǒng)組成

一個完整的AR系統(tǒng)是由一組硬件設(shè)備與相關(guān)的軟件系統(tǒng)共同實現(xiàn)的。從硬件結(jié)構(gòu)上來看,Vision Pro屬于頭盔顯示式AR系統(tǒng),其由三部分組成:真實環(huán)境顯示通道、虛擬環(huán)境顯示通道及圖像融合顯示通道。

這三個通道需要攝像頭和傳感器(如:IMU傳感器、GPS傳感器等)來實現(xiàn),將真實和虛擬場景完美整合并呈現(xiàn)到人眼前,且能進行交互。

三、OST與VST

OST(Optical See-Through)光學(xué)透視技術(shù)

搭配OST的光學(xué)透視式頭盔顯示器通過在使用者眼睛前方放置光學(xué)合成器來工作。這個光學(xué)合成器是半透明材質(zhì)的,使用者可以直接看到真實的環(huán)境景物。同時,它又具有一定的反射作用,可以將由頭盔中的投影儀所產(chǎn)生的虛擬物體反射到使用者的眼睛里。下圖展示了光學(xué)透視式頭盔顯示器的原理。

目前的大部分光學(xué)透視式頭盔顯示器都會減少來自真實世界的光線,所以它們在斷電的時候就像一副太陽眼鏡一樣。

VST(Video See-Through)視頻透視技術(shù)

與光學(xué)透視式頭盔顯示器相反,視頻透視式頭盔顯示器由一個封閉式的頭盔和一兩個放置在頭盔上的攝像機組成。

由攝像機給使用者提供真實環(huán)境的圖像。虛擬物體的圖像由場景生成設(shè)備產(chǎn)生,然后和由攝像機拍攝的圖像合成起來。合成后的視頻則由封閉式頭盔中放置在使用者眼睛前方的小型顯示器顯示給使用者。下圖表示視頻透視式頭盔顯示器的原理。

既然OST和VST并存,就肯定都有自己的優(yōu)缺點:

OST的優(yōu)勢是低成本和輕量化,因為它是通過半透明材料直接看到現(xiàn)實世界,不需要對現(xiàn)實世界做重建處理,因此對算力、對傳感器等諸多東西都會降低要求;但缺點就是不能隨意改造現(xiàn)實世界,虛實融合也不夠好。

VST的優(yōu)勢是更好的沉浸體驗,它是利用攝像頭來捕捉真實世界的影像,然后投射在屏幕上,用戶看到的一切都是虛擬設(shè)備想讓他看到的樣子,因此虛實融合上肯定更好,能讓用戶有更好的沉浸體驗;缺點自然就是對硬件配置要求高,且較重。

蘋果的Vision Pro就是走的VST路線,因此2.5萬元的價格和一斤多(600多g)的重量,是不可忽視的缺點。

四、三維注冊技術(shù)

OST和VST讓我們理解了為什么現(xiàn)實世界和虛擬世界能融合,但融合后如何讓用戶的沉浸體驗達到最優(yōu),則需要解決三個一致性問題:

1、幾何一致性:是解決虛擬對象和真實場景在空間中的一致性,這樣看到的混合景象才會協(xié)調(diào)和統(tǒng)一;

2、光照一致性:是虛實融合場景真實感繪制的要求;

3、時間一致性:是實時交互的要求。

解決上述一致性問題的最核心技術(shù)是三維注冊技術(shù)。它是實時計算出相機與真實環(huán)境(世界坐標系)的相對位姿(包括平移和旋轉(zhuǎn)),并將需要疊加的虛擬信息依據(jù)相對位姿實時繪制在屏幕中,完成三維注冊過程。

三位注冊技術(shù)的性能主要體現(xiàn)在實時性和魯棒性。實時性要求注冊算法有足夠快的速度,以免造成疊加延遲、掉幀;魯棒性要求注冊算法足夠健壯,可以應(yīng)對光照變化、圖像模糊、局部遮擋等非正常狀況。

而三維注冊方式大致分為3種類型:基于硬件傳感器的跟蹤注冊、基于二維標識的跟蹤注冊以及基于自然特征的無標識跟蹤注冊。

1、基于硬件傳感器的跟蹤注冊:主要依靠全球定位系統(tǒng)(global positioning system,GPS)、陀螺儀、重力加速計、位置跟蹤器等硬件設(shè)備直接獲得攝像機的位置和姿態(tài)。這種方式計算量最小,實現(xiàn)最容易,不需要進行圖像處理、特征提取與匹配等復(fù)雜計算。但此類方法精度有限且受環(huán)境影響較大,注冊誤差會隨時間增長而累積,魯棒性容易受到遮擋、距離、環(huán)境條件的影響,主要適用于大尺寸、敞開環(huán)境下的三維跟蹤注冊。

2、基于二維標識的跟蹤注冊:是指在場景中事先放入帶有特定圖案的平面標識物體,當其出現(xiàn)在攝像機捕捉到的圖像中時,利用圖像處理相關(guān)算法對其進行識別與檢測,并以此推算攝像機的位姿,達到對三維場景進行注冊的目的。此類方法計算量較小,實現(xiàn)相對容易,識別與檢測算法基本成熟,但因為其必須出現(xiàn)在視野范圍內(nèi)才能完成注冊過程,故使用范圍受到一定限制。

3、基于自然特征的無標識跟蹤注冊:是在沒有標識物的情況下,對目標物體的點、線、紋理等外形或幾何特征進行描述與提取,在應(yīng)用過程中利用圖像處理相關(guān)算法進行相應(yīng)的特征提取與匹配來建立投影面與三維空間之間的對應(yīng)關(guān)系并在此基礎(chǔ)上完成注冊過程。但此類方法計算量大,算法復(fù)雜度高,如何保證算法的實時性與魯棒性一直是研究熱點與難點。