新專利曝光:蘋果正在開發(fā)熱成像輔助的計(jì)算機(jī)視覺系統(tǒng)
發(fā)布時(shí)間 2018-10-18
據(jù)外媒報(bào)道,蘋果正在努力提高計(jì)算機(jī)視覺的技術(shù)能力,以便其能夠更加準(zhǔn)確地檢測(cè)和識(shí)別對(duì)象,比如在相機(jī)和被拍攝對(duì)象都在運(yùn)動(dòng)的情況下。這種通過熱成像來輔助確定元素追蹤的方法,似乎很有科幻感。但近日曝光的一項(xiàng)新專利,暗示了我們有望在不遠(yuǎn)的將來用上它。
周四的時(shí)候,美國專利商標(biāo)局(USPTO)公布了一份題為《與一部分真實(shí)環(huán)境相關(guān)的、能夠至少確定一個(gè)屬性的方法和系統(tǒng)》。這類應(yīng)用與計(jì)算機(jī)視覺有很大的關(guān)聯(lián),即借助攝像頭來分析場(chǎng)景,并從其看到的景象中獲取有用的數(shù)據(jù)。
文檔中提到了當(dāng)前計(jì)算機(jī)視覺分析技術(shù)、在應(yīng)對(duì)動(dòng)態(tài)環(huán)境時(shí)的一個(gè)問題,因?yàn)樵S多算法都是特別針對(duì)靜態(tài)環(huán)境而構(gòu)建的。但實(shí)際上,在使用智能機(jī)進(jìn)行拍攝的時(shí)候,器材和被拍攝者經(jīng)常都處于運(yùn)動(dòng)狀態(tài),想要明確追蹤其中一個(gè)對(duì)象,似乎有些強(qiáng)人所難。
若場(chǎng)景中有多個(gè)移動(dòng)物體,則相機(jī)姿態(tài)追蹤的準(zhǔn)確性會(huì)降低,甚至?xí)室夂雎詧?chǎng)景中在運(yùn)動(dòng)的物體。此外由于視線的遮擋,可能會(huì)遇到運(yùn)動(dòng)物體的識(shí)別問題。雖然 2D 相機(jī)視圖可以轉(zhuǎn)換為 3D 空間中的點(diǎn)位,但該空間中的運(yùn)用對(duì)象,也可能導(dǎo)致相機(jī)的 3D 定位問題。
這份專利給出的答案之一,就是使用兩套不同類型的攝像頭系統(tǒng),其中包括一個(gè)熱成像主攝、以及一個(gè)普通的攝像頭。兩者都可以有效地提供相同的視點(diǎn),但熱成像相機(jī)可以像算法提供熱圖數(shù)據(jù),輔以副攝像頭提供的成像數(shù)據(jù)。
該算法能夠分析熱圖像,并與成像數(shù)據(jù)相結(jié)合,以確定場(chǎng)景中的哪些項(xiàng)目與其它分離,增加熱量、以及通常用于分析的顏色 / 對(duì)比度等其它屬性。
例如,當(dāng)有人穿著綠色的制服在場(chǎng)地中踢足球時(shí),熱圖像會(huì)聚焦于球員身體產(chǎn)生的熱量。算法可借此確定熱圖中的對(duì)象,然后用普通的副攝像頭來挑選出正常圖像中的球員。
此外,該技術(shù)還可用于確定被遮擋的平面拍攝圖像。類似系統(tǒng)可借助熱成像來覆蓋 2D 圖像的其中一部分,并提供一些可用于改變呈現(xiàn)的數(shù)據(jù),比如被手遮擋的元件。
以建筑物分析為例,這樣的系統(tǒng)可用于識(shí)別附近的行人。當(dāng)來自相同視圖的其它圖像放在一起時(shí),行人可以從最終構(gòu)圖中被自動(dòng)移除。(聽起來是不是有點(diǎn)耳熟?)
雖然該專利申請(qǐng)著重于描述消費(fèi)級(jí)成像、視頻編輯、以及增強(qiáng)現(xiàn)實(shí),但它也能在自動(dòng)駕駛汽車領(lǐng)域發(fā)揮更大的作用,比如傳聞中的蘋果 Project Titan 自動(dòng)駕駛研究項(xiàng)目。
9 月初的時(shí)候,蘋果描述了一款專利的前照燈,其能夠突出現(xiàn)實(shí)道路的某部分區(qū)域,以便向駕駛員發(fā)出警示。不過這樣的系統(tǒng),也可戰(zhàn)略性地點(diǎn)亮部分道路,以幫助自動(dòng)駕駛汽車的視覺系統(tǒng)更好地“看清”前方路面。
[編譯自:Apple Insider]