當(dāng)前位置:中國(guó)生活都市網(wǎng) >> 看科技 >> 文章正文
人類的另一雙“慧眼”——計(jì)算機(jī)視覺
發(fā)布于:2020-08-17
人們說(shuō)眼睛是靈魂的窗戶。我們每天睜開眼睛,看到這個(gè)五彩繽紛的世界,五彩繽紛的花朵,蔚藍(lán)的天空和我們親人熟悉的微笑。你知道視覺對(duì)機(jī)器人有多重要嗎?你知道什么是計(jì)算機(jī)視覺嗎?今天,牛叔將告訴你什么是計(jì)算機(jī)視覺。
什么是計(jì)算機(jī)視覺?
因特網(wǎng)
因特網(wǎng)
計(jì)算機(jī)視覺(Computer vision)是用照相機(jī)拍攝圖像,并通過計(jì)算機(jī)識(shí)別和檢測(cè)圖像中的目標(biāo)。
可以說(shuō),機(jī)器學(xué)習(xí)是視覺領(lǐng)域的一個(gè)應(yīng)用,也是人工智能領(lǐng)域的一個(gè)重要組成部分。其研究?jī)?nèi)容可以概括為:收集圖片或視頻,對(duì)圖片或視頻進(jìn)行處理和分析,并從中獲取相應(yīng)的信息。
換句話說(shuō),我們使用照相機(jī)和電腦來(lái)獲取我們需要的信息。這是一門涵蓋廣泛領(lǐng)域的綜合性學(xué)科。
從目前的研究來(lái)看,計(jì)算機(jī)視覺試圖建立一個(gè)人工系統(tǒng),越來(lái)越多的理論和技術(shù)被提出來(lái)從圖像或多維數(shù)據(jù)中獲取信息。計(jì)算機(jī)視覺系統(tǒng)可分為圖像采集、處理和運(yùn)動(dòng)控制。
計(jì)算機(jī)視覺是使用計(jì)算機(jī)和相關(guān)設(shè)備模擬生物視覺。
它的主要任務(wù)是通過處理收集到的圖片或視頻獲得相應(yīng)場(chǎng)景的3D信息,就像人類和許多其他生物每天做的那樣。
計(jì)算機(jī)視覺產(chǎn)業(yè)概況
因特網(wǎng)
因特網(wǎng)
計(jì)算機(jī)視覺按照產(chǎn)業(yè)鏈可以分為三層。
上游基礎(chǔ)層主要基于芯片、數(shù)據(jù)集和算法,也就是我們常說(shuō)的算法、計(jì)算能力和數(shù)據(jù);
中游基礎(chǔ)支持主要包括生物識(shí)別技術(shù)、目標(biāo)和場(chǎng)景識(shí)別技術(shù)、光學(xué)字符識(shí)別技術(shù)、視頻目標(biāo)提取和分析技術(shù)等;
下游應(yīng)用主要集中在互聯(lián)網(wǎng)、系統(tǒng)開發(fā)、終端開發(fā)等領(lǐng)域。
目前,計(jì)算機(jī)視覺是深度學(xué)習(xí)中最熱門的研究領(lǐng)域之一。圖像分類、目標(biāo)檢測(cè)、目標(biāo)跟蹤、語(yǔ)義分割和實(shí)例分割是計(jì)算機(jī)視覺的五大關(guān)鍵技術(shù)。
計(jì)算機(jī)視覺不僅是一個(gè)工程領(lǐng)域,也是一個(gè)具有挑戰(zhàn)性的重要科學(xué)研究領(lǐng)域。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域。其動(dòng)機(jī)在于建立和模擬用于分析學(xué)習(xí)的人腦神經(jīng)網(wǎng)絡(luò)。它模仿人腦解釋數(shù)據(jù)的機(jī)制。深度學(xué)習(xí)已經(jīng)成功地應(yīng)用于計(jì)算機(jī)視覺、語(yǔ)音識(shí)別和自然語(yǔ)言處理。
計(jì)算機(jī)視覺的市場(chǎng)規(guī)模預(yù)測(cè)
因特網(wǎng)
因特網(wǎng)
未來(lái),人們對(duì)安全和效率的要求將會(huì)繼續(xù)提高。計(jì)算機(jī)視覺技術(shù)在各個(gè)行業(yè)的應(yīng)用能夠有效地滿足人們的需求,有著巨大的市場(chǎng)發(fā)展空間。
國(guó)家政策對(duì)人工智能產(chǎn)業(yè)的支持也為計(jì)算機(jī)視覺的發(fā)展提供了有利的環(huán)境。隨著計(jì)算機(jī)視覺技術(shù)的成熟和企業(yè)商業(yè)化能力的不斷提高,未來(lái)計(jì)算機(jī)視覺市場(chǎng)的規(guī)模將迎來(lái)突破性發(fā)展。根據(jù)六大權(quán)威機(jī)構(gòu)的總結(jié),樂觀估計(jì)2020年中國(guó)計(jì)算機(jī)視覺市場(chǎng)規(guī)模有望超過1000億;據(jù)全面保守預(yù)測(cè),2020年中國(guó)計(jì)算機(jī)視覺市場(chǎng)規(guī)模將達(dá)到700億元左右。
計(jì)算機(jī)視覺產(chǎn)業(yè)的市場(chǎng)促進(jìn)因素
因特網(wǎng)
因特網(wǎng)
主要因素如下:
1.核心技術(shù)在不斷發(fā)展;
2.相關(guān)應(yīng)用越來(lái)越廣泛;
3.應(yīng)用領(lǐng)域逐漸拓寬。
在核心技術(shù)層面,由于數(shù)據(jù)標(biāo)注行業(yè)的不斷發(fā)展,高質(zhì)量和基于場(chǎng)景的標(biāo)注能力不斷提高,計(jì)算機(jī)視覺可以識(shí)別從初始文本信息到人臉、人體識(shí)別和不同物體的信息類型。
除了提高算法的準(zhǔn)確性,提高數(shù)據(jù)標(biāo)注的效率也是計(jì)算機(jī)視覺企業(yè)的現(xiàn)實(shí)需求。
就應(yīng)用范圍而言,計(jì)算機(jī)視覺相關(guān)技術(shù)被應(yīng)用于安全攝像頭、交通攝像頭、金融、醫(yī)療保健、汽車、無(wú)人機(jī)、手機(jī)等領(lǐng)域。
接下來(lái),牛叔叔將簡(jiǎn)要介紹計(jì)算機(jī)視覺涉及的主要領(lǐng)域。
計(jì)算機(jī)視覺的未來(lái)發(fā)展領(lǐng)域
因特網(wǎng)
因特網(wǎng)
01
增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)技術(shù)
增強(qiáng)現(xiàn)實(shí)是一種實(shí)時(shí)計(jì)算攝像機(jī)圖像的位置和角度,并添加相應(yīng)的圖像、視頻和3D模型的技術(shù)。這項(xiàng)技術(shù)的目標(biāo)是將虛擬世界嵌入現(xiàn)實(shí)世界,并在屏幕上互動(dòng)。
虛擬現(xiàn)實(shí)是虛擬現(xiàn)實(shí)技術(shù)的縮寫。它是一個(gè)可以創(chuàng)造和體驗(yàn)虛擬世界的計(jì)算機(jī)模擬系統(tǒng)。它使用計(jì)算機(jī)生成模擬環(huán)境。它是一個(gè)多源信息融合、三維動(dòng)態(tài)場(chǎng)景和實(shí)體行為的交互式系統(tǒng)仿真,使用戶沉浸在環(huán)境中。
計(jì)算機(jī)視覺是增強(qiáng)現(xiàn)實(shí)虛擬現(xiàn)實(shí)視覺呈現(xiàn)模型的基礎(chǔ),也是交互式場(chǎng)景交流的核心基礎(chǔ)?!盎?dòng)法則”使我們的眼睛和大腦適應(yīng),然后它逐漸應(yīng)用于醫(yī)療保健領(lǐng)域。
有了虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí),醫(yī)務(wù)人員可以在歷史上第一次在一個(gè)“即使他們犯了錯(cuò)誤也沒關(guān)系”的環(huán)境中學(xué)習(xí)新技能和進(jìn)行外科手術(shù)。萬(wàn)一出錯(cuò),它們不會(huì)對(duì)病人造成危險(xiǎn)。
在此前提下,虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)與醫(yī)療的結(jié)合將分為三類:
第一類是“手術(shù)”;
第二類是“醫(yī)師技能培訓(xùn)”;
第三類是“病人康復(fù)訓(xùn)練”。
02
視頻處理
更好的視頻處理。無(wú)論是各種黑色技術(shù)的美圖軟件還是各種奇妙的視頻處理,其核心技術(shù)都是降噪、視頻分割、視頻處理和使用計(jì)算機(jī)視覺的視頻壓縮。
此外,相機(jī)中的人臉跟蹤、快速聚焦和人臉識(shí)別無(wú)疑與計(jì)算機(jī)視覺無(wú)關(guān)??梢灶A(yù)料,在未來(lái),借助計(jì)算機(jī)視覺的幫助,將會(huì)有越來(lái)越多的“作弊”。03
汽車駕駛
自20世紀(jì)70年代以來(lái),美國(guó),英國(guó),德國(guó)等發(fā)達(dá)國(guó)家開始研究無(wú)人駕駛汽車,并在可行性和實(shí)用性方面取得突破性進(jìn)展。
中國(guó)在20世紀(jì)80年代開始研究無(wú)人駕駛汽車,國(guó)防科技大學(xué)于1992年在中國(guó)成功開發(fā)了第一輛真正的無(wú)人駕駛汽車。
無(wú)人駕駛汽車是一種智能汽車,又稱輪式移動(dòng)機(jī)器人。無(wú)人駕駛汽車主要依靠汽車中的智能駕駛員,這與計(jì)算機(jī)視覺密切相關(guān)。
04
建筑領(lǐng)域
通過計(jì)算機(jī)的相關(guān)使用,完成了工程預(yù)決算和工程量計(jì)算,起草了廣泛使用的招標(biāo)文件和標(biāo)書。
05
視頻理解
隨著新網(wǎng)絡(luò)媒體的出現(xiàn)和5G時(shí)代的到來(lái),視頻已經(jīng)爆炸式地成為移動(dòng)互聯(lián)網(wǎng)最重要的內(nèi)容形式。
面對(duì)海量的視頻信息,僅靠人工處理是無(wú)法做到的,因此實(shí)現(xiàn)視頻的智能理解成為一個(gè)亟待解決的問題。
計(jì)算機(jī)視覺的應(yīng)用在這里起著非常重要的作用。
06
圖像相關(guān)處理
它可以分為以下一般方向:
1.圖像分類;
2.圖像分割;
3.圖像重建;
4.圖像生成;
5.目標(biāo)檢測(cè);
6.風(fēng)格轉(zhuǎn)移;
7.超級(jí)分辨率。
以下是對(duì)上述內(nèi)容的簡(jiǎn)要介紹。
圖像分類:圖像分類,也可以稱為圖像識(shí)別,顧名思義,就是識(shí)別圖像是什么,或者圖像中的物體屬于哪一類。
圖像分割:圖像分割是基于圖像檢測(cè)的,它需要檢測(cè)目標(biāo)物體,然后對(duì)物體進(jìn)行分割。圖像分割可以分為三種類型:普通分割、語(yǔ)義分割和實(shí)例分割。
圖像重建:圖像重建,也稱為圖像修復(fù),旨在修復(fù)圖像中缺失的部分,例如,它可以用來(lái)修復(fù)一些舊的損壞的黑白照片和電影。通常,使用公共數(shù)據(jù)集,然后人工創(chuàng)建圖片中的修復(fù)位置。
圖像生成:圖像生成是根據(jù)圖片生成修改后的圖片或全新圖片的任務(wù)。這種應(yīng)用近年來(lái)發(fā)展迅速,主要是因?yàn)閳D像生成是近年來(lái)非常流行的研究方向,圖像生成是圖像生成的主要應(yīng)用。
目標(biāo)檢測(cè):目標(biāo)檢測(cè)通常涉及兩個(gè)任務(wù):首先,找到目標(biāo),然后識(shí)別目標(biāo)。目標(biāo)檢測(cè)可分為單目標(biāo)檢測(cè)和多目標(biāo)檢測(cè),即圖像中目標(biāo)的數(shù)量。
風(fēng)格轉(zhuǎn)移:風(fēng)格轉(zhuǎn)移是指將一個(gè)或幾個(gè)圖片的風(fēng)格應(yīng)用到其他領(lǐng)域或圖片。例如,將抽象風(fēng)格應(yīng)用于真實(shí)的圖片。