美丽的小蜜蜂3娃娃脸,,,

當(dāng)前位置:中國(guó)生活都市網(wǎng) >> 看科技 >> 文章正文

人類的另一雙“慧眼”——計(jì)算機(jī)視覺

發(fā)布于:2020-08-17
  人們說(shuō)眼睛是靈魂的窗戶。我們每天睜開眼睛,看到這個(gè)五彩繽紛的世界,五彩繽紛的花朵,蔚藍(lán)的天空和我們親人熟悉的微笑。
  你知道視覺對(duì)機(jī)器人有多重要嗎?你知道什么是計(jì)算機(jī)視覺嗎?今天,牛叔將告訴你什么是計(jì)算機(jī)視覺。
  什么是計(jì)算機(jī)視覺?
  因特網(wǎng)
  因特網(wǎng)
  計(jì)算機(jī)視覺(Computer  vision)是用照相機(jī)拍攝圖像,并通過計(jì)算機(jī)識(shí)別和檢測(cè)圖像中的目標(biāo)。
  可以說(shuō),機(jī)器學(xué)習(xí)是視覺領(lǐng)域的一個(gè)應(yīng)用,也是人工智能領(lǐng)域的一個(gè)重要組成部分。其研究?jī)?nèi)容可以概括為:收集圖片或視頻,對(duì)圖片或視頻進(jìn)行處理和分析,并從中獲取相應(yīng)的信息。
  換句話說(shuō),我們使用照相機(jī)和電腦來(lái)獲取我們需要的信息。這是一門涵蓋廣泛領(lǐng)域的綜合性學(xué)科。
  從目前的研究來(lái)看,計(jì)算機(jī)視覺試圖建立一個(gè)人工系統(tǒng),越來(lái)越多的理論和技術(shù)被提出來(lái)從圖像或多維數(shù)據(jù)中獲取信息。計(jì)算機(jī)視覺系統(tǒng)可分為圖像采集、處理和運(yùn)動(dòng)控制。
  計(jì)算機(jī)視覺是使用計(jì)算機(jī)和相關(guān)設(shè)備模擬生物視覺。
  它的主要任務(wù)是通過處理收集到的圖片或視頻獲得相應(yīng)場(chǎng)景的3D信息,就像人類和許多其他生物每天做的那樣。
  計(jì)算機(jī)視覺產(chǎn)業(yè)概況
  因特網(wǎng)
  因特網(wǎng)
  計(jì)算機(jī)視覺按照產(chǎn)業(yè)鏈可以分為三層。
  上游基礎(chǔ)層主要基于芯片、數(shù)據(jù)集和算法,也就是我們常說(shuō)的算法、計(jì)算能力和數(shù)據(jù);
  中游基礎(chǔ)支持主要包括生物識(shí)別技術(shù)、目標(biāo)和場(chǎng)景識(shí)別技術(shù)、光學(xué)字符識(shí)別技術(shù)、視頻目標(biāo)提取和分析技術(shù)等;
  下游應(yīng)用主要集中在互聯(lián)網(wǎng)、系統(tǒng)開發(fā)、終端開發(fā)等領(lǐng)域。
  目前,計(jì)算機(jī)視覺是深度學(xué)習(xí)中最熱門的研究領(lǐng)域之一。圖像分類、目標(biāo)檢測(cè)、目標(biāo)跟蹤、語(yǔ)義分割和實(shí)例分割是計(jì)算機(jī)視覺的五大關(guān)鍵技術(shù)。
  計(jì)算機(jī)視覺不僅是一個(gè)工程領(lǐng)域,也是一個(gè)具有挑戰(zhàn)性的重要科學(xué)研究領(lǐng)域。
  深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域。其動(dòng)機(jī)在于建立和模擬用于分析學(xué)習(xí)的人腦神經(jīng)網(wǎng)絡(luò)。它模仿人腦解釋數(shù)據(jù)的機(jī)制。深度學(xué)習(xí)已經(jīng)成功地應(yīng)用于計(jì)算機(jī)視覺、語(yǔ)音識(shí)別和自然語(yǔ)言處理。
  計(jì)算機(jī)視覺的市場(chǎng)規(guī)模預(yù)測(cè)
  因特網(wǎng)
  因特網(wǎng)
  未來(lái),人們對(duì)安全和效率的要求將會(huì)繼續(xù)提高。計(jì)算機(jī)視覺技術(shù)在各個(gè)行業(yè)的應(yīng)用能夠有效地滿足人們的需求,有著巨大的市場(chǎng)發(fā)展空間。
  國(guó)家政策對(duì)人工智能產(chǎn)業(yè)的支持也為計(jì)算機(jī)視覺的發(fā)展提供了有利的環(huán)境。隨著計(jì)算機(jī)視覺技術(shù)的成熟和企業(yè)商業(yè)化能力的不斷提高,未來(lái)計(jì)算機(jī)視覺市場(chǎng)的規(guī)模將迎來(lái)突破性發(fā)展。根據(jù)六大權(quán)威機(jī)構(gòu)的總結(jié),樂觀估計(jì)2020年中國(guó)計(jì)算機(jī)視覺市場(chǎng)規(guī)模有望超過1000億;據(jù)全面保守預(yù)測(cè),2020年中國(guó)計(jì)算機(jī)視覺市場(chǎng)規(guī)模將達(dá)到700億元左右。
  計(jì)算機(jī)視覺產(chǎn)業(yè)的市場(chǎng)促進(jìn)因素
  因特網(wǎng)
  因特網(wǎng)
  主要因素如下:
  1.核心技術(shù)在不斷發(fā)展;
  2.相關(guān)應(yīng)用越來(lái)越廣泛;
  3.應(yīng)用領(lǐng)域逐漸拓寬。
  在核心技術(shù)層面,由于數(shù)據(jù)標(biāo)注行業(yè)的不斷發(fā)展,高質(zhì)量和基于場(chǎng)景的標(biāo)注能力不斷提高,計(jì)算機(jī)視覺可以識(shí)別從初始文本信息到人臉、人體識(shí)別和不同物體的信息類型。
  除了提高算法的準(zhǔn)確性,提高數(shù)據(jù)標(biāo)注的效率也是計(jì)算機(jī)視覺企業(yè)的現(xiàn)實(shí)需求。
  就應(yīng)用范圍而言,計(jì)算機(jī)視覺相關(guān)技術(shù)被應(yīng)用于安全攝像頭、交通攝像頭、金融、醫(yī)療保健、汽車、無(wú)人機(jī)、手機(jī)等領(lǐng)域。
  接下來(lái),牛叔叔將簡(jiǎn)要介紹計(jì)算機(jī)視覺涉及的主要領(lǐng)域。
  計(jì)算機(jī)視覺的未來(lái)發(fā)展領(lǐng)域
  因特網(wǎng)
  因特網(wǎng)
  01
  增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)技術(shù)
  增強(qiáng)現(xiàn)實(shí)是一種實(shí)時(shí)計(jì)算攝像機(jī)圖像的位置和角度,并添加相應(yīng)的圖像、視頻和3D模型的技術(shù)。這項(xiàng)技術(shù)的目標(biāo)是將虛擬世界嵌入現(xiàn)實(shí)世界,并在屏幕上互動(dòng)。
  虛擬現(xiàn)實(shí)是虛擬現(xiàn)實(shí)技術(shù)的縮寫。它是一個(gè)可以創(chuàng)造和體驗(yàn)虛擬世界的計(jì)算機(jī)模擬系統(tǒng)。它使用計(jì)算機(jī)生成模擬環(huán)境。它是一個(gè)多源信息融合、三維動(dòng)態(tài)場(chǎng)景和實(shí)體行為的交互式系統(tǒng)仿真,使用戶沉浸在環(huán)境中。
  計(jì)算機(jī)視覺是增強(qiáng)現(xiàn)實(shí)虛擬現(xiàn)實(shí)視覺呈現(xiàn)模型的基礎(chǔ),也是交互式場(chǎng)景交流的核心基礎(chǔ)?!盎?dòng)法則”使我們的眼睛和大腦適應(yīng),然后它逐漸應(yīng)用于醫(yī)療保健領(lǐng)域。
  有了虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí),醫(yī)務(wù)人員可以在歷史上第一次在一個(gè)“即使他們犯了錯(cuò)誤也沒關(guān)系”的環(huán)境中學(xué)習(xí)新技能和進(jìn)行外科手術(shù)。萬(wàn)一出錯(cuò),它們不會(huì)對(duì)病人造成危險(xiǎn)。
  在此前提下,虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)與醫(yī)療的結(jié)合將分為三類:
  第一類是“手術(shù)”;
  第二類是“醫(yī)師技能培訓(xùn)”;
  第三類是“病人康復(fù)訓(xùn)練”。
  02
  視頻處理
  更好的視頻處理。無(wú)論是各種黑色技術(shù)的美圖軟件還是各種奇妙的視頻處理,其核心技術(shù)都是降噪、視頻分割、視頻處理和使用計(jì)算機(jī)視覺的視頻壓縮。
  此外,相機(jī)中的人臉跟蹤、快速聚焦和人臉識(shí)別無(wú)疑與計(jì)算機(jī)視覺無(wú)關(guān)??梢灶A(yù)料,在未來(lái),借助計(jì)算機(jī)視覺的幫助,將會(huì)有越來(lái)越多的“作弊”。03
  汽車駕駛
  自20世紀(jì)70年代以來(lái),美國(guó),英國(guó),德國(guó)等發(fā)達(dá)國(guó)家開始研究無(wú)人駕駛汽車,并在可行性和實(shí)用性方面取得突破性進(jìn)展。
  中國(guó)在20世紀(jì)80年代開始研究無(wú)人駕駛汽車,國(guó)防科技大學(xué)于1992年在中國(guó)成功開發(fā)了第一輛真正的無(wú)人駕駛汽車。
  無(wú)人駕駛汽車是一種智能汽車,又稱輪式移動(dòng)機(jī)器人。無(wú)人駕駛汽車主要依靠汽車中的智能駕駛員,這與計(jì)算機(jī)視覺密切相關(guān)。
  04
  建筑領(lǐng)域
  通過計(jì)算機(jī)的相關(guān)使用,完成了工程預(yù)決算和工程量計(jì)算,起草了廣泛使用的招標(biāo)文件和標(biāo)書。
  05
  視頻理解
  隨著新網(wǎng)絡(luò)媒體的出現(xiàn)和5G時(shí)代的到來(lái),視頻已經(jīng)爆炸式地成為移動(dòng)互聯(lián)網(wǎng)最重要的內(nèi)容形式。
  面對(duì)海量的視頻信息,僅靠人工處理是無(wú)法做到的,因此實(shí)現(xiàn)視頻的智能理解成為一個(gè)亟待解決的問題。
  計(jì)算機(jī)視覺的應(yīng)用在這里起著非常重要的作用。
  06
  圖像相關(guān)處理
  它可以分為以下一般方向:
  1.圖像分類;
  2.圖像分割;
  3.圖像重建;
  4.圖像生成;
  5.目標(biāo)檢測(cè);
  6.風(fēng)格轉(zhuǎn)移;
  7.超級(jí)分辨率。
  以下是對(duì)上述內(nèi)容的簡(jiǎn)要介紹。
  圖像分類:圖像分類,也可以稱為圖像識(shí)別,顧名思義,就是識(shí)別圖像是什么,或者圖像中的物體屬于哪一類。
  圖像分割:圖像分割是基于圖像檢測(cè)的,它需要檢測(cè)目標(biāo)物體,然后對(duì)物體進(jìn)行分割。圖像分割可以分為三種類型:普通分割、語(yǔ)義分割和實(shí)例分割。
  圖像重建:圖像重建,也稱為圖像修復(fù),旨在修復(fù)圖像中缺失的部分,例如,它可以用來(lái)修復(fù)一些舊的損壞的黑白照片和電影。通常,使用公共數(shù)據(jù)集,然后人工創(chuàng)建圖片中的修復(fù)位置。
  圖像生成:圖像生成是根據(jù)圖片生成修改后的圖片或全新圖片的任務(wù)。這種應(yīng)用近年來(lái)發(fā)展迅速,主要是因?yàn)閳D像生成是近年來(lái)非常流行的研究方向,圖像生成是圖像生成的主要應(yīng)用。
  目標(biāo)檢測(cè):目標(biāo)檢測(cè)通常涉及兩個(gè)任務(wù):首先,找到目標(biāo),然后識(shí)別目標(biāo)。目標(biāo)檢測(cè)可分為單目標(biāo)檢測(cè)和多目標(biāo)檢測(cè),即圖像中目標(biāo)的數(shù)量。
  風(fēng)格轉(zhuǎn)移:風(fēng)格轉(zhuǎn)移是指將一個(gè)或幾個(gè)圖片的風(fēng)格應(yīng)用到其他領(lǐng)域或圖片。例如,將抽象風(fēng)格應(yīng)用于真實(shí)的圖片。
灵丘县| 鄂州市| 麻栗坡县| 监利县| 和顺县| 英山县| 仪陇县| 满洲里市| 日照市| 鄂温| 瓮安县| 仪征市| 清水河县| 平舆县| 乃东县| 林芝县| 司法| 潼南县| 达尔| 海晏县| 镇坪县| 沙坪坝区| 广德县| 定安县| 蓬安县| 碌曲县| 河南省| 上蔡县| 荥阳市| 驻马店市| 湘阴县| 白朗县| 灵武市| 鹤山市| 甘南县| 晋城| 泗洪县| 平罗县| 年辖:市辖区| 板桥市| 广宗县|