美丽的小蜜蜂3娃娃脸,,,

當前位置:中國生活都市網(wǎng) >> 看科普 >> 文章正文

百度的AI事件正在啟蒙一代年輕人

發(fā)布于:2020-12-21

一提到“AI開發(fā)者”,大多數(shù)人可能會想到互聯(lián)網(wǎng)大公司的“程”。他們生活在算法工程師、數(shù)據(jù)工程師等高調(diào)崗位,擁有名醫(yī)甚至博士后的傲人學歷,年薪百萬。

如你所見,第三波人工智能已經(jīng)進行了很久,逐漸從象牙塔跌落到社會的角落。但在大多數(shù)人的認知中,AI還有很長的路要走,它還是一些智力研究的產(chǎn)物,還是一部普通人摸不著的“天書”。

但是現(xiàn)實中發(fā)生的一些事情,超出了我們的預期。

埃隆馬斯克在為特斯拉招AI人才時直言:“博士學位肯定不是必須的。我不管你高中畢業(yè)沒有?!迸c很多人對教育和經(jīng)驗的執(zhí)念不同,馬斯克尋找的是對人工智能有“深刻理解”的人。

不僅僅是特斯拉的不拘一格,而是一群20歲的少年剛剛經(jīng)歷了一場AI世界的“奇幻漂流”,說明他們對人工智能的理解。

01 像看地圖一樣看新聞

大四學生羅云是武漢大學地理信息科學專業(yè)的本科生。他獲得人工智能的機會始于今年年初的新冠肺炎疫情。

寒假期間回到家鄉(xiāng)的羅云剛剛在床上住了幾天,被班級里的討論弄得很緊張。原來,他們離開學校幾天后,武漢就因為新冠肺炎疫情而關(guān)閉了。羅云想知道那個熟悉的城市發(fā)生了什么,試圖在社交媒體和信息平臺上搜索所有與武漢相關(guān)的新聞,但發(fā)現(xiàn)網(wǎng)上有太多的謠言和虛假消息。如果他想進一步了解學校周圍的情況,他只能在社交媒體上找到一些未經(jīng)證實的內(nèi)容。

由于地理信息科學屬于計算機和地理的交叉學科,除了和地理有關(guān)的課程,羅運還自學了計算機編程,并且經(jīng)常在國外的慕課平臺上看一些人工智能的課程和案例??嘤诓檎椅錆h當?shù)匦侣劦牧_運萌生了一個大膽的想法:能不能將地圖和新聞資訊進行結(jié)合,像看地圖一樣查看當?shù)氐男侣劊?/strong>

羅云與兩位參加大學生創(chuàng)新創(chuàng)業(yè)大賽的小伙伴交流了自己的想法,三人一拍即合,決定打造一款面向地圖的時空新聞互動網(wǎng)頁應用。

該團隊首先確定自己要抓取的權(quán)威可信的新聞源網(wǎng)站,然后使用Scratch異步爬蟲框架智能提取新聞,在百度Feioar提供的深度學習框架支持下,基于ERNIE識別命名實體,結(jié)合百度地圖等地理編碼服務,利用PostGIS計算空間數(shù)據(jù)的規(guī)模和跨度,提取分詞和詞性。TF-IDF、LDA等算法用于文本的矢量化、詞頻分析、主題分析和相似性分析。最后利用飛槳GRU4Rec模型,根據(jù)用戶行為順序和興趣區(qū)域推薦新聞。

經(jīng)過四個多月的開發(fā)和測試,結(jié)合地圖和新聞的網(wǎng)絡(luò)應用程序正式推出。當將鼠標指向武昌火車站時,網(wǎng)頁上彈出了長江網(wǎng)的最新消息,稱武漢解除了對韓至湖北通道的控制,涉及武昌火車站、武漢火車站、漢口火車站??粗某删停_云比任何時候都更想念這個熟悉的城市和學校。

不善言談的他很快就和朋友們定下了下一個目標:目前他們正在給這個應用增加新的功能,逐步增加情感趨勢面分析、輿情導向分析等功能,方便普通用戶在地圖上找到不同時間的新聞,幫助相關(guān)部門從新聞和人們的情緒中挖掘出社會熱點和痛點。

02 告別垃圾分類的煩惱

在距離武漢700多公里的杭州,杭州電子科技大學信息工程學院的計算機專業(yè)學生杰今敏也在踏上人工智能的征程。

家住杭州的杰金敏,看到媽媽每天花很多時間對廚余垃圾、可回收垃圾、有害垃圾進行分類。然而,由于垃圾種類繁多,分類錯誤時有發(fā)生。社區(qū)必須派志愿者去監(jiān)督每個社區(qū)。基本上,在居民剛剛把垃圾扔出去后,志愿者需要再把它撿起來放到垃圾桶里。

一些志愿者被放在垃圾桶旁接受檢查,但每個人都有一種——的“幸運感”。畢竟,即使他們被錯誤地分類,一些志愿者也會被重新分類。每天看著志愿者在臭氣熏天的垃圾桶里整理東西,這揭示了今敏心里有些不好的感覺。有什么方法可以幫助這些志愿者不用擔心垃圾分類?

作為一名計算機專業(yè)的本科生,揭金民想要用人工智能來改變現(xiàn)狀:倘若可以用計算機視覺技術(shù)對垃圾進行分類識別,居民們就能更輕松地完成垃圾分類,準確性也會提升,志愿者也不用再忍受惡臭翻垃圾桶。

杰今敏招募了兩名軟件工程專業(yè)的學生,以三人團隊的形式實踐自己的想法。杰今敏負責硬件設(shè)計。他想做一個三層智能垃圾桶。第一層用于垃圾識別,第二層用于垃圾處理,第三層用于存儲不同類型的垃圾。另外兩個合作伙伴負責系統(tǒng)后端和前端的開發(fā)。

分工敲定后,必須解決的一個核心問題是建立垃圾分類的算法模型。如果自己寫一套圖像識別算法,目前的水平和積累跟不上,會耽誤產(chǎn)品成型的時間,錯過最好的市場。幸運的是,團隊找到了百度的EasyDL平臺。EasyDL作為零閾值A(chǔ)I開發(fā)平臺,擁有豐富的算法模型,包括圖像分類、人臉識別等。算法模型終于有了“譜”。杰今敏和他的朋友們松了口氣,立即專注于硬件和系統(tǒng)開發(fā)。

在一年的時間里,杰今敏團隊收集整理了近2萬張垃圾照片,其中包括大量袋裝垃圾,EasyDL訓練后識別準確率高達96%。硬件設(shè)計組裝完成后,杰金民把智能垃圾桶放在自己的小區(qū)里進行試點。目前已協(xié)助用戶完成近1000kg垃圾的分類,異常識別率控制在5%以內(nèi)。

“這只是第一步。我們要推出智能分類垃圾桶的家庭版,嘗試推出“代別人扔垃圾”的服務……”細心的杰今敏已經(jīng)想到了未來的所有可能性。

03 解放高空中的補漆工

在風能資源最豐富的西北地區(qū),風車立如林,不斷將風能轉(zhuǎn)化為電能。

然而,風扇的維護已經(jīng)成為一個令人頭痛的問題。西安電子科技大學的黃耀輝(音譯)了解到,維修電風扇需要工人用繩子爬上天空,提著油漆桶來修補油漆。

小時候,她覺得這是一件冒險的事情。長大后她意識到冒險背后有一個可怕的風險:高空繪畫通常在二級、三級甚至超高空作業(yè),二級高空作業(yè)墜落死亡率高達40%;同時《工業(yè)衛(wèi)生與職業(yè)病》指出7.2%的油漆工白細胞減少,18.3%有沙眼,22.8%心電圖異常,17.8%視力下降.

作為西安電子科技大學創(chuàng)新創(chuàng)業(yè)實驗班的學生,黃耀輝在心中一直藏著“解放”高空補漆工的想法,并在課余時間自學了人工智能相關(guān)的課程。一次偶然的機會,黃耀輝在學校的微信群中看到同學們在討論飛槳,在好奇心的驅(qū)動下走進了深度學習的世界。

當黃耀輝開始熱衷于深度學習時,他也遇到了一個好伙伴:左毅。當時,左毅正在團隊中從事一項無人駕駛飛行器項目。他和黃耀輝溝通之后,大家很快就想出了一個新的點子:既然飛槳上有那么多成熟的算法模型,那么人工智能和無人機結(jié)合起來,讓無人機代替工人在高空完成補漆工作,或許是有可能的。

團隊討論明確目標后,左毅作為隊長,將無人機的工作分解為四個流程。第一步是檢查銹斑和噴灑除銹劑,第二步是讓無人機打磨鐵銹,第三步和第四步是分別涂底漆和面漆。由于該團隊在無人機檢查和機械控制方面積累了一些經(jīng)驗,問題主要集中在圖像識別和噴墨控制系統(tǒng)上。

團隊在飛槳中調(diào)用計算機視覺模型,以空地聯(lián)動的形式進行操作,即無人機將第一幅圖像傳送到地面站,地面站設(shè)置高效的識別設(shè)備,將數(shù)據(jù)再次發(fā)送給無人機。由于使用了可視化SLAM技術(shù),無人機上的攝像頭可以完成環(huán)境感知,不僅降低了硬件成本,還提高了野外作業(yè)的可行性。

目前這個項目已經(jīng)在校園內(nèi)進行了測試:無人機慢慢飛到燈柱上的電箱附近,準確的識別出電箱上的銹斑,然后一次打磨、上漆,越來越接近他們解放高空油漆維修工人的想法。

作為團隊中的一員,出生在中國西北部并在那里長大的女孩黃耀輝看到無人機飛過時眼睛有點濕潤:“雖然這仍然只是一場比賽,但我相信,通過我們的努力,那些工人總有一天不再需要冒著生命危險。爬到高空去工作。”

04 讓瀕危語言不再消失

遠在英國南約克郡,謝菲爾德大學林賽多集團正在讀博的徐坦彭也有著“科技好”的公益理念。

在2020年初的“國際母語日”期間,徐坦鵬在謝菲爾德大學人文學院聽了一場演講,得知在世界上記錄的7000多種語言中,有400多種瀕臨滅絕,200多種處于瀕危狀態(tài)。“語言是文明的DNA”。當一些語言不再傳承給下一代的時候,就意味著一個文明正在被人們遺忘。

經(jīng)過培訓的學生徐坦鵬發(fā)現(xiàn),瀕危語言的保護仍然是一項“勞動密集型”的工作,需要大量專家進行實地調(diào)查和收集數(shù)據(jù)。因為現(xiàn)在還在說瀕危語言的人主要是老年人,很少有人能同時使用漢語和自己的語言,這使得人工抄寫語料庫非常困難。無獨有偶,以自然語言處理為研究方向的徐坦鵬,也在關(guān)注低資源語言的詞典生成,有著用自己的技能減少瀕危語言保護工作量的想法。

Xutan Peng戲稱自己是個話癆,所以對語言相關(guān)的工作有著天生的興趣。然而現(xiàn)實問題的復雜度遠超Xutan Peng的料想,盡管國內(nèi)已經(jīng)在少數(shù)民族語言保護上做了很多卓有成效的工作 ,可很多瀕危語言的文字已經(jīng)失傳,只有語音留存,研究者甚至無法獲知其背后所傳達的語義。

但徐坦鵬發(fā)現(xiàn),少數(shù)民族的語言材料主要集中在神話傳說、民間故事、民歌和日常會話等方面,因此有可能構(gòu)建一個現(xiàn)代漢語同領(lǐng)域語料庫。當它們的語言材料相對相似時,可以通過對齊算法建立瀕危語言與現(xiàn)代漢語的關(guān)系。

徐坦鵬首先獲得了相關(guān)數(shù)據(jù)的授權(quán),用PaddleOCR將相關(guān)論文語料庫轉(zhuǎn)換成文本,建立了業(yè)界第一個大規(guī)模的中文故事數(shù)據(jù)集。然后,從國際開源語料庫數(shù)據(jù)庫中找到蘇爾、賈蓉、獨龍族和撒拉族四種語言,并將母語者的錄音轉(zhuǎn)錄成國際音標。

最后,徐坦鵬將少數(shù)民族語言詞匯嵌入到一個高維語義空間,而漢語詞匯則嵌入到另一個空間?;陔p語詞向量結(jié)構(gòu)的相似性,通過正交映射將兩個空間對齊,生成高質(zhì)量的大規(guī)模雙語詞典。

目前,徐坦鵬已將導出詞典提供給中國社會科學院研究人員進行內(nèi)部測試。大部分單詞和名詞的翻譯準確率非常理想,有效提高了少數(shù)民族語言的轉(zhuǎn)錄速度和瀕危語言的收集速度。這個特別會說話的大男孩不忘強調(diào):“你看,語言好有趣?!?

05 AI人才培養(yǎng)需要閉環(huán)

看完這些故事,你有沒有發(fā)現(xiàn),這些年輕人并不是都經(jīng)過培訓的,有的甚至在開始這些項目之前對編程知之甚少?但他們也有一個共同點:有思想,善于發(fā)現(xiàn)生活中的痛點,希望通過人工智能技術(shù)解決。

好在百度飛槳和EasyDL降低了這些青少年進入AI世界的門檻,讓他們略顯稚嫩但充滿活力的想法有了新的可能。

從好創(chuàng)意變成好應用,AI人才培養(yǎng)機制在其中起著關(guān)鍵的作用。雖然越來越多的高校開設(shè)了人工智能專業(yè)或課程,越來越多的政府和企業(yè)為AI人才開出了優(yōu)渥的條件,動輒百萬的年薪也切實激勵著當下的年輕人,只是選出“千里馬”所需要的不僅僅是伯樂,還要給他們一片可以自由馳騁的寬闊草原。

綜上,說“聞鼓而思好人,謀大業(yè)而呼人才”是有道理的。而AI人才培養(yǎng)需要一個閉環(huán)的人才培養(yǎng)思路,需要政府、高校、企業(yè)共同努力,打通激勵、培訓、實訓、競爭、就業(yè)的產(chǎn)業(yè)鏈。

至少在剛剛結(jié)束的中國大學計算機大賽——人工智能創(chuàng)意大賽中,免費的計算資源幫助他們把想法變成了現(xiàn)實,半年的實踐經(jīng)驗讓他們對自己想要解決的問題有了更深入的了解。

好在以百度為代表的AI頭鵝已經(jīng)開始行動了。

以上四個故事只是百度主辦的第三屆“中國大學計算機大賽——人工智能創(chuàng)意大賽”的一角。還有2200多個有夢想的學生團隊,繼續(xù)在各自關(guān)注的領(lǐng)域?qū)懽约旱墓适?。就像上一屆比賽中獲獎的中南大學“愛知福寶”團隊,獲得了數(shù)千萬的孵化資金,他們的項目已經(jīng)連接到全國618家醫(yī)院,幫助1萬多名醫(yī)生進行初步診斷。

事實上,“以賽促學”是高校AI人才培養(yǎng)的重要組成部分。百度打造的一整套AI人才培養(yǎng)體系已經(jīng)初具規(guī)模:

對于高校,百度為AI人才培養(yǎng)、學習培訓社區(qū)AI Studio和計算能力提供全套的教學和數(shù)據(jù)資源,共同構(gòu)建專業(yè)課程體系,舉辦教師培訓課程。它培訓了來自近500所大學的1600多名教師;

對于企業(yè)來說,百度針對不同的技術(shù)水平創(chuàng)建了培訓項目,如黃埔學院、AI快軌、AI私人俱樂部等,構(gòu)建了深度學習專業(yè)加實際應用的課程體系。此外,百度還通過開展能力評估認證、舉辦競賽等方式為人員培訓保駕護航。

百度培養(yǎng)了100多萬AI人才,未來五年將培養(yǎng)500萬AI人才,為中國智能經(jīng)濟和智能社會的發(fā)展提供人才保障。

有理由相信,在百度等企業(yè)的推動下,會有越來越多的“少年”在AI世界里進行“幻想漂流”,用可觸摸的物品解讀他們的內(nèi)心世界。

再來討論百度對中國AI人才的貢獻,恐怕不僅僅是培養(yǎng)高端人才的“黃埔軍?!?,更是無數(shù)優(yōu)秀AI人才的“啟蒙工廠”。

西平县| 准格尔旗| 尼玛县| 同心县| 盖州市| 正镶白旗| 罗山县| 嘉义县| 云阳县| 卓尼县| 丽江市| 奉新县| 新兴县| 鸡东县| 宿松县| 商城县| 沛县| 江西省| 无极县| 福安市| 界首市| 沙河市| 西充县| 姜堰市| 长沙市| 紫云| 海城市| 迭部县| 孟州市| 渝中区| 咸宁市| 信阳市| 常州市| 垦利县| 建瓯市| 滦南县| 自贡市| 宜章县| 鹤庆县| 贞丰县| 将乐县|