當(dāng)前位置：首頁(yè) > 結(jié)構(gòu)工程師 > 正文

vivo結(jié)構(gòu)工程師vivo結(jié)構(gòu)工程師用什么軟件

　　AI科技評(píng)論按：在谷歌 I/O 2017 的最后一日，主場(chǎng)館海岸線(xiàn)圓形劇場(chǎng)迎來(lái)了本屆 I/O 最具重量級(jí)的機(jī)器學(xué)習(xí)講座：由四位分屬不同領(lǐng)域的 AI 女性大牛展開(kāi)巔峰對(duì)話(huà)，漫談 AI 的過(guò)去、現(xiàn)在與將來(lái)。四位嘉賓分別是語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)、數(shù)據(jù)可視化和生物計(jì)算領(lǐng)域的頂級(jí) AI 學(xué)者與工程師。而本場(chǎng)對(duì)話(huà)無(wú)關(guān)技術(shù)，純是幾位杰出科學(xué)家對(duì)各自領(lǐng)域深度學(xué)習(xí)發(fā)展歷程的反思，以及對(duì)將來(lái)趨勢(shì)的思考。

　　四位嘉賓是：

Francoise Beaufays，谷歌語(yǔ)音識(shí)別技術(shù)研發(fā)帶頭人

李飛飛，谷歌云首席科學(xué)家，斯坦福 AI 實(shí)驗(yàn)室負(fù)責(zé)人

Fernanda Viegas，計(jì)算式設(shè)計(jì)（computational design）專(zhuān)家，谷歌 Big Picture 數(shù)據(jù)可視化部門(mén)負(fù)責(zé)人之一

Daphne Kolller，Calico Labs 首席計(jì)算官，Coursera 聯(lián)合創(chuàng)始人

　　本講座由谷歌云副總裁 Diane Greene 主持（以下稱(chēng)”主持人“），分為三個(gè)環(huán)節(jié)，每個(gè)環(huán)節(jié)的話(huà)題分別對(duì)應(yīng) AI 的過(guò)去、現(xiàn)在與將來(lái)。

　　話(huà)題一：AI 技術(shù)是如何發(fā)展到深度學(xué)習(xí)時(shí)代，走到今天這一步的？

　　Daphne Kolller：我認(rèn)為，深度學(xué)習(xí)革命讓我們得以解決當(dāng)今各領(lǐng)域的許多現(xiàn)實(shí)難題，它讓這一切成為可能。

　　這場(chǎng)革命，是一系列機(jī)器學(xué)習(xí)研究進(jìn)展的結(jié)果——深度學(xué)習(xí)來(lái)臨之前，大約有 10 到 15 年相當(dāng)艱辛的研究，用于研發(fā)人工設(shè)計(jì)的模型。構(gòu)建這些模型需要大量其它領(lǐng)域的專(zhuān)業(yè)知識(shí)，以及深入細(xì)致的思慮考量。研究人員需要人工雕琢模型的大量細(xì)節(jié)，由于缺乏數(shù)據(jù)，往往要用我們的直覺(jué)判斷作為構(gòu)建模型的依據(jù)。

　　而當(dāng)我們得到更多數(shù)據(jù)，尤其在文字、圖像、語(yǔ)音領(lǐng)域，就逐漸開(kāi)始用數(shù)據(jù)來(lái)替代這些主觀洞察力。但是，過(guò)去這 10 到 15 年間的技術(shù)研究成果，在今天仍然很有價(jià)值。這里有兩個(gè)方面：

在研究方法上，優(yōu)化算法便是那時(shí)發(fā)明出來(lái)的，是深度學(xué)習(xí)得以成功的關(guān)鍵技術(shù)之一。

另一方面，如今我們一廂情愿得相信，大數(shù)據(jù)是解決一切的方案。但這僅僅對(duì)應(yīng)部分領(lǐng)域。對(duì)其它領(lǐng)域而言，我們掌握的數(shù)據(jù)量充其量不過(guò)是中等，有的甚至可說(shuō)是小規(guī)模。因而，仍需要在人類(lèi)直覺(jué)和數(shù)據(jù)之間做平衡，充分利用兩者的長(zhǎng)處。

　　李飛飛：我來(lái)稍微談一談歷史背景。在所有人類(lèi)的科學(xué)領(lǐng)域里，AI 是一門(mén)相當(dāng)年輕的學(xué)科，大約有 60 歲。但在我的觀點(diǎn)里，AI 啟蒙思想的根源，即對(duì)于智能的求索，可追溯到人類(lèi)文明誕生的黎明時(shí)期。

　　大約 60 年前，機(jī)器剛剛能處理簡(jiǎn)單的算術(shù)。但以計(jì)算機(jī)科學(xué)之父阿蘭-圖靈為代表的思想家，已開(kāi)始提出挑戰(zhàn)人類(lèi)社會(huì)的問(wèn)題：“機(jī)器是否能思考？機(jī)器是否能擁有智能？那時(shí)，馬文·明斯基、John McCarthy 等計(jì)算機(jī)先驅(qū)聚到一起，創(chuàng)立了如今的人工智能學(xué)科。AI 之父?jìng)冄壑械?AI，在技術(shù)上講，與今天十分不同。但核心的愿望是一致的：讓機(jī)器能學(xué)習(xí)、思考、感知、有邏輯，能開(kāi)口說(shuō)話(huà)，與我們交流。

　　AI 已經(jīng)經(jīng)歷了幾波技術(shù)發(fā)展：從一階邏輯（first-order logic），到專(zhuān)家系統(tǒng)（expert systems），然后是早期機(jī)器學(xué)習(xí)，再到如今的深度學(xué)習(xí)革命。

　　過(guò)去的 60 年，我把它稱(chēng)為”in-vitro AI“，或者“AI in vitro”（雷鋒網(wǎng)注：可理解為“試管階段的 AI”）。這一階段為 AI 研究的基礎(chǔ)問(wèn)題以及眾多子學(xué)科打下了基石。后者包括機(jī)器人、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音處理、生物保護(hù)學(xué)（conbio）等等。這同樣是一個(gè)研究人員們不斷理解數(shù)據(jù)、尋找工具集的過(guò)程。

　　而 2010 年左右是一個(gè)分水嶺。這時(shí)，三個(gè)不同領(lǐng)域的進(jìn)步終于達(dá)到了一個(gè)前所未有的里程碑高度：統(tǒng)計(jì)機(jī)器學(xué)習(xí)領(lǐng)域工具的成熟、互聯(lián)網(wǎng)和傳感器帶來(lái)的大數(shù)據(jù)、摩爾定律預(yù)測(cè)的硬件計(jì)算性能提升。這三者的合力，把 AI 從 “in vitro”階段，推上了一個(gè)被我稱(chēng)為 “in vivo” （雷鋒網(wǎng)注：可理解為“胚胎階段的 AI”）的全新階段。

　　“AI in vivo”，是一個(gè) AI 技術(shù)向世界做出實(shí)際貢獻(xiàn)的階段。當(dāng)下這個(gè)時(shí)間點(diǎn)，還僅僅只是個(gè)開(kāi)頭——“It‘s just the begining”。我們?cè)诠雀柙扑^察到的每一個(gè)行業(yè)，都在數(shù)據(jù)、AI、機(jī)器學(xué)習(xí)的推動(dòng)下經(jīng)歷著革命性的轉(zhuǎn)變。在我眼里，這是一個(gè)歷史性的時(shí)刻：AI 終于開(kāi)始發(fā)揮現(xiàn)實(shí)影響力，改造無(wú)數(shù)個(gè)行業(yè)。

　　我想要再?gòu)?qiáng)調(diào)一遍：一切剛剛開(kāi)始?，F(xiàn)在 AI 領(lǐng)域的工具和革命性技術(shù)，僅僅是廣袤海洋中的幾滴水。剩下的可探索空間，即我們能借助 AI 實(shí)現(xiàn)的事情，幾乎是無(wú)限的，再怎么夸大也不為過(guò)。對(duì)此，如果你感到興奮激動(dòng)，或許是應(yīng)該的——有許多工作等著我們?nèi)プ?，?lái)實(shí)現(xiàn) “AI in vivo”。

　　主持人：Francoise，你處在語(yǔ)音識(shí)別研究的最前沿。當(dāng)下，語(yǔ)音識(shí)別技術(shù)已經(jīng)普及開(kāi)來(lái)，能否向我們介紹下這一發(fā)展歷程？

　　Francoise Beaufays：當(dāng)然。12 年前我加入谷歌，那時(shí)，我們都想用語(yǔ)音識(shí)別技術(shù)做點(diǎn)有用、好玩的事。但這相當(dāng)?shù)秒y——當(dāng)時(shí)語(yǔ)音的質(zhì)量完全不能和現(xiàn)在比。因此，我們從極其有限的產(chǎn)品著手，這樣識(shí)別一個(gè)人說(shuō)的話(huà)并不過(guò)于復(fù)雜，然后一點(diǎn)一點(diǎn)地突破極限。我們需要做的，是打造一個(gè)成功的產(chǎn)品，讓用戶(hù)愿意使用；然后以此為基礎(chǔ)，不斷收集新數(shù)據(jù)導(dǎo)入模型、不斷迭代，每次提高一點(diǎn)點(diǎn)。

　　按照該思路，我們開(kāi)發(fā)了 GOOG-411，我不知道有多少人還記得它。它是一個(gè)手機(jī) APP：你撥打一個(gè)號(hào)碼，它會(huì)問(wèn)你：查詢(xún)哪個(gè)城市或州？回答之后，它接著問(wèn)：“查詢(xún)哪家公司？”說(shuō)出名字之后，它會(huì)撥通該公司的電話(huà)。請(qǐng)注意，12 年前，沒(méi)有 iPhone 也沒(méi)有安卓，大家用的還是功能機(jī)。所以 GOOG-411 的功能也很基礎(chǔ)。幸運(yùn)的是，谷歌高層對(duì)該技術(shù)的前景抱有憧憬，支持我們盡可能得打破技術(shù)極限。

　　當(dāng)時(shí)我們很成功。然后 iOS 和安卓誕生，一切都變了——用戶(hù)有了視覺(jué)反饋。于是我們開(kāi)始構(gòu)想其他的 APP 產(chǎn)品，那便是 Voice Searchv用語(yǔ)音進(jìn)行谷歌搜索。我們開(kāi)始做語(yǔ)音轉(zhuǎn)錄，把麥克風(fēng)整合進(jìn)手機(jī)功能的各個(gè)入口，讓用戶(hù)可以用語(yǔ)音做任何事。

　　更后來(lái)，我們?cè)噲D把語(yǔ)音識(shí)別技術(shù)帶到家庭場(chǎng)景，比如 Google Home 這樣的設(shè)備。用語(yǔ)音來(lái)處理日常任務(wù)，是一個(gè)呼聲很高的訴求。我們認(rèn)為智能助手是一個(gè)很好的入口。相比用口頭命令做簡(jiǎn)單的事，智能助手可以用日常的自然語(yǔ)言與用戶(hù)問(wèn)答，而不是麻煩的鍵盤(pán)打字輸入，使谷歌真正成為用戶(hù)的個(gè)人助手。

　　主持人：Fernanda，你曾表示要讓數(shù)據(jù)可視化民主化。如何才能實(shí)現(xiàn)？必要性在哪里？數(shù)據(jù)可視化分析又是如何進(jìn)化的？

　　Fernanda Viegas：十多年前，我已經(jīng)在從事數(shù)據(jù)可視化。當(dāng)時(shí)的情況很不一樣：研究非常困難，設(shè)備和現(xiàn)在不能比，能獲得的數(shù)據(jù)也很少，大多數(shù)并不公開(kāi)。

　　這情況逐漸改善，現(xiàn)在，數(shù)據(jù)可視化已可說(shuō)是無(wú)處不在。比如，媒體也喜歡在數(shù)據(jù)可視化的幫助下，用統(tǒng)計(jì)數(shù)字表達(dá)復(fù)雜的新聞事件。我們喜歡的一個(gè)玩笑是：“對(duì)于統(tǒng)計(jì)，數(shù)據(jù)可視化是一道毒品”——你可能都不會(huì)意識(shí)到自己在做統(tǒng)計(jì)，因?yàn)閿?shù)據(jù)可視化是如此善于在視覺(jué)上找規(guī)律、找異常。

　　數(shù)據(jù)可視化一直在一條更加民主化的軌道上。長(zhǎng)久以來(lái)，AI、機(jī)器學(xué)習(xí)有一項(xiàng)重大挑戰(zhàn)：如何讓我們?nèi)祟?lèi)理解超高維數(shù)據(jù)。這方面，Geoffrey Hinton 和同事們搞出的 t-SNE，堪稱(chēng)是 AI 領(lǐng)域的革命性數(shù)據(jù)可視化工具。它在數(shù)據(jù)可視化發(fā)展史上是一項(xiàng)相當(dāng)關(guān)鍵的里程碑。我和飛飛有類(lèi)似的感覺(jué)：我們正處于如何利用數(shù)據(jù)可視化技術(shù)推動(dòng) AI 進(jìn)步的起點(diǎn)。

　　話(huà)題二：AI 在當(dāng)下面臨的技術(shù)挑戰(zhàn)

　　Francoise Beaufays：語(yǔ)音識(shí)別從來(lái)都是基于機(jī)器學(xué)習(xí)，與更早期無(wú)關(guān)機(jī)器學(xué)習(xí)的技術(shù)沒(méi)什么關(guān)系。過(guò)去三十年間，機(jī)器學(xué)習(xí)技術(shù)一直在進(jìn)化，語(yǔ)音識(shí)別也不斷進(jìn)步，其中一個(gè)大轉(zhuǎn)折點(diǎn)是神經(jīng)網(wǎng)絡(luò)的采用。這距今不到八年，但基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別研究在很久以前就已開(kāi)始。只是由于計(jì)算能力的限制，這條路在產(chǎn)生大量成果之后被學(xué)界放棄，直到幾年前重新采用。這期間，語(yǔ)音識(shí)別基于更基礎(chǔ)的技術(shù)，仍然在發(fā)展提升，例如 Gaussian 混合模型。

　　在技術(shù)上，采用深度學(xué)習(xí)確是一項(xiàng)較艱巨的工作，牽扯到延遲、規(guī)模、訓(xùn)練能力等問(wèn)題。當(dāng)基于深度學(xué)習(xí)的語(yǔ)音識(shí)別技術(shù)在生產(chǎn)環(huán)境部署，這打開(kāi)了一扇嶄新的大門(mén)，背后是一系列的提升。另外，由于有了強(qiáng)大的計(jì)算硬件支持，我們能快速地從一個(gè)神經(jīng)網(wǎng)絡(luò)架構(gòu)轉(zhuǎn)換到另一個(gè)。因此，我們開(kāi)始探索 RNN（比如 LSTM）、CNN、基于 CTC 的序列建模等其他模型。簡(jiǎn)而言之，采用神經(jīng)網(wǎng)絡(luò)，為我們開(kāi)啟了在支撐谷歌產(chǎn)品的核心技術(shù)上不斷創(chuàng)新的新空間。

　　主持人：這是用于語(yǔ)音識(shí)別的神經(jīng)網(wǎng)路，我們?cè)賮?lái)聽(tīng)聽(tīng)能延長(zhǎng)壽命、讓我們更健康的神經(jīng)網(wǎng)絡(luò)。Daphne，給我們講講為什么 Calico Labs 需要你這位世界最頂級(jí)的分子生物學(xué)與機(jī)器學(xué)習(xí)專(zhuān)家之一，你在那做什么？

　　Daphne Kolller：很多人可能沒(méi)聽(tīng)說(shuō)過(guò) Calico，我們的曝光很少。做個(gè)簡(jiǎn)介，Calico 是最早剝離谷歌，直接歸屬 Alphabet 的子公司。Calico 的目標(biāo)是理解衰老，幫助人們活得更長(zhǎng)、更健康。

　　衰老其實(shí)是我們所面臨的最大的死亡風(fēng)險(xiǎn)，沒(méi)有之一。這對(duì)幾乎所有 40 歲之前發(fā)生的疾病都成立：當(dāng)患者一年一年老去，死于該病的風(fēng)險(xiǎn)會(huì)指數(shù)級(jí)得增長(zhǎng)，糖尿病、心腦血管疾病、癌癥均是如此。

　　但諷刺的是，沒(méi)人真正知道為什么。

　　沒(méi)人知道為什么在 40 歲之后，每一年過(guò)去，都會(huì)給我們?cè)黾铀烙谶@些疾病的風(fēng)險(xiǎn)。為了對(duì)此進(jìn)行理解，我們很有必要研究導(dǎo)致衰老的生物系統(tǒng)機(jī)制，從分子層面一直到系統(tǒng)層面。雖然我不認(rèn)為我們能永生，但也許通過(guò)技術(shù)手段介入，我們能活得更久更健康。

　　Calico 早期有一名研究人員，其研究顯示：僅僅某單個(gè)基因的變異，就能延長(zhǎng)機(jī)體 30%-50% 的壽命。而且，我們不僅會(huì)活得更長(zhǎng)，還會(huì)以更年輕的面貌、更飽滿(mǎn)的健康狀態(tài)生活。

　　但實(shí)現(xiàn)這些需要搞清楚許多尚不明了的東西，還需要收集所有生物系統(tǒng)在所有年齡狀態(tài)下的海量數(shù)據(jù)，包括酵母、蟲(chóng)子、蒼蠅、老鼠、人——為什么這些不同物種在分子層面發(fā)生著同樣的事？

　　幸運(yùn)的是，過(guò)去二十年間，科學(xué)家們發(fā)明出一整套衡量機(jī)制與方法，收集數(shù)據(jù)并試著幫我們理解衰老中的機(jī)體。這包括基因測(cè)序技術(shù)、微流體、跟蹤設(shè)備，記錄機(jī)體如何隨衰老發(fā)生變化。但是，沒(méi)人能把這些不同測(cè)量機(jī)制所產(chǎn)生的、從微分子層面一直到人口學(xué)層面的數(shù)據(jù)整合到一起。

　　如何整合所有信息，精確描繪出人體如何衰老的過(guò)程？

　　這就需要生物學(xué)家和機(jī)器學(xué)習(xí)專(zhuān)家之間的合作，后者能建立模型，整合所有信息。

　　我屬于少數(shù)極幸運(yùn)的人，能在該領(lǐng)域的萌芽時(shí)期就投身進(jìn)來(lái)：在 2000s 年早些時(shí)候開(kāi)始從事計(jì)算生物學(xué)（computational biology）。如果說(shuō)，我的機(jī)器學(xué)習(xí)算是母語(yǔ)造詣，我的生物學(xué)就在“流利”水平。這使我能夠與 Calico 的科學(xué)家們共事，在兩門(mén)學(xué)科之間建立真正的合作紐帶，開(kāi)發(fā)能結(jié)合兩個(gè)世界的優(yōu)點(diǎn)——大數(shù)據(jù)和人類(lèi)直覺(jué)的模型。

vivo結(jié)構(gòu)工程師vivo結(jié)構(gòu)工程師用什么軟件第1張

　　由于生物機(jī)體的復(fù)雜度實(shí)在太高，即便是今天這個(gè)量級(jí)的數(shù)據(jù)，我也不認(rèn)為僅用數(shù)據(jù)就能重建生物體從頭到尾的完整模型。正如我在講座的開(kāi)頭所講:數(shù)據(jù)，和頂級(jí)科學(xué)家的直覺(jué)，我們都需要；用以最終建立對(duì)衰老的深度理解，并預(yù)測(cè)有效的干預(yù)方式。

　　主持人：下面聊聊計(jì)算機(jī)視覺(jué)（CV）。飛飛，有次在 TechCrunch，你說(shuō) CV 是 AI 的殺手級(jí)應(yīng)用，你想表達(dá)什么？你一直提倡的 AI 民主化又是什么意思？這跟云計(jì)算有什么聯(lián)系？

vivo結(jié)構(gòu)工程師vivo結(jié)構(gòu)工程師用什么軟件第2張

　　李飛飛：我當(dāng)時(shí)是想推動(dòng)更多人認(rèn)識(shí)到這一點(diǎn)。我堅(jiān)信這一點(diǎn)。當(dāng)時(shí)的原話(huà)是：“很多人問(wèn) CV 的殺手級(jí)應(yīng)用是什么？我會(huì)說(shuō)：CV 本身就是殺手級(jí)應(yīng)用，AI 的殺手應(yīng)用?！?/p>

　　我會(huì)這么說(shuō)，有兩個(gè)理由：

五億四千萬(wàn)年前，生物進(jìn)化史上發(fā)生了濃墨重彩的一筆：由于某些不知名的原因，地球上的物種種類(lèi)從極少，一下子爆發(fā)為極多。這被看作是進(jìn)化史上的宇宙大爆炸——被稱(chēng)為寒武紀(jì)大爆發(fā)。對(duì)其背后的原因，生物學(xué)家迷惑了許多年。直到最近，一個(gè)非常有說(shuō)服力的理論浮出水面。這個(gè)猜想是：那時(shí)，生物進(jìn)化出了眼睛。一下子，動(dòng)物的生存變得主動(dòng)：有了獵食者，有了被獵食者，整個(gè)物種進(jìn)化軌跡從此天翻地覆。

　　今天，人類(lèi)是最智能的視覺(jué)動(dòng)物。大自然把我們腦容量的一半都分配給了視覺(jué)圖像處理，正是由于其重要性。

至于第二個(gè)理由，據(jù)估計(jì)，互聯(lián)網(wǎng)上超過(guò) 80% 的內(nèi)容，為視覺(jué)內(nèi)容。另外，傳感器收集的第一大數(shù)據(jù)形式，是由可見(jiàn)光或不可見(jiàn)光組成的圖像數(shù)據(jù)。無(wú)論在哪里，對(duì)于公司、消費(fèi)者來(lái)說(shuō)，以像素形式出現(xiàn)的數(shù)據(jù)都是最珍貴的。

　　和語(yǔ)音識(shí)別類(lèi)似，有了深度神經(jīng)網(wǎng)絡(luò)之后，CV 實(shí)現(xiàn)了多項(xiàng)突破和長(zhǎng)足進(jìn)步。在我看來(lái)，從 2010 到 2017 的七年間，CV 最主要的進(jìn)步發(fā)生在基礎(chǔ)的感知任務(wù)領(lǐng)域（perception task）：物體識(shí)別、圖像標(biāo)注、物體檢測(cè)等。我們也已經(jīng)有了應(yīng)用產(chǎn)品——谷歌照片（Google Photos）、自動(dòng)駕駛汽車(chē)的行人檢測(cè)系統(tǒng)等。

　　我認(rèn)為，下一波對(duì) CV 的投資，將集中于 “Vision+X”，即 CV 和其他領(lǐng)域的結(jié)合應(yīng)用。比如說(shuō)，視覺(jué)在溝通、語(yǔ)言中是如此重要，CV 和語(yǔ)言的結(jié)合，會(huì)非常有意思。醫(yī)療、生物領(lǐng)域的視覺(jué)應(yīng)用更不必說(shuō)。機(jī)器人是另一個(gè)有無(wú)限潛力的 CV 應(yīng)用領(lǐng)域。人類(lèi)研究機(jī)器人的歷史幾乎和 AI 一樣久，但現(xiàn)在，機(jī)器人仍處在一個(gè)非常原始的階段。究其原因，這在很大程度上是由于其原始的感知系統(tǒng)（想想寒武紀(jì)大爆炸）。

　　簡(jiǎn)而言之，我的確認(rèn)為視覺(jué)是機(jī)器智能最重要的構(gòu)成要素之一。

　　話(huà)題三：AI 在將來(lái)有什么趨勢(shì)？有哪些可供展望的愿景？

　　主持人：我們時(shí)間不多了，F(xiàn)ernanda，能否講講你眼中數(shù)據(jù)可視化的未來(lái)在哪里？

　　Fernanda Viegas：當(dāng)然。順著剛才飛飛的思路，既然人類(lèi)有這么復(fù)雜的視覺(jué)系統(tǒng)，我們不妨用它來(lái)理解機(jī)器做的事。機(jī)器學(xué)習(xí)運(yùn)行于海量的數(shù)據(jù)、統(tǒng)計(jì)數(shù)字、概率，在某種意義上，可視化是幫助我們理解這些東西的秘密武器。

　　為什么我們應(yīng)該重視數(shù)據(jù)可視化？這有三點(diǎn)：

可解釋性。你是否能解釋模型輸出的東西？

漏洞可修補(bǔ)性。更好地理解模型，能幫助你修補(bǔ)漏洞。

教育?？梢暬跈C(jī)器學(xué)習(xí)教學(xué)中扮演了重要角色。另外，如果我們利用可視化更好地理解了機(jī)器學(xué)習(xí)系統(tǒng)，我們能否從這些系統(tǒng)中學(xué)習(xí)，提升職業(yè)水平？

　　最后，我想講一個(gè)有意思的例子，我們用數(shù)據(jù)可視化發(fā)現(xiàn)了機(jī)器學(xué)習(xí)系統(tǒng)中原本并不知道的東西。前段時(shí)間，谷歌實(shí)現(xiàn)了 zero-shot 翻譯，即谷歌翻譯能處理未遇到過(guò)的語(yǔ)言組。研究人員對(duì)此產(chǎn)生了一個(gè)疑問(wèn)：該系統(tǒng)的多語(yǔ)種數(shù)據(jù)空間是按照何種規(guī)律分布的？比如說(shuō)，數(shù)據(jù)是按語(yǔ)種劃分？還是，系統(tǒng)把不同語(yǔ)種混到一起，“學(xué)到”了一些語(yǔ)法、語(yǔ)義的規(guī)律？

　　于是，我們開(kāi)發(fā)了一個(gè)數(shù)據(jù)可視化工具來(lái)進(jìn)行查看。結(jié)果發(fā)現(xiàn)，不同語(yǔ)種但相同語(yǔ)義的句子，組成同一個(gè)簇。不同句子形成一個(gè)個(gè)不同的簇，而無(wú)分語(yǔ)種。某種程度上，這可以說(shuō)是世界通用語(yǔ)言的雛形，我們把這成為“interlingual”，即“跨語(yǔ)言的”。另外，我們發(fā)現(xiàn)，哪些相對(duì)更隔離的簇，都是翻譯質(zhì)量不高的語(yǔ)句。這告訴了我們，數(shù)據(jù)空間的幾何分布是有涵義的。

　　目前為止，AI 仍讓人感覺(jué)到強(qiáng)烈的工程導(dǎo)向?qū)傩?。我很期待在將?lái)，藝術(shù)家、UI 設(shè)計(jì)師、科學(xué)家會(huì)為 AI 帶來(lái)什么，有哪些我們?nèi)聪氲竭^(guò)的可能性？這些會(huì)很值得探索。

　　主持人：Francoise，我想問(wèn)你數(shù)據(jù)可視化會(huì)如何幫助語(yǔ)音識(shí)別（笑）。但我同樣想問(wèn)你：如今數(shù)據(jù)越來(lái)越復(fù)雜，比如訓(xùn)練模型的標(biāo)記數(shù)據(jù)，還有越來(lái)越多的個(gè)性化，語(yǔ)音識(shí)別技術(shù)在走向何方？又有哪些令人興奮激動(dòng)的挑戰(zhàn)？

　　Francoise Beaufays：在語(yǔ)音識(shí)別領(lǐng)域，每當(dāng)遭遇一個(gè)新難題，我們必須要專(zhuān)注在它上面。我們開(kāi)發(fā) Youtube 兒童頻道的時(shí)候，就必須要專(zhuān)注于孩子的聲音——他們的說(shuō)話(huà)方式、音域、斷句方式都和成年人不一樣。最終，我們找到了把學(xué)習(xí)成果加入通用模型的方法。因而 Google Home 現(xiàn)在能與兒童正常交互。

　　對(duì)于我們而言，Google Home 又是一個(gè)新環(huán)境，我們需要收集新數(shù)據(jù)。有了新數(shù)據(jù)之后，將其導(dǎo)入模型進(jìn)行訓(xùn)練就變得簡(jiǎn)單直接。但是，第一次發(fā)布 Google Home 的時(shí)候，并沒(méi)有用戶(hù)數(shù)據(jù)。因此，我們做了許多模擬：采集數(shù)據(jù)，添加不同類(lèi)型的噪音，在數(shù)據(jù)上做不同類(lèi)型的混響（reverberation）。事實(shí)上，我們用的數(shù)據(jù)足以稱(chēng)得上是海量。我們轉(zhuǎn)錄了數(shù)萬(wàn)小時(shí)的語(yǔ)音，然后與模擬疊加增殖，最后導(dǎo)入模型的數(shù)據(jù)，相當(dāng)于是數(shù)個(gè)世紀(jì)的語(yǔ)音。

　　世界上有如此之多的語(yǔ)言，語(yǔ)言學(xué)家說(shuō)，光是使用人數(shù)在 10 萬(wàn)人以上的，就有 1342 種。我們?nèi)绾蜗蛉绱酥嗟恼Z(yǔ)種服務(wù)？這是一個(gè)需要在機(jī)器學(xué)習(xí)領(lǐng)域發(fā)揮很多創(chuàng)造性的難題。

　　李飛飛：我相信 AI 是第四次工業(yè)革命的驅(qū)動(dòng)力量之一。我從一個(gè)哲學(xué)家那里聽(tīng)來(lái)的、一句我最喜歡的話(huà)是這樣的：“獨(dú)立的機(jī)器價(jià)值觀并不存在，人類(lèi)價(jià)值觀就是機(jī)器價(jià)值觀”。我很期待在將來(lái)，來(lái)自各門(mén)學(xué)科的技術(shù)專(zhuān)家在 AI 領(lǐng)域發(fā)揮所長(zhǎng)，只有這樣，才能真正為全人類(lèi)開(kāi)發(fā) AI，而不是為一部分人而研發(fā)。

　　Daphne：作為一名頂級(jí)機(jī)器學(xué)習(xí)專(zhuān)家，如果在五年前，有人問(wèn)我五年后機(jī)器是否能像人類(lèi)一樣準(zhǔn)確用文字注解圖像，我會(huì)說(shuō)不可能，二十年后還差不多。但由于飛飛等科學(xué)家的努力，這一天比我預(yù)想的早很多就到來(lái)了。

　　我離開(kāi) Coursera 重回生物領(lǐng)域的原因，是因?yàn)槲艺J(rèn)為生物技術(shù)現(xiàn)在已經(jīng)到了指數(shù)級(jí)增長(zhǎng)曲線(xiàn)的那個(gè)拐點(diǎn)。如果我們看看人類(lèi)基因測(cè)序的歷史趨勢(shì)，其指數(shù)每七個(gè)月就翻倍，增長(zhǎng)速度是摩爾定律的兩倍。按照該趨勢(shì)預(yù)測(cè) 2025 年的接受了基因測(cè)序的人口數(shù)量，保守估計(jì)是 1 億，正常估計(jì)是 20 億。而這只是測(cè)序，還沒(méi)有包含 RNA、蛋白質(zhì)組、人體成像、細(xì)胞成像等等。

　　人體，是人類(lèi)迄今所遇見(jiàn)的最復(fù)雜系統(tǒng)。我認(rèn)為，我們正處于理解這一系統(tǒng)的開(kāi)端——到底是什么讓我們活著？什么讓我們邁向死亡？我認(rèn)為，有今天這一量級(jí)的數(shù)據(jù)以及不斷進(jìn)步的機(jī)器學(xué)習(xí)技術(shù)，我們完全有機(jī)會(huì)用 AI 革新科學(xué)。

　　報(bào)名 |【2017 AI 最佳雇主】榜單

　　在人工智能爆發(fā)初期的時(shí)代背景下，雷鋒網(wǎng)聯(lián)合旗下人工智能頻道AI科技評(píng)論，攜手環(huán)球科學(xué) 和 BOSS 直聘，重磅推出【2017 AI 最佳雇主】榜單。

　　從“公司概況”、“創(chuàng)新能力”、“員工福利”三個(gè)維度切入，依據(jù) 20 多項(xiàng)評(píng)分標(biāo)準(zhǔn)，做到公平、公正、公開(kāi)，全面評(píng)估和推動(dòng)中國(guó)人工智能企業(yè)發(fā)展。

　　本次【2017 AI 最佳雇主】榜單活動(dòng)主要經(jīng)歷三個(gè)重要時(shí)段：

　　2017.4.11-6.1 報(bào)名階段

　　2017.6.1-7.1 評(píng)選階段

　　2017.7.7 頒獎(jiǎng)晚宴

　　最終榜單名單由雷鋒網(wǎng)、AI科技評(píng)論、《環(huán)球科學(xué)》、BOSS 直聘以及 AI 學(xué)術(shù)大咖組成的評(píng)審團(tuán)共同選出，并于7月份舉行的 CCF-GAIR 2017大會(huì)期間公布。報(bào)名期間歡迎大家踴躍自薦或推薦心目中的最佳 AI 企業(yè)公司。

　　報(bào)名方式

　　如果您有意參加我們的評(píng)選活動(dòng)，可以點(diǎn)擊【閱讀原文】，進(jìn)入企業(yè)報(bào)名通道。提交相關(guān)審核材料之后，我們的工作人員會(huì)第一時(shí)間與您取得聯(lián)系。

　　【2017 AI 最佳雇主】榜單與您一起，領(lǐng)跑人工智能時(shí)代。

AI科技評(píng)論招聘季全新啟動(dòng)！

　　很多讀者在思考，“我和AI科技評(píng)論的距離在哪里？”答案就是：一封求職信。

　　AI科技評(píng)論自創(chuàng)立以來(lái)，圍繞學(xué)界和業(yè)界鰲頭，一直為讀者提供專(zhuān)業(yè)的AI學(xué)界、業(yè)界、開(kāi)發(fā)者內(nèi)容報(bào)道。我們與學(xué)術(shù)界一流專(zhuān)家保持密切聯(lián)系，獲得第一手學(xué)術(shù)進(jìn)展；我們深入巨頭公司AI實(shí)驗(yàn)室，洞悉最新產(chǎn)業(yè)變化；我們覆蓋A類(lèi)國(guó)際學(xué)術(shù)會(huì)議，發(fā)現(xiàn)和推動(dòng)學(xué)術(shù)界和產(chǎn)業(yè)界的不斷融合。

　　而你只要加入我們，就可以一起來(lái)記錄這個(gè)風(fēng)起云涌的人工智能時(shí)代！

　　如果你有下面任何兩項(xiàng)，請(qǐng)投簡(jiǎn)歷給我們：

　?。⒄Z(yǔ)好，看論文毫無(wú)壓力

　?。砉た苹蛐侣勏嚓P(guān)專(zhuān)業(yè)優(yōu)先，好鉆研

　?。獙?duì)人工智能有一定的興趣或了解

　　* 態(tài)度好，學(xué)習(xí)能力強(qiáng)

　　簡(jiǎn)歷投遞：

　　lizongren@leiphone.com

免責(zé)聲明：本站提供的任何內(nèi)容版權(quán)均屬于相關(guān)版權(quán)人和權(quán)利人，如有侵犯你的版權(quán)。請(qǐng)來(lái)信指出，我們將于第一時(shí)間刪除！所有資源均由免費(fèi)公共網(wǎng)絡(luò)整理而來(lái)，僅供學(xué)習(xí)和研究使用。請(qǐng)勿公開(kāi)發(fā)表或用于商業(yè)用途和盈利用途。
本文鏈接：http://dsdealer.com/jiegou/31275.html