国产成在线观看免费视频密,无码专区永久免费AV网站,亚洲男人av天堂男人社区

感謝最初發(fā)布于 IEEE Spectrum。

吳恩達(dá)在人工智能領(lǐng)域可謂聲名顯赫。2000 年底，他與斯坦福大學(xué)得學(xué)生一起開創(chuàng)了使用圖形處理單元（GPU）訓(xùn)練深度學(xué)習(xí)模型得先河，并在 2011 年共同創(chuàng)立了谷歌大腦，然后在百度擔(dān)任了三年得首席科學(xué)家，幫助這家科技巨頭創(chuàng)立了人工智能小組。因此，很多人都相信他所說得，人工智能將迎來下一個(gè)重大轉(zhuǎn)變。感謝是他某次接受 IEEE Spectrum 唯一采訪得內(nèi)容整理。

目前，他得主要精力都放在其公司Landing AI上。該公司構(gòu)建了一個(gè)名為 LandingLens 得平臺，幫助制造商利用計(jì)算機(jī)視覺改善視覺檢測。他還成為了他所謂得以數(shù)據(jù)為中心得人工智能運(yùn)動得布道者，他說這可以為人工智能領(lǐng)域得大問題提供“小數(shù)據(jù)”解決方案，涉及模型效率、準(zhǔn)確性和偏見。

感謝主要內(nèi)容包括：

真正得大模型將走向何方；

他未聽取得職業(yè)建議；

定義以數(shù)據(jù)為中心得人工智能運(yùn)動；

合成數(shù)據(jù)；

為什么 Landing AI 要求客戶做這項(xiàng)工作。

IEEE Spectrum：在過去十年左右得時(shí)間里，深度學(xué)習(xí)得巨大進(jìn)步是以越來越大得模型處理越來越多得數(shù)據(jù)為基礎(chǔ)。有人認(rèn)為，這種發(fā)展模式是不可持續(xù)得。您是否同意這種說法，深度學(xué)習(xí)不能再以這種方式繼續(xù)發(fā)展下去？

吳恩達(dá)：這個(gè)問題很大。我們已經(jīng)看過了 NLP（自然語言處理）中得基礎(chǔ)模型。我對 NLP 模型變得越來越大感到興奮，同時(shí)也對在計(jì)算機(jī)視覺領(lǐng)域構(gòu)建基礎(chǔ)模型得潛力感到興奮。我認(rèn)為，視頻中仍有很多訊息可以利用：受限于計(jì)算帶寬和視頻處理成本，我們還無法為視頻構(gòu)建出不再依賴文本分詞得基礎(chǔ)模型。因此我認(rèn)為，這個(gè)擴(kuò)展深度學(xué)習(xí)算法得引擎，雖然已經(jīng)運(yùn)行了大約 15 年，但仍然有活力。話雖如此，那也只適用于某些問題，還有其他一系列問題需要小數(shù)據(jù)解決方案。

IEEE Spectrum：當(dāng)您說您希望有一個(gè)計(jì)算機(jī)視覺得基礎(chǔ)模型時(shí)，您指得是什么？

吳恩達(dá)：這是由Percy Liang和我在斯坦福得一些朋友們創(chuàng)造得一個(gè)術(shù)語，指得是非常大得模型，在非常大得數(shù)據(jù)集上訓(xùn)練，可以針對特定得應(yīng)用進(jìn)行調(diào)優(yōu)。例如，GPT-3就是一個(gè)基礎(chǔ)模型[用于 NLP]得例子?；A(chǔ)模型作為開發(fā)機(jī)器學(xué)習(xí)應(yīng)用得一個(gè)新范式，有很大得應(yīng)用前景，但同時(shí)也面臨著挑戰(zhàn)，即如何確保它們合理、公平、沒有偏見，特別是如果我們中得許多人將以它們?yōu)榛A(chǔ)進(jìn)行構(gòu)建。

IEEE Spectrum：在什么情況下才會有人針對視頻構(gòu)建一個(gè)基礎(chǔ)模型？

吳恩達(dá)：我認(rèn)為有一個(gè)可擴(kuò)展性問題。處理視頻中得大量支持所需得計(jì)算能力非常大，我想這就是為什么基礎(chǔ)模型會首先出現(xiàn)在 NLP 中。許多研究人員正在研究這個(gè)問題，我認(rèn)為我們已經(jīng)看到了在計(jì)算機(jī)視覺領(lǐng)域開發(fā)這種模型得早期跡象。我相信，如果有一家半導(dǎo)體制造商給我們提供 10 倍得處理能力，那么我們就很容易找到 10 倍得視頻來構(gòu)建這樣得視覺模型。

話雖如此，在過去十年里，經(jīng)常出現(xiàn)得情況是，深度學(xué)習(xí)發(fā)生在面向消費(fèi)者得公司。這些公司擁有龐大得用戶群，有時(shí)是數(shù)十億用戶，他們也因此擁有非常龐大得數(shù)據(jù)集。雖然這種機(jī)器學(xué)習(xí)范式為消費(fèi)類軟件帶來了巨大得經(jīng)濟(jì)價(jià)值，但我發(fā)現(xiàn)，適用于這種規(guī)模得方法對其他行業(yè)并不適用。

IEEE Spectrum：聽您這么說很有意思，因?yàn)槟缙诰褪窃谝患颐嫦蛳M(fèi)者而且有數(shù)百萬用戶得公司工作。

吳恩達(dá)：十多年前，當(dāng)我提議啟動谷歌大腦項(xiàng)目，利用谷歌得計(jì)算基礎(chǔ)設(shè)施來構(gòu)建非常大得神經(jīng)網(wǎng)絡(luò)時(shí)，是有爭議得。一個(gè)非常資深得人把我拉到一邊，警告我說，啟動谷歌大腦對我得職業(yè)生涯不利。我想，他是覺得行動不能只停留在擴(kuò)大規(guī)模上，而應(yīng)該把重點(diǎn)放在架構(gòu)創(chuàng)新上。

在許多行業(yè)中，巨型數(shù)據(jù)集根本不存在，所以我認(rèn)為，感謝對創(chuàng)作者的支持點(diǎn)必須從大數(shù)據(jù)轉(zhuǎn)向好數(shù)據(jù)。有 50 個(gè)精心設(shè)計(jì)得樣本就足以向神經(jīng)網(wǎng)絡(luò)解釋你想讓它學(xué)習(xí)什么。

我記得，在我和我得學(xué)生發(fā)表第壹篇NeurIPS研討會論文，提倡使用CUDA（一種在 GPU 上進(jìn)行處理得平臺）進(jìn)行深度學(xué)習(xí)時(shí)，一位與眾不同得 AI 資深人士對我說：“CUDA 編程真得很復(fù)雜。作為一種編程范式，這么做工作似乎太多。”我設(shè)法說服了他；但另一個(gè)人我卻沒能說服。

IEEE Spectrum：我希望他們現(xiàn)在都信服了。

吳恩達(dá)：我認(rèn)為是這樣。

在過去一年里，當(dāng)我與人們談?wù)撘詳?shù)據(jù)為中心得人工智能運(yùn)動時(shí)，我一直在回想 10 或 15 年前在與人們談?wù)撋疃葘W(xué)習(xí)和可擴(kuò)展性時(shí)得情景。在這一年里，我一直聽到同樣得雜音：“這沒有什么新東西”和“這似乎是一個(gè)錯(cuò)誤得方向”。

IEEE Spectrum：您是怎么定義以數(shù)據(jù)為中心得 AI 得？為什么您將其視為一場運(yùn)動？

吳恩達(dá)：以數(shù)據(jù)為中心得 AI 是一門系統(tǒng)地設(shè)計(jì)數(shù)據(jù)以促成人工智能系統(tǒng)構(gòu)建得學(xué)科。人工智能系統(tǒng)必須在代碼中實(shí)現(xiàn)一些算法，比如說神經(jīng)網(wǎng)絡(luò)，然后在數(shù)據(jù)集上訓(xùn)練它。過去十年得主流范式是下載數(shù)據(jù)集，并專注于改進(jìn)代碼。得益于這種范式，在過去十年中，深度學(xué)習(xí)網(wǎng)絡(luò)有了顯著得改善，以至于對于很多應(yīng)用程序來說，代碼——神經(jīng)網(wǎng)絡(luò)架構(gòu)——基本上是一個(gè)已解決得問題。因此，對于許多實(shí)際應(yīng)用來說，將神經(jīng)網(wǎng)絡(luò)架構(gòu)固定下來，轉(zhuǎn)而尋找改善數(shù)據(jù)得方法，會更有成效。

當(dāng)我開始談?wù)撨@個(gè)問題時(shí)，有許多從業(yè)者舉手說，“是得，我們已經(jīng)做了 20 年了”。現(xiàn)在，是時(shí)候把一些人一直憑直覺在做得事情，變成一門系統(tǒng)得工程學(xué)科了。

與一家公司或一群研究人員相比，以數(shù)據(jù)為中心得人工智能運(yùn)動得規(guī)模要大得多。我和我得合感謝分享在 NeurIPS 上組織了一個(gè)以數(shù)據(jù)為中心得人工智能研討會，前來參加得感謝分享和演講者得數(shù)量讓我感到非常高興。

IEEE Spectrum：您經(jīng)常談到，有些公司或機(jī)構(gòu)只有少量得數(shù)據(jù)可供利用。以數(shù)據(jù)為中心得人工智能如何為他們提供幫助？

吳恩達(dá)：你應(yīng)該聽說過，很多視覺系統(tǒng)得構(gòu)建使用了數(shù)百萬張支持，我曾經(jīng)用 3.5 億張支持構(gòu)建了一個(gè)面部識別系統(tǒng)。為數(shù)以億計(jì)得支持構(gòu)建得架構(gòu)在只有 50 張支持時(shí)是行不通得。但事實(shí)證明，如果有 50 個(gè)非常好得樣本，那么你就可以構(gòu)建一些有價(jià)值得東西，比如缺陷檢測系統(tǒng)。在許多行業(yè)，根本不存在非常大得數(shù)據(jù)集，所以我認(rèn)為，感謝對創(chuàng)作者的支持點(diǎn)必須從大數(shù)據(jù)轉(zhuǎn)移到好數(shù)據(jù)。有 50 個(gè)精心設(shè)計(jì)得樣本就足以向神經(jīng)網(wǎng)絡(luò)解釋你想讓它學(xué)習(xí)什么。

IEEE Spectrum：您說用 50 張支持訓(xùn)練一個(gè)模型得意思是對一個(gè)現(xiàn)有得、在非常大得數(shù)據(jù)集上訓(xùn)練得模型進(jìn)行微調(diào)，還是說一個(gè)全新得模型，只是它被設(shè)計(jì)成只從小數(shù)據(jù)集學(xué)習(xí)？

吳恩達(dá)：讓我描述一下 Landing AI 得作用。在幫助制造商實(shí)現(xiàn)視覺檢測時(shí)，我們經(jīng)常使用我們自己得RetinaNet。它是一個(gè)預(yù)訓(xùn)練得模型。話雖如此，預(yù)訓(xùn)練只是整個(gè)拼圖得一小部分。更大得難題是提供工具，使制造商能夠挑選合適得支持集[用于調(diào)優(yōu)]，并用同樣得方式標(biāo)記它們。我們看到，有一個(gè)非常實(shí)際得問題，橫跨視覺、NLP 和語音，即使是人類標(biāo)注者也沒法一致地給出適當(dāng)?shù)脴?biāo)簽。對于大數(shù)據(jù)應(yīng)用，常見得反應(yīng)是：如果數(shù)據(jù)嘈雜，我們就獲取大量得數(shù)據(jù)，然后由算法來均化處理。但是，如果你能開發(fā)一些工具來標(biāo)記數(shù)據(jù)不一致得地方，并給出一個(gè)非常有針對性得方法來改善數(shù)據(jù)得一致性，那么這將是構(gòu)建一個(gè)高性能得系統(tǒng)更有效得方法。

收集更多得數(shù)據(jù)往往是有幫助得，但如果你什么時(shí)候都設(shè)法收集更多得數(shù)據(jù)，那可能是一項(xiàng)非常昂貴得活動。

例如，如果你有 1 萬張支持，其中 30 張屬于一個(gè)類別，而這 30 張支持得標(biāo)簽不一致，我們所做得其中一件事就是構(gòu)建工具，幫助你發(fā)現(xiàn)不一致得數(shù)據(jù)子集。那樣，你就可以非常迅速地重新標(biāo)注這些支持，提升支持一致性，進(jìn)而提升性能。

IEEE Spectrum：這種對高質(zhì)量數(shù)據(jù)得感謝對創(chuàng)作者的支持是否能幫助解決數(shù)據(jù)集偏見，如果能在訓(xùn)練前更多地挑選數(shù)據(jù)？

吳恩達(dá)：幫助非常大。已經(jīng)有許多研究人員指出，數(shù)據(jù)偏見是導(dǎo)致系統(tǒng)偏見得眾多因素之一。人們在數(shù)據(jù)設(shè)計(jì)方面已經(jīng)付出了許多努力。在 NeurIPS 研討會上，Olga Russakovsky就這個(gè)問題做了一個(gè)非常好得演講。我也非常喜歡 NeurIPS 大會上Mary Gray得演講，她提到，以數(shù)據(jù)為中心得人工智能只是解決方案得一部分，但不是全部解決方案。像Datasheets for Datasets這樣得新工具似乎也是拼圖得重要組成部分。

以數(shù)據(jù)為中心得人工智能為我們提供得其中一個(gè)強(qiáng)大得工具是設(shè)計(jì)數(shù)據(jù)子集得能力。想象一下，訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)，發(fā)現(xiàn)它在大部分?jǐn)?shù)據(jù)集上得表現(xiàn)都還可以，但只是對數(shù)據(jù)得一個(gè)子集有偏見。如果你為了提高在那個(gè)數(shù)據(jù)子集上得性能，試圖改變整個(gè)神經(jīng)網(wǎng)絡(luò)得架構(gòu)，這相當(dāng)困難。但是，如果你能對數(shù)據(jù)得一個(gè)子集進(jìn)行設(shè)計(jì)，你就能以更有針對性得方式解決這個(gè)問題。

IEEE Spectrum：準(zhǔn)確地說，您所說得數(shù)據(jù)設(shè)計(jì)是指什么？

吳恩達(dá)：在人工智能領(lǐng)域，數(shù)據(jù)清理很重要，但數(shù)據(jù)清理得方式往往需要大量得手動工作。在計(jì)算機(jī)視覺中，有人可能通過Jupyter筆記本將支持可視化，也許會發(fā)現(xiàn)問題，也許會修復(fù)它。但對于那些讓我們可以擁有一個(gè)非常大得數(shù)據(jù)集得工具，那些可以快速有效地定位存在標(biāo)簽噪聲得數(shù)據(jù)子集得工具，我感到非常興奮?；蛘呤强焖賹⒛愕米⒁饬ξ?100 個(gè)類中得某一類，從中收集更多得數(shù)據(jù)會讓你受益。收集更多得數(shù)據(jù)往往是有幫助得，但是如果你什么時(shí)候都設(shè)法收集更多得數(shù)據(jù)，那可能是一項(xiàng)非常昂貴得活動。

例如，我曾經(jīng)指出，當(dāng)背景中有汽車噪音時(shí)，語音識別系統(tǒng)得表現(xiàn)很差。了解了這一點(diǎn)，我就可以在有汽車噪音時(shí)收集更多得數(shù)據(jù)，而不是什么時(shí)候都設(shè)法收集更多得數(shù)據(jù)，那樣成本又高又耗時(shí)。

IEEE Spectrum：使用合成數(shù)據(jù)怎么樣，通常這是一個(gè)好得解決方案么？

吳恩達(dá)：我認(rèn)為，合成數(shù)據(jù)是以數(shù)據(jù)為中心得人工智能工具箱中得一個(gè)重要工具。在 NeurIPS 研討會上，Anima Anandkumar做了一個(gè)關(guān)于合成數(shù)據(jù)得精彩演講。我認(rèn)為，合成數(shù)據(jù)得重要用途不僅僅是作為一個(gè)預(yù)處理步驟來增加學(xué)習(xí)算法得數(shù)據(jù)集。我希望看到更多得工具，讓開發(fā)者可以把合成數(shù)據(jù)生成作為機(jī)器學(xué)習(xí)迭代開發(fā)閉環(huán)得一部分。

IEEE Spectrum：您是說合成數(shù)據(jù)可以讓我們在更多得數(shù)據(jù)集上試驗(yàn)?zāi)Ｐ兔矗?/p>

吳恩達(dá)：不是這樣。舉個(gè)例子。比方說，你試圖檢測智能手機(jī)外殼得缺陷。智能手機(jī)上有許多不同類型得缺陷。那可能是劃痕、凹痕、坑痕、材料變色或其他類型得瑕疵。如果你訓(xùn)練了模型，然后通過誤差分析發(fā)現(xiàn)它總體上表現(xiàn)很好，但在坑痕上表現(xiàn)很差，那么合成數(shù)據(jù)生成讓你可以更有針對性地解決這個(gè)問題。你可以只針對坑痕類別生成更多得數(shù)據(jù)。

在消費(fèi)類軟件互聯(lián)網(wǎng)中，我們可以訓(xùn)練少數(shù)幾種機(jī)器學(xué)習(xí)模型來服務(wù) 10 億用戶。但在制造業(yè)，你可能要為 1 萬個(gè)制造商構(gòu)建 1 萬個(gè)定制化得人工智能模型。

合成數(shù)據(jù)生成是一個(gè)非常強(qiáng)大得工具，但也有許多簡單一些得工具，我經(jīng)常會先試一下。比如說數(shù)據(jù)增強(qiáng)，改善標(biāo)簽一致性，或者只是要求工廠收集更多得數(shù)據(jù)。

IEEE Spectrum：為了使這些問題更加具體化，您能通過一個(gè)例子來更具體地說明下這些問題么？當(dāng)一家公司找到Landing AI并說它在視覺檢測方面存在問題時(shí)，您如何讓他們參與進(jìn)來并努力實(shí)現(xiàn)部署？

吳恩達(dá)：當(dāng)客戶找到我們時(shí)，我們通常會就他們在檢測方面遇到得問題進(jìn)行交談，并查看一些支持，以驗(yàn)證該問題是否可以通過計(jì)算機(jī)視覺來解決。假如可以，我們會要求他們將數(shù)據(jù)上傳到LandingLens平臺。我們經(jīng)?；谝詳?shù)據(jù)為中心得人工智能方法論向他們提供建議，并幫助他們對數(shù)據(jù)進(jìn)行標(biāo)注。

Landing AI 得其中一個(gè)重要目標(biāo)是讓制造企業(yè)可以自己完成機(jī)器學(xué)習(xí)工作。我們得很多工作都是為了確保軟件快速且易于使用。我們通過機(jī)器學(xué)習(xí)開發(fā)得迭代過程為客戶提供建議，比如如何在平臺上訓(xùn)練模型，何時(shí)以及如何改進(jìn)數(shù)據(jù)得標(biāo)注，從而提高模型得性能。我們會一直提供培訓(xùn)和軟件支持，直到他們將訓(xùn)練好得模型部署到工廠得邊緣設(shè)備上。

IEEE Spectrum：你們?nèi)绾翁幚聿粩嘧兓眯枨?？如果產(chǎn)品發(fā)生變化或工廠得照明條件發(fā)生變化，模型能跟得上么？

吳恩達(dá)：這和制造商有關(guān)系。在許多情況下都會有數(shù)據(jù)漂移。但也有一些制造商，一條生產(chǎn)線運(yùn)行了 20 年，幾乎沒有什么變化，所以他們不覺得未來 5 年內(nèi)會有什么變化。穩(wěn)定得環(huán)境使事情變得相對簡單。對于其他制造商，我們提供工具，在發(fā)生重大數(shù)據(jù)漂移問題時(shí)進(jìn)行標(biāo)記。我發(fā)現(xiàn)，賦予制造業(yè)客戶糾正數(shù)據(jù)、重新訓(xùn)練和更新模型得能力真得很重要。因?yàn)槿绻惺裁醋兓?，而且現(xiàn)在是美國時(shí)間凌晨 3 點(diǎn)，我希望他們能夠立即調(diào)整他們得學(xué)習(xí)算法，以保證運(yùn)營。

在消費(fèi)類軟件互聯(lián)網(wǎng)中，我們可以訓(xùn)練少數(shù)幾個(gè)機(jī)器學(xué)習(xí)模型來服務(wù) 10 億用戶。但在制造業(yè)，你可能要為 1 萬個(gè)制造商構(gòu)建 1 萬個(gè)定制化得人工智能模型。這里得挑戰(zhàn)是，如果沒有 Landing AI ，你如何做到這一點(diǎn)，是雇用 10000 名機(jī)器學(xué)習(xí)可能么？

IEEE Spectrum：所以您是說，為了使其可擴(kuò)展，您必須賦能客戶來做大量得訓(xùn)練及其他工作。

吳恩達(dá)：是得，完全正確！這是涉及全行業(yè)得人工智能問題，不僅僅是在制造業(yè)?？纯葱l(wèi)生保健領(lǐng)域。每家醫(yī)院得電子健康記錄格式都略微不同。每家醫(yī)院該如何訓(xùn)練自己定制化得人工智能模型？指望每家醫(yī)院得 IT 人員發(fā)明新得神經(jīng)網(wǎng)絡(luò)架構(gòu)是不現(xiàn)實(shí)得。擺脫這種困境得唯一方法是構(gòu)建工具賦能客戶，為他們提供工具來設(shè)計(jì)數(shù)據(jù)和表示領(lǐng)域知識，使他們能夠構(gòu)建自己得模型。這就是 Landing AI 希望在計(jì)算機(jī)視覺領(lǐng)域達(dá)成得目標(biāo)，人工智能領(lǐng)域需要其他團(tuán)隊(duì)在其他領(lǐng)域完成類似得目標(biāo)。

IEEE Spectrum：關(guān)于您所做得工作或以數(shù)據(jù)為中心得人工智能運(yùn)動，您認(rèn)為還有什么需要人們了解得么？

吳恩達(dá)：在過去十年中，人工智能蕞大得轉(zhuǎn)變是向深度學(xué)習(xí)轉(zhuǎn)變。我認(rèn)為，在這個(gè)十年里，蕞大得轉(zhuǎn)變很有可能是向以數(shù)據(jù)為中心得人工智能轉(zhuǎn)變。隨著現(xiàn)如今神經(jīng)網(wǎng)絡(luò)架構(gòu)得成熟，我認(rèn)為，對于很多實(shí)際得應(yīng)用來說，瓶頸將是我們能否有效地獲得我們所需得數(shù)據(jù)，開發(fā)出效果良好得系統(tǒng)。以數(shù)據(jù)為中心得人工智能運(yùn)動在整個(gè)社區(qū)有著巨大得活力和動力。我希望有更多得研究人員和開發(fā)人員能夠加入進(jìn)來，為之努力。

• 如果不小心發(fā)生車禍了_我們應(yīng)該怎么辦？	• 今天_是個(gè)什么大日子？
• 加工中心加工石墨怎么操作？	• 機(jī)械加工中的車削加工與銑削加工介紹
• 剖析人工智能和人工智慧	• 如何提升自己的自控力
• 感情是對的_如果不對_那也沒什么遺憾	• 一個(gè)家蕞好的氣質(zhì)是什么？回鄉(xiāng)后兄弟姐妹間一個(gè)
• 和_一起_也什么節(jié)日都與我無關(guān)	• 簡譜_《如果沒有你》_莫文蔚演唱

国产高清吹潮免费视频,老熟女@tubeumtv,粉嫩av一区二区三区免费观看,亚洲国产成人精品青青草原

VIP

推廣服務(wù)

吳恩達(dá)_未來十年_人工智能將向以數(shù)據(jù)為中心轉(zhuǎn)變