隨著人工智慧(artificial intelligence,AI)的高速發展,許多人不清楚各種數據分析之間的差異以及它們如何推動業務。例如,機器學習(machine learning,ML)和深度學習(deep learning,DL)之間的區別對於行外人可能有點混淆,但是對於收集了大量數據並想充分利用它們的公司來說,這兩項就完全不同了。
來聽聽Taboola的創始人兼CEO辛格達(Adam Singolda)的見解。以下為他撰寫的專欄。(譯者注:Taboola是一家創立於以色列,目前總部位於美國紐約的內容搜索引擎和內容推薦平臺公司。)
機器學習和深度學習的區別
你一定聽到過這樣的問答:
問:你如何完成你的日常事務的?
答:“人工智慧”(AI)。
幾乎每天都會有消息稱某家公司進軍人工智慧。雖然人工智慧的價值在Cortana或Spotify等消費技術產品中不言而喻,但它真的能讓牙刷銷售商、漢堡連鎖店、甚至是說唱樂一代都從中受益嗎?
只要是家公司就能貼上人工智慧的標籤嗎?我們如何區分真正的深度學習與科幻小說(science fiction, SF)之間的區別?
讓我們先從定義一些關鍵術語開始。當前,有兩種非常流行的方法經常被混淆或互換使用:傳統的機器學習和深度學習,都被稱為AI。
機器學習要求工程師預先在數據中定義他們要尋找的模型特徵,(如“這樣做的人也做了那個”)。而深度學習則交替使用先進的“神經網路”,主動發現新模型,並不斷完善。更重要的是,它讓工程師使用一種完全不同的工程思維方式,我們可以將其稱為“魔法”。
傳統的機器學習不是AI
只有深度學習是AI。但大多數公司其實並不使用深度學習/AI。
近年來,神經網路推動了一些真正突破性的日常生活改變。 Facebook的自動翻譯服務讓人們只需點擊一下滑鼠就能切換語言,這預示著語言障礙的時代已成為過去。 但為什麼只限制於文字語言呢?
終有一天,深度學習的模型識別功能或可幫助推斷出嬰兒、甚至寵物想表達但無法用語言表達的內容。在醫學領域,生物識別軟體已經在人與設備之間建立了更加無縫的連接,幫助醫生在疾病出現或轉移之前更好地診斷。基於深度學習的電腦影像技術很快將使馬斯克(Elon Musk,特斯拉(Tesla, TSLA-US)總裁)的自動駕駛汽車的夢想成為現實。
鑒於這種革命性的潛力,相信每個人都會在在他們的專業領域或商業計畫中添加AI,無人例外。麥肯錫預測,到2020年,人工智慧將創造超過13萬億美元的市值。以 Netflix 和 IBM 等公司,或是Cortana和Alexa這樣的產品為例,人工智慧個性化經濟已擁有數百億的規模,使人們能夠更好地管理日常生活。
但是,與任何爆紅商機一樣,我們都應該警惕那些炒作。雖然傳統的機器學習技術目前在各行業都很常見,甚至在高中工程課中都有課程安排,但真正的深度學習方法其實極難見到。
如何辨別AI
正如Taboola的深度學習 / AI負責人查梅爾(Gil Chamiel)告訴我的那樣,要實現真正的深度學習需要滿足三點。這三點可以幫助你辨別這項技術到底是人工智慧還是科幻小說。
前兩點可能相對簡單,但也並不總是很容易。第三點才是“黑色岩漿”,是魔法的關鍵所在:
- 獲得數據和活動
- 計算能力
- 思維方式
我們來逐一分析。首先,只有在存在某種環境活動閾值時,深度學習才有效。為了使神經網路能夠發現新的模型,就需要有大量數據,這些數據可以透過反覆試驗來處理和分類。這些輸入的數據會因公司和行業而異:例如,沃爾瑪(Walmart, WMT-US)可能會分析每月進入商店或訪問其網站的100多萬人的數據,而特斯拉可能會關注數千輛汽車在行駛時產生的回饋數據。
第二點,假設你已經擁有一定量的有意義的數據,那第二個需要的就是計算能力。雖然過去這對公司來說非常昂貴,所幸目前已有了一系列更節省成本的選擇。企業現在可以從Azure等雲端服務租用雲空間,而不必再投資建立全新的數據中心。
第三,也是最重要的一點,你需要採用一種新的敏捷的方法思考和解決問題,你需要一種新的思維方式。你要尋找那些更耐心、更堅持不懈的工程師,他們會願意適時地放棄一些對演算法的控制。
機器學習方法要求團隊提前設計解決方案,預先確定關鍵因素(比如設計自動駕駛汽車時,需要先確定障礙物形狀或溫度);在深度學習世界中,工程師必須提前設計出那些關於新因素的演算法,而這些因素可能是我們從未想到過的。例如,汽車的重量,或風暴,或其他10個人們事先沒有想到的因素。
比如在人臉識別領域,機器學習世界中的工程師必須在邊緣檢測和對象分割上投入更多,以便讓系統自主地識別圖像中可能的面部位置,並將該資訊傳遞給學習演算法。在深度學習 / AI世界中,工程師將允許演算法以某種方式查看許多面部特徵併發現那些有意義的屬性,比如眼睛的顏色或其他更多屬性。
未來已來
這種思維方式的轉變有些類似於20世紀80年代物件導向程式設計(OOP)的興起,這種在C ++和Java中常見的繼承式寫程式的方法,與之前的C或Pascal這類更多程式化的方法就完全不同。
當你試圖解決大量翻譯,或無人駕駛的問題,如果你使用機器學習,你會花很長時間來考慮重要數據中的所有因素,你需要構建演算法來做這些,而你很可能會失敗。 深度學習和先進模型的興起是一次革命性的進步,它加速了那些針對以前無法解決的問題的技術解決方案的出現,在如何解決問題的思維方式上邁出了重要一步。
AI的突破長期以來一直讓普通人難以捉摸。自從IBM的深藍電腦(Deep Blue)打敗了世界國際象棋冠軍,並提出AI伴侶的概念至今,已有20多年了。直到近年AI才終於迎來了革命性進展。
預測技術已為我們節省了大量時間和金錢,在某些情況下甚至能救命。例如,醫院正在使用預測技術,透過識別高風險病例並配以額外服務,如出院後家訪等,來減少再住院的概率。雖然這些應用還處於早期階段,且實際上真正在推動人工智慧的公司並不多,但毫無疑問變化正在發生。
一場革命即將到來,未來比我們想像中來的更早。未來的世界,將有更多的深度學習/AI,而不是機器學習,更不是科幻片。