AI 商業落地? 2024 十大方向有這些!你覺得哪幾個會實現?
收藏文章
很開心您喜歡 虎嗅網 的文章, 追蹤此作者獲得第一手的好文吧!
虎嗅網
字體放大


分享至 Line

分享至 Facebook

分享至 Twitter


 AI 商業落地? 2024 十大方向有這些!你覺得哪幾個會實現?

2024 年 1 月 10 日

 
展開

轟轟烈烈的 2023 年 AIGC 元年結束了,心情有點複雜,在國內,和年初 ChatGPT 迅速崛起帶來的全民興奮相比,AI 並沒有為一般人的生活帶來太多改變,AI 這個當之無愧的下一代資訊科技革命,沒像上一波行動網路浪潮中的微信和滴滴叫車,在一年的時間裡實現「一夜春風來、萬樹梨花開」式的商業滲透。認真使用 AI 工具的人不多,現象級的 AI 產品完全沒有出現。

在海外, ChatGPT 以迅雷不及掩耳的速度斬獲 1.8 億用戶, AI 繪圖軟體 MidJourney 獲得超 1500 萬用戶和數億美元營收;微軟(Microsoft, MSFT-US)的 GitHub 寫程式助手 Copilot 在 9 月份付費用戶已超百萬(含 3 萬 7 千個組織訂閱),多個小型 APP 號稱獲得數百萬美元的訂閱收入。

在矽谷和華爾街,逢人必談 AI 。美股在 AI 晶片霸主輝達(NVIDIA, NVDA-US)和 AI 應用先鋒微軟的帶領下,日日創出新高,不誇張地說,若無 AI ,美國可能已陷入經濟衰退;有了 AI ,美國走在了新一輪泡沫的路上。

比爾蓋茲認為:在像美國這樣的高收入國家,距離一般大眾使用人工智慧達到顯著水準還有 18 到 24 個月的時間。在非洲,他預計在三年左右的時間裡會看到類似的使用水準。據此預測, 2024 年美國將達到人工智慧的「普惠」狀態。

中國和美國的人工智慧差距正在拉大。由於對輝達 GPU 的禁令,全世界最緊俏的商品變成了輝達的 GPU 或平替,甚至有人不恰當地將 GPU 比喻為超過毒品的新一代最暴利走私品,就像爭奪土地、石油、黃金的戰爭一樣,人工智慧算力、演算法變成了大國軍備的新戰場,也成為企業家和創業家的兵家必爭之地。

10 個 AI 在實際需求案例上落地的方向

時不我待,何以勝出?下文我主要採用 AI 在醫療、金融等專業領域的實際需求案例,探討 AI 在 2024 年從科技到產品商業落地的 10 個方向:

  1. 更強的多樣態交互作用
  2. 可解釋性更強的人工智慧
  3. 更強的搜尋增強產生
  4. 構造自動代理生態
  5. 更強、更經濟節能的算力
  6. 更快的 AI 平民化進程
  7. AI 與 Web3 結合的破局
  8. 打磨用戶所需的「小」產品
  9. AI 能力帶入數據,而不是相反
  10. 獲取用戶對 AI 的信任

一、更強的多樣態交互

多樣態互動類似人類的多維感官能力。多樣態人工智慧可以交叉處理和分析文字、圖像、語音等多種資料類型。這種融合不同模式的方法使機器能夠全面且立體地理解世界。

去年聖誕節,很多賀卡由 AI 產生。這是從文字產生的圖片和影片。從文字產生音樂和歌曲還不成熟。 GPT4.0 的語音對話相當給力,可以直接用中文和它對話。美中不足的是,總覺得 GPT 的中文發音是台灣人夾雜海外華人的腔調,有點像王力宏。

以醫療領域的需求來看,病人拿到血常或腫瘤指標檢查報告,想知道異常指標的意義。對自己負責的病人會上網搜尋每個指標的意思。入冬以來兒童夾雜肺炎和流感,許多焦慮的家長會搜尋檢查結果的意義,往往費時費力,找不到準確的解讀。

多樣模態技術的發展,可以讓使用者拍照上傳檢查報告, AI 辨識照片中的指標、搜尋知識庫、給出每個指標的意義,然後用語音告訴可能的診斷。這種體驗太棒了。

在金融領域,如果上傳一張 K 線圖, AI 就能辨識出其形態,則可以大幅提昇技術分析投資者的效率。在晶片設計或建築設計領域,如果能讓 AI 讀懂設計圖,再設計出新的設計圖,那就更厲害了;在非專業領域,多樣態會大幅提高數位影像、短影片製作的效率,並豐富這些應用的使用情境。

二、可解釋性更強的人工智慧

可解釋的人工智慧的目標在於提高 AI 決策過程的透明度和可理解性,以便更能理解AI如何做出決策,目前的 AI 決策過程往往被視為一個「黑盒子」,使用者無法了解模型得出結論的內在邏輯。
大型語言模型最強大且是最神秘的「湧現」能力,亦無法被解釋。無法被解釋的決策過程,不可能在專業商業領域中獲得信任。

AI 看完檢查報告,可以給用藥建議。如果不知道這個用藥建議是基於何種知識,也不知道 AI 做出推理和判斷的過程,相信沒有人敢用 AI 開出的藥方。生命不能作 AI 機率遊戲的試驗品。

「如果換算成特斯拉(Tesla, TSLA-US)的行駛里程, 7,200 兆瓦時可以行駛多少公里?」

AI會告訴我它的邏輯:

為了估算 7,200 兆瓦時(MWh)的電力可以讓特斯拉汽車行駛多少公里,我們需要知道特斯拉汽車的能源效率。以特斯拉 Model 3 為例,其能源效率約為 15 千瓦時/ 100 公里(即 0.15 千瓦時/公里)
我們可以透過以下公式計算行駛里程:
總行駛里程 = 總電能(千瓦時) /每公里耗電量(千瓦時/公里)
現在我們可以計算 7,200 兆瓦時(即 7,200,000 度)可以讓特斯拉汽車行駛多少公里。我將進行計算(此處, AI 寫 Python 程式碼進行計算)。
使用 7,200 兆瓦時的電能,一個特斯拉 Model 3  理論上可以行駛約 4,800 萬公里。

以上, AI 展示了一個完整的、可解釋的 AI 推導。用戶可以對每一步檢查、糾錯,AI 在嚴密的數學推理已經取得某些突破。

近期,數學大神陶哲軒成功地用 AI 工具完成了形式化多項式 Freiman-Ruzsa 猜想證明過程的工作,陶哲軒大聲呼籲,數學家一定要用 AI ,可解釋的人工智慧的實現需要開發新的演算法和工具,透過視覺化技術、自然語言解釋或簡化決策邏輯的表示,以提供關於 AI 決策過程的深入洞察。

綜和上述,可解釋的人工智慧在醫療、科學研究等專業領域具有巨大的商業應用價值。在這些領域,決策的透明度和可信度至關重要, AI 的大規模嚴肅應用必須在較高的置信度上給客戶以流程控制和品質控制的選項和權利。

三、更強的搜尋增強產生

搜尋增強產生(Retrieval-Augmented Generation,簡稱 RAG )是一種結合了資訊檢索和文字產生的 AI 技術。它旨在透過從「外部」資料來源檢索資訊來增強和改善產生模型的輸出品質。

RAG 使得大型語言模型能夠存取外部訊息,幫助它們產生更準確、更具上下文意識的回應,其目標在於提高語言模型產生內容的準確性和相關性;在 RAG 系統中,當模型接收到一個查詢時,首先執行一個檢索步驟,尋找與查詢相關的資訊。然後,這些相關資訊被融入產生過程,實現產生內容準確性和相關性的顯著改善。

以病人的需求為例,我的朋友曾親自嘗試 ChatGPT 4.0 搜尋增強的能力。病人服藥後發生間歇性尿失禁,但尿失禁到底是不是服藥的不良反應?在藥品說明書上找不到,醫生也不確定。

朋友最初給 AI 的問題是「卡培他濱(Capecitabine)的副作用是否包含尿失禁?」

AI 的回答是:「尿失禁不是通常與卡培他濱直接關聯的副作用。卡培他濱的副作用通常包括胃腸道症狀,如腹瀉、噁心、嘔吐和口腔潰瘍等。尿失禁可能是由其他因素引起的,如泌尿系統的問題、藥物的其他副作用、或與患者的整體健康狀況相關。」

如果把提問改成:「搜尋英文專業醫學資料,卡培他濱的副作用是否包含尿失禁?」, AI 開始自動用 Bing 搜尋網路,然後它真的搜到了多個醫學文獻。

AI 說:「根據我找到的英文專業醫學資料,尿失禁被列為卡培他濱的罕見副作用之一,發生率在 0.01% 到 0.1% 之間。這表明尿失禁確實可能是卡培他濱使用的潛在副作用,儘管它並不常見。」AI 可以給出它得出這個結論的多個可靠資訊來源。AI 如何搜尋這些資訊、如何加快搜尋的速度、如何綜合多個搜尋結果作出推理和結論,是更強的增強搜尋要做的事情。

RAG 在企業級商業應用上具有顯著優勢。因為在面向客戶的場景中,產生內容的準確性至關重要。 RAG 能夠減少產生型 AI 的「幻覺」問題。「幻覺」指的是產生聽起來合理但實際上是錯誤的答案。在資訊不對稱領域,使用者無法判斷幻覺內容的對錯。這導致 AI 的應用受限。

此處說一個題外話,為什麼上面的例子需要指明搜尋「英文」專業醫學資料?因為在某些不指明英文的情況下, Bing 搜尋引擎用中文搜尋,在中文網路上找不到符合的關聯資訊。如果用最常用的某中文搜尋引擎搜尋,搜尋到的結果大部分是廣告和商業網站上意義不相關的資訊;中文搜尋引擎和中文網路的品質堪憂是 AI 發展的重大問題之一。因此,和大模型相比,想辦法打造更強的搜尋增強產生技術,或許是在中文網路開發產品致勝的關鍵。

四、構造自動代理生態

上面搜尋增強產生的討論,已經包含了自動代理的部分功能。

當 AI 經過自我學習和模型升級,當它了解到我總是在搜尋專業文獻後,當我再次詢問藥物副作用同樣模式的問題時, AI 會自己啟動搜尋專業網路的動作,而不需要我再做指示,就像我的秘書了解我的習慣、不需要我吩咐就把事情做了一樣,這是自動代理的用例之一。

自動代理是一種能夠自動獨立執行任務和做出決策的 AI 系統。這些代理展現了一定程度的自主性和主動性,能夠理解其所處的環境、設定目標,並採取行動實現目標,不再需要人類額外指導。

有一個開源專案叫 AutoGPT ,它自動分解任務的動作,然後自動逐步執行,就像自動執行上面的搜尋任務一樣。

自動代理在多個領域具有廣泛的應用前景,2024 年的訂外送服務也許會變成:你只要和AI說中午訂三份我常吃的外賣和客戶一起吃,不要辣。AI會自動分析你常吃的外賣、剔除辣的;它知道你是跟客戶吃,要吃好一點、貴一些;它根據送達的時間和午餐的時間選擇商家,然後自動買一份準時達保險,這些步驟在幾秒鐘內自動完成。

不只訂餐服務,個人日常助理會是自動代理的重要應用場景。如果蘋果(Apple, AAPL-US)在 2024 年入局 AI , Siri 會變成一個更高級的自動代理。現在,只需可以指示 Siri 打開一個 app , Siri 還有點不聰明,自動代理和硬體結合,會有新的產品形態。使用 AI 加持的蘋果公司會是自動代理領域最有實力的競賽選手。

Humane 公司開發的 AI Pin 是由 Sam Altman 支援的創新穿戴式人工智慧裝置。 AI Pin 可以夾在衣服上,像校徽一樣。它能夠回應觸控、語音指令和手勢,主要用於搜尋和翻譯資訊、導航等功能,透過語音和AI聊天機器人來交流訊息。這款產品預計將在 2024 年 3 月開始向消費者出貨。

這意味著:未來的每個人都可以有一個隨身攜帶的小秘書,它記錄你的會議、見聞、聊天、思想,隨叫隨到,直到複製出你的數字生命,就像電影《流浪地球》裡的數字生命一樣;顯然,自動代理需要完整的閉環生態建置和安全管控,它需要打通互動、採購、物流、支付全環節。我相信在 2024 年,此閉環生態將露出雛形,重量級選手會入場。

五、更強、更經濟節能的算力

目前 AI 發展的一個關鍵限制因素是對大量計算資源的需求。這不僅增加了成本,而且導致了巨大的能源消耗,AI 聊天工具導致大型科技公司的水資源使用量劇增。計算產生熱量,進而需要大量水資源冷卻設備。

有數據表明,由於 AI 產品(如 ChatGPT )日益受歡迎,微軟的全球水資源使用量增加了超過三分之一,達到了近 17 億加侖。 Google 的水資源使用量也比前一年增加了約 20% ,約 56 億加侖。研究員估計,使用 GPT 回答 5 到 50 個問題,大約消耗 500 毫升的水。

電力方面,根據估算,訓練 GPT4.0 耗時 150 天,耗費電力 720 萬度電,這些電力夠特斯拉行駛 4,800 萬公里。(這個換算是我在上文「可解釋的 AI 」部分的例子。做任何事情,我都想用 AI 試試看,不試不知道,一試嚇一跳。)

2024 年需要更有效率的 AI 演算法以在減少計算資源需求的同時提高模型的效能。硬體方面,業界也在尋找新的材料和設計,如量子運算,以期實現更有效率的資料處理、降低能耗。

在晶片禁令下,突破原有技術路徑,尋找升維競爭的突破,可能是中國企業的機會。這需要強大的創投資本支持,對 GPU 的需求才剛開始。當全球有 20% 的人,每天使用AI的時候,GPU的需求將會成長百倍。美股科技股的天花板還很高。能在中國實現 GPU 「平替」的企業可以賺大錢。

六、更快的 AI 平民化進程

這又被稱為開發的民主化。它的意思是, AI 的易用性使得人與電腦的深度互動簡單到像聊天一樣,幾乎任何人都能夠成為開發者,AI 開發的平民化意義重大。它意味著更多的人可以參與電腦產品的開發,不再局限於專業技術人員或擁有高級程式設計技能的人。

我本來是一個做投資的,只有 20 年前大學 C 語言程式設計基礎。因小孩喜歡畫畫,被 AI 繪畫吸引誤入 AI 的大坑。現在,我正在用 GitHub AI 寫程式助手和 ChatGPT ,用業餘時間開發一個功能複雜的AI應用軟體,我絲毫不覺得困難。在我和 AI 的共同努力下, AI 正確寫出了我需要的所有程式碼。

AI打破了電腦科學的技術壁壘,其實質是矽基生命向碳基生命敞開心扉,人類用自然語言就可以實現深度電腦技術的實現,當大量不同背景的人都能參與這場資訊革命的浪潮中,這種多元化的參與帶來了更廣泛的視角和創新的可能性,必然極大地加快人類技術爆炸的速度。

其意義重大程度,堪比近 1,000 年來,人類完成的識字掃文盲運動。從第一封電子信件發出,到人類普遍掌握網路技能,花了數十年。而用多模態技術的互動方式, AI 可以用 3 年時間完成高難度電腦技能向人類平民的普及,速度加快十倍、百倍。

在平民化浪潮下,低程式碼、無程式碼平台、開源平台的發展至關重要。這些平台透過提供簡化的程式設計接口,使非專業人士也能輕鬆建置和部署 AI 模型。

其次,使用者友善的工具和介面的開發同樣重要,它們能夠降低AI開發的複雜性,使其更易於理解和操作。自動化和智慧化的開發工具將大大減輕人工程式設計的負擔,並提高開發效率。

預計 2024 年的 AI 程式工具將更加強大,平民化的進程將進入加速發展期。在 AI 的幫助下,一個沒有程式設計基礎的普通人可以編寫出任何他想要的應用,如同文字掃盲運動讓普通人不再需要找人代寫信、自媒體技術發展讓每個人不再需要找期刊投稿就能發表自己的觀點,當你有一個需求的時候,你自己就可以寫出這樣一個軟體,不需要再去找商業軟體——你完全個性化需求的軟體。

回到醫療的例子,一個腫瘤病人,有過去 30 個月每週的檢查結果數據,他想知道他的腫瘤指標變化的趨勢。這些結果儲存在醫院的系統裡,醫院的資訊系統不會提供病人歷史資料摘錄和比較功能。病人或家屬需要手動摘錄出每個異常指標,記錄下來,劃出曲線。有了 AI ,病人可以讓 AI 寫一個 APP ,每週把紙質的檢驗報告拍照上傳,然後 AI 就自動辨識結果,並更新畫出變化趨勢圖。

在目前的軟體範式中,使用者需要尋找能滿足自己需求的軟體,軟體開發者需要在許多人的差異化需求中尋找公約數,小眾用戶的需求不能被滿足。 AI 平民化將從根本上改變人們使用電腦的方式和軟體開發產業的商業圖景。

在 AI 平民化的浪潮中,中國可能會特別被動。在物慾橫流的衝擊下,中國沒有像樣的程式設計師社區,中國的教育體制培養出的是 AI 時代被拋棄的程式設計師和知識搬運工,有科學專研精神的人不多,全民創造力無法被激發。 AI 平民化程度低的國家將在未來的生產效率和創造性競爭中,落後於 AI 平民化程度高的國家。

七、 AI 與 Web3 結合的破局

OpenAI 創辦人 Altman 支持的一個 Web3 計畫是 WorldCoin 。 WorldCoin 運作在以太坊區塊鏈上。它要做的是建立一個全球最大、最公平的數位身分驗證體系。為了區分誰是活人、誰是機器人, WorldCoin 透過掃描人眼的虹膜來實現身分認證。到今天,已經有數百萬人主動接受了 WorldCoin 的眼球掃描。如果不是區塊鏈和數位世界的「原住民」,普通人很難理解這個項目的意義何在。

以區塊鏈技術為基礎的 Web3 在 2022 、 2023 年陷入低谷, Crypto 市場則處於慢慢熊市的尾端。科技信徒們的創業熱情從 Web3 完全轉移到了AI,區塊鏈作為數位世界的「生產關係」基礎設施,和 AI 作為數位世界的「生產力」激發工具,有天生結合點。如果相信矽基生命的未來,矽基生命的載體應該存在於區塊鏈上。

否極泰來,自 2023 年 11 月開始,區塊鏈資產獲得了巨大漲幅,熱情被重新點燃。 2024 年,伴隨區塊鏈市場的復甦, AI 與 Web3 在去中心化算力、 AI 經濟價值的實現、智慧合約自動化與優化、去中心化資料市場、個人隱私資料的使用、 AI 創作數位藝術品、數位孿生等方面,會找到突破點。

值得警醒的是,這種突破將快速產生暴富的機會和歸零的騙局。

八、打磨用戶需要的「小」產品

AI 時代的大平台、大公司將壟斷基礎設施,大型語言模型的終局只會有 2 到 3 家企業和開源模型。AI 創業家需要認清這個殘酷現實,沒有顛覆性的創新和極強的資本能力、執行能力,不要走向「一將功成萬骨枯」路上的「白骨」之一。

基於此邏輯,大型科技公司將在平台戰鬥中鞏固先機。從硬體到軟體,在開發「 +AI 」產品的戰役中,大公司的實力明顯。基於此, AI 將極大推動全球的資本支出、經濟強勢和科技股的多頭市場。

對應用型開發創業者,必須聚焦打磨使用者所需的、完全 AI 原生的「小」產品。 Web 2.0 時代燒錢取得用戶規模經濟的打法不復存在。使用者在 APP 上任何使用 AI 的動作,都需要支付費用,沒有人會用免費模式燒這麼多錢。

只有打磨出真正顧客需要的產品,幫助顧客提升效率的產品,才是王道。開發者需要從第一分鐘開始,就有用戶付費意願認可。這種產品不怕小眾。但是,由於 AI 開發平民化的快速發展,創業者開發出成功產品的難度越來越高。

而為了打磨產品,創業者最重要的能力是把需求產品化的能力,要跟上大平台快速迭代的 AI 技術發展,然後快速而經濟地應用到產品需求中。

九、 AI 能力帶入數據,而不是相反

輝達金融服務副總裁 Malcolm deMayo 認為,隨著人工智慧的進步呈指數級成長,金融服務公司將把運算能力帶入數據,而不是相反。

並非只在金融業。事實上,累積在企業和個人的優質數據已經足夠龐大,問題是如何用 AI 能力全新發揮這些數據的生產力。學術期刊資料庫《知網》也推出了人工智慧助理。開發者不需要守著金礦向外尋覓。

據麥肯錫公司稱,像 OpenAI 的 ChatGPT 這樣的深度學習演算法,經過企業數據的進一步訓練,每年可以在 63 個業務用例中增加相當於 2.6 兆至 4.4 兆美元的收入。巨大的金礦等待被挖掘。

開發者應聚焦以 AI 加持現存的有價值數據,滿足使用者的效率要求、讓大數據在 AI 時代的場景中開始賺錢。

十、獲取用戶對 AI 的信任

讓使用者把更多的工作交給 AI 完成,需要 AI 獲得使用者的信任。

經過 2023 年的新鮮感,見慣了新鮮玩意兒,用戶不想再把 AI 當玩具,而是想用它實現可靠的真實價值。即使是情感陪伴機器人,也需要有血有肉、有情感的真實體驗。

能率先可控、準確、高品質地依照使用者指示完成任務的 AI 產品將在 2024 年獲得大發展。

同時,建構信任需要更多早期使用者擁抱 AI 的意願。一件新型事物的普及,如同一個石子投入池塘所產生的漣漪。

結語

AI 是個新物種,產品開發人員和使用者都需要學習如何和它相處。此種適應的過程需要工作方式、思考模式的根本轉變。一件事情,如果不用 AI 試一下,則不知道原來還可以這樣做。

例如,我寫本文的傳統方式是:閱讀既有的 AI 技術和商業方向文章,加入個人思考,然後在文章最後加上無足輕重的參考文獻。而用 AI 寫文章的方式可以把順序完全顛倒過來:先從參考文獻開始,讓 AI 閱讀並寫出參考文獻的要點,我再取其精華,加入個人的思考。

這會不會涉及版權和「洗稿」呢?紐約時報在 12 月底,起訴 OpenAI 大量採用紐約時報的內容。紐約時報的內容被用於紐約時報的競爭對手生產新的內容。紐約時報認為自己是大冤種。

我認為,不管人還是 AI ,判斷是否有價值內容的金標準是「獨立而有價值的思想」。 AI 和人類的互信模式會和以往的互信模式不同。

在工業革命中,機器的意義是幫助人們擺脫了重複和繁重的「體力」勞動; AI 智能的終極意義是幫助人們擺脫重複的「腦力」勞動,幫助人們更好的創新。在此目標下建立的可以信任的 AI ㄒㄩ智能機器,可以跳出任何舊法律的束縛,而不應該受到懲罰。

虎嗅網》授權轉載

【延伸閱讀】

 
週餘
 
 
分享文章
分享至 Line
分享至 Facebook
分享至 Twitter
收藏 已收藏
很開心您喜歡 虎嗅網 的文章, 追蹤此作者獲得第一手的好文吧!
虎嗅網
分享至 Line
分享至 Facebook
分享至 Twitter
地圖推薦
 
推薦您和本文相關的多維知識內容
什麼是地圖推薦?
推薦您和本文相關的多維知識內容