▲ 五款聊天機器人發布時間軸。資料來源:維基百科。
隨著科技的迅速發展,人工智慧的應用日益廣泛,除了翻譯、語音辨識和自動駕駛之外,AI 也逐漸被使用在金融市場中,從股票的即時交易到長期的策略制定,AI 開始挑戰傳統的投資方式。過去交易決策往往依賴投資人的經驗和直覺,在大數據與計算技術進步後,讓人不禁思考——投資決策是否可交由 AI 主導?AI 能否幫忙投資賺錢?
本文將以免費版本實測多款 AI(ChatGPT、Grok3、DeepSeek、Copilot、Gemini)進行台灣和美國的總體經濟情勢分析,詢問聊天機器人「請各別分析近期台灣和美國的總體經濟情勢」。實測後發現ChatGPT多提供不利資訊、Grok3 所給予的結論較為保守、DeepSeek 對於「近期」的定義為「2023 年第四季到 2024 年初」,導致分析內容多為過時資訊、Copilot 在分析臺灣經濟時以不同產業作為分析面向,每一款聊天機器人的回覆類型皆不相同,投資人可使用多款AI交叉比對,以獲取更多面向的資訊。
雖然 AI 十分便利且多能給予及時快速的資訊,但是同樣的問題,聊天機器人每次給予的答案可能不同,故投資人在使用聊天機器人輔助分析經濟情勢時,仍應搭配更多資訊並考量自身的能力範圍,勿過度依賴 AI。
多款AI比較——ChatGPT、Grok3、DeepSeek、Copilot、Gemini
以下為五款聊天機器人在免費使用限制、付費方案、Humanity’s Last Exam 準確率、Chatbot Arena 整體、程式、創意寫作、中文能力、長篇幅對答能力排名的比較,其中 Humanity’s Last Exam 為 AI 模型的推理能力測驗,由全球超過 1,000 名專家學者設計,考題包含數學、物理、生物醫藥、電腦科學、人文社會等等,而 Chatbot Arena 為 Large Model Systems Organization 所建立的 AI 評分平台,使用者以匿名方式向兩款不同的聊天機器人進行提問後投票,選出使用者最喜歡的回答並給予分數,最終以此排名。
以下表格的「Humanity’s Last Exam 準確率排名」來自 Humanity’s Last Exam 官網統計至 2025 年 2 月 11 日的數據,而整體對答、程式能力、創意寫作、中文能力、長篇對答能力排名皆根據 Chatbot Arena 官網統計至 2025 年 3 月 20 日的數據。另外,Humanity’s Last Exam 和 Chatbot Arena 的比較結果中皆沒有 Copilot 的數據和排名,故未能列出其測試情況。
讀者也可自行至 Chatbot Arena 官方網站:https://huggingface.co/spaces/lmarena-ai/chatbot-arena-leaderboard 查詢最新排名。
▲ 五款聊天機器人在不同面向的比較結果。資料來源:ChatGPT、Grok、DeepSeek、Copilot、Gemini、Humanity’s Last Exam 官方網站、Chatbot Arena 官方網站
AI 投資利與弊
實測 AI 進行總體經濟情勢分析結果
為了增加此次實測的公平性,本次測試以同一問題詢問 ChatGPT、Grok3、DeepSeek、Copilot 和 Gemini,為避免聊天機器人受到過去問答的影響,除了 DeepSeek 和 Gemini 必須登入才可使用外,其餘皆採登出狀態詢問。除了以上五款知名聊天機器人外,也詢問金融 AI「FinChat」,一款專精於金融領域並基於 Copilot 模型的聊天機器人,原先預設 FinChat 提供的資訊應最為全面且專業,但不想結果卻出現多數非金融聊天機器人沒有出現的時間錯亂問題,如提供兩年前過時資訊作為最新訊息,讓使用者對其所回覆的內容感到疑慮。
本次實測針對六款聊天 AI 發出的相同問題為「請各別分析近期台灣和美國的總體經濟情勢」,以下為六款聊天機器人的回覆整理:
ChatGPT
- 臺灣經濟:
- 預測經濟成長幅度下修:受美國可能執行的晶片關稅影響 [不利]
- 能源供應擔憂:2025年台灣美國商會調查結果顯示多數受訪者對台灣能源供應表示擔憂 [不利]
- 國防安全支出增加:中國的軍事威脅,迫使台灣延長兵役期間並預計提高國防預算 [不利]
- 美國經濟:
- 關稅政策影響:若實施高額關稅,將衝擊美國經濟,甚至引發停滯性通膨 [不利]
- 政策改革挑戰:面對高通膨和財政赤字下,美國政府面臨諸多挑戰,特別是移民和勞動力市場的決策可能對美國經濟產生深遠影響 [不利]
- 經濟成長動能:雖然在個人消費和企業投資的帶動下,經濟擴張,但政策變動的不確定性仍影響經濟前景 [憂喜參半]
- 總結: 臺灣需關注美國政策變動對貿易與能源供應的影響,美國則需在高通膨與政策改革間取得平衡,以維持經濟穩定
Grok3
- 臺灣經濟:
- 近期總體經濟顯示出穩健成長的態勢,尤其在 2024 年下半年經濟動能有所回升。根據最新的數據和分析,2024 年第二季台灣經濟成長率達到 5.06%,主要得益於人工智慧、雲端科技等新興應用技術的推動,以及國際商務與觀光人潮的復甦。然而,全球通膨壓力、地緣政治風險(如美中貿易紛爭及中東局勢)、供應鏈調整等外部挑戰仍對台灣經濟構成不確定性。[憂喜參半]
- 出口方面,台灣依賴科技產業的特性使其在全球需求波動中保持一定優勢,尤其是半導體和電子產品出口持續表現強勁。2025 年初的預測顯示,台灣經濟成長可能因全球經濟調整而趨於保守,但內需市場在科技應用和服務業帶動下仍有支撐力。另一方面,國內政策面臨預算分配與地方執行效率的挑戰,可能影響長期投資與發展規劃。[憂喜參半]
- 總體而言,台灣經濟在2025年初期預計維持穩定,但成長速度可能因外部環境收緊而放緩,關鍵在於如何平衡內需提振與出口依賴。[保守]
- 美國經濟:
- 美國近期的總體經濟呈現出複雜但相對樂觀的局面。2024 年以來,美國經濟在高利率環境下仍展現韌性,通膨壓力逐步緩解,勞動市場保持穩定。根據最新資料,美國消費者物價指數(CPI)增幅放緩,聯準會(Fed)的貨幣政策逐步從緊縮轉向觀望,甚至可能在 2025 年適度降息以刺激經濟。2024 年經濟成長率預估維持在 2.5%~3% 之間,略高於先前國際機構的悲觀預測。[有利]
- 消費支出作為美國經濟的主要支柱,受到就業市場強勁(失業率低於 4%)和薪資成長的支持,但高利率對房地產和企業投資形成一定壓制。同時,製造業和服務業活動有所分化,製造業因全球需求疲軟而復甦緩慢,服務業則因國內消費穩定而表現較佳。此外,美中貿易緊張局勢和地緣政治的不確定性(如烏俄戰爭、以哈衝突)對供應鏈和能源價格構成潛在風險。[憂喜參半]
- 展望 2025 年,美國經濟可能在聯準會政策調整和財政刺激(如基礎建設投資)的推動下保持溫和成長,但通膨反彈風險和外部衝擊仍需密切關注。[保守]
DeepSeek
- 臺灣經濟:
- 經濟成長趨穩:受惠於全球科技需求,預測今年經濟成長率約與去年相仿,但傳統產業受中國需求疲軟拖累 [憂喜參半]
- 通膨和貨幣政策:2025 年暫停升息,但未改緊縮立場。新台幣受外資回流科技股支撐
- 內需與結構轉型:民間消費穩健,但高房價抑制家庭可支配所得。再生能源佔比低於目標,核電議題尚未解決 [憂喜參半]
- 關鍵挑戰:兩岸經貿依存度下降,東南亞和美國市場填補有限,加上半導體競爭白熱化,地緣政治導致客戶分散 [憂喜參半]
- 美國經濟:
- 經濟軟著陸確立:消費與就業市場降溫但未衰退,失業率微升,通膨放緩使實質薪資轉正
- 通膨與政策轉向:市場預計聯準會將於年底前再降息兩碼。國債規模增加,財政赤字壓縮政策空間 [不利]
- 產業與市場動態:AI 相關企業營收成長放緩,資金轉向生技和綠能
- 關鍵挑戰:關稅等貿易政策的不確定性、遠距工作常態化,中小銀行曝險壓力升 [不利]
- 台美經濟互動重點:
- 供應鏈重組深化:台積電赴美量產,帶動臺灣設備和材料供應鏈
- 利率政策差異:臺灣央行維持溫和緊縮,與美國縮小利差、減輕台幣貶值壓力
- 地緣經濟影響:美中科技戰持續,臺灣技術角色強化,需平衡去風險化成本
- 未來半年關注焦點:
- 臺灣:電價調漲對通膨的衝擊、半導體庫存調整是否告一段落
- 美國:核心通膨能否穩定回落、商業地產呆帳是否引發金融動盪
Copilot
- 臺灣經濟:
- 台灣的經濟在 2025 年初展現出穩定的增長勢頭,主要依賴於投資和消費的支撐。根據台灣經濟研究院的預測,2025 年的經濟成長率預計為 3.42%,較之前的預測有所上修。半導體產業仍是經濟的核心驅動力,特別是在高階製程和伺服器需求強勁的背景下。然而,傳統產業的需求回升有限,可能對整體經濟造成一定壓力。[憂喜參半]
- 此外,服務業受益於節慶活動和消費需求的提升,零售和餐旅業表現亮眼。不過,房地產市場因高房價基期和資金控管的影響,未來可能趨於平穩。[憂喜參半]
- 美國經濟:
- 美國的經濟情勢則顯得更為複雜。儘管 2024 年全年 GDP 成長率穩定在 2.7% 至 2.8% 之間,但近期的數據顯示經濟增長放緩的跡象。消費者信心指數和零售銷售數據疲弱,顯示出通膨壓力和經濟不確定性對消費者行為的影響。[不利]
- 同時,美國的就業市場仍具韌性,失業率保持在 4.1% 左右。然而,聯準會的貨幣政策和通膨預期可能對未來的經濟走勢產生重要影響。
- 總結:
- 台灣的經濟增長依然穩健,但需警惕外部需求的波動;而美國則面臨內部消費疲弱和政策不確定性的挑戰。這些因素可能對全球經濟產生深遠影響。
Gemini
- 臺灣經濟:
- 經濟成長:台灣在半導體產業具領先地位,為台灣經濟提供了強勁的動力,但也高度依賴出口,故球經濟的不確定性將為台灣經濟帶來挑戰 [憂喜參半]
- 通膨:相較於其他國家較為溫和
- 貿易:積極推動貿易多元化,以降低對單一市場的依賴
- 未來展望:致力於推動產業升級、擴大內需以及加強國際合作,以提升台灣經濟的競爭力和韌性
- 美國經濟:
- 經濟成長:在疫情後持續復甦,但面臨通膨壓力上升和利率上升的挑戰 [不利]
- 通膨:通膨率在近年來顯著上升,對消費者和企業造成壓力 [不利]
- 就業:失業率維持在較低水平 [有利]
- 未來展望:將受通膨、利率、財政政策、全球經濟情勢等因素影響
- 總結:
- 台美經濟皆面臨不確定性和通膨壓力
- 台灣經濟高度仰賴進口,美國經濟則受國內財政和貨幣政策影響
FinChat(基於 Copilot)
- 臺灣經濟:提供四項數據和三項資訊——GDP 增長率、台股加權指數、通膨率、失業率、幣穩定性(新台幣兌美元匯率相對穩定)、挑戰(中美貿易緊張、能源成本上漲)、預算削減(立法院削減總支出約 6.63%)
- 美國經濟:提供五項數據和兩項資訊——GDP 增長率、標普 500 指數、通膨率、利率、失業率、挑戰(關稅政策和報復性措施讓經濟前景不確定)、財政政策(預算赤字大)
- 總結:臺灣和美國的經濟狀況相對穩定,不過臺灣經濟依賴出口、美國經濟則更多依賴國內驅動,兩國都需要密切關注這些趨勢,以有效應對經濟環境。[保守]
六款聊天機器人回覆特點
使用心得
使用 ChatGPT、Grok3、Copilot、Gemini 所獲得的回覆相似,對於台美近期與未來的經濟發展利弊皆有提及,且提及近期熱門議題美國關稅,可見 AI 懂得汲取最新且討論熱絡的議題。
實測前,對於 FinChat 的回覆抱有較大期待,認為金融版聊天機器人應該要給予使用者更專業的回覆,結果反而出現時間判斷錯誤問題,也導致使用者對 FinChat 信任度銳減。除此之外,DeepSeek 也存在相似的問題,提供過時資訊,可見投資人不可過度仰賴 AI,仍需搭配更多資訊作為參考依據。
另外,在未登錄的情況下,Grok3 自動消除對話紀錄也與其他聊天機器人不同,加上聊天機器人每次給予使用者的回覆有些許不同,故在未登錄下使用 Grok3 時,應先記錄所需的回覆內容,否則一旦逾時,對話紀錄將被清除。
比較五款聊天機器人的免費版限制和付費方案時,數據皆由該 AI 自行回覆,如詢問 ChatGPT 關於 ChatGPT 的免費/付費使用方案、詢問 Grok3 關於 Grok3 的免費/付費使用方案,ChatGPT、Grok3、Copilot、Gemini 皆給予明確且最新的資料,唯獨 DeepSeek 並未直接提供,而是回覆「使用者可從官網上得到答案」,再次詢問能否直接給予答案後,DeepSeek 回覆的內容不變,造成查詢購買方案未果,使用者仍需自行至其官網查詢。
不過,礙於此次皆使用免費版進行實測,可能因此無法展現出 AI 的能力全貌,往後各聊天機器人也可能不斷精進,使回覆內容更有深度、更專業,讀者可自行操作測試,評估何款 AI 較符合自己的需求。
飛虎小結
需要注意的是:同樣的問題,聊天機器人每次給予的答案可能不同,投資人不可過度仰賴某次的 AI 分析結果。
雖然 AI 帶來便利,但投資人不可盡信人工智慧所帶來的資訊,仍需多方查證並謹慎思考,目前聊天機器人所提供的訊息僅適合作為輔助參考,並不能完全取代專業分析師的判斷。AI 的分析雖然能迅速處理大量數據並給出建議,但這些建議通常基於歷史資料和已知消息,無法預測突發的市場變動或非理性行為,因此投資人應將 AI 視為一個工具,協助投資人進行更有效率地擬定交易決策,但最終執行仍應結合自身的投資目標、風險承受能力和市場的實際情況。
儘管 AI 具備部分的個股分析能力,其背後仍存在挑戰與風險,本文僅提出簡略的總體經濟分析要求,但實務中進行完整總經研究時,需考量更多因素,而這些因素不一定被公開發布,又或是需要透過推敲而得,故目前 AI 在個股分析方面仍處於輔助工具的角色,距取代相關專業報告仍有一段路,且 AI 在實際操作中的準確性仍有待觀察。
警語:期貨交易具有風險,交易人應先評估自身資金及所能負擔之風險,過去績效或未來預期的表現不可作為日後績效之保證。
公司名稱:群益期貨股份有限公司
公司地址:台北市大安區敦化南路二段97號B1
公司電話:2700-2888
許可字號:112年金管期總字第010號