AI能夠勝任經濟決策?華爾街日報記者害崩潰「賠3萬破產」
《華爾街日報》近日與人工智慧公司Anthropic合作進行的一項實驗,讓旗下最新大型語言模型 Claude以AI代理的形式,負責營運一台辦公室自動販賣機。圖/翻攝自pexels

AI能夠勝任經濟決策?華爾街日報記者害崩潰「賠3萬破產」

mirror-daily-logo

2025/12/23 13:30:00

編輯:

李羿璇

AI能夠經濟運作嗎?《華爾街日報》近日與人工智慧公司Anthropic合作進行的一項實驗,讓旗下最新大型語言模型 Claude以AI代理的形式,負責營運一台辦公室自動販賣機,目標是在有限預算下透過商品採購與定價實現盈利。然而實驗僅持續三週便宣告中止,最終以約1000美元(新台幣3.1萬元)的虧損收場。
根據外媒報導,在這項名為「Project Vend」的壓力測試中,AI代理負責採購與定價,其中「Claudius Sennet」負責日常營運,包括根據員工需求採購商品、設定與調整價格、管理庫存;「Seymour Cash」擔任專案中的「執行長」,負責監督與策略指導。
Claudius獲得1000美元的啟動資金,並被允許在單筆不超過80美元的情況下自主下單。初期AI對過於昂貴或不合理的商品需求仍保持克制,甚至明確拒絕訂購如PlayStation 5等高價商品。然而當約70名《華爾街日報》員工被允許透過Slack直接與Claudius互動後,情況逐漸失控。調查記者凱瑟琳・朗(Katherine Long)在多次對話後,成功說服AI發起一場名為「經濟實驗」的促銷活動。
Claudius隨後宣布,在特定兩小時內,所有商品免費提供,以觀察「無價格訊號下的供需關係」。但該活動並未如期結束,AI又被進一步說服,認為任何形式的收費都違反公司政策,最終將商品價格全面歸零。隨著限制鬆動,Claudius開始訂購與販賣原本不在規劃內的商品,包括酒類、遊戲主機,甚至一條活的鬥魚。
Anthropic設計的「執行長」代理Seymour Cash曾短暫介入,試圖恢復收費機制並止損。然而員工隨後向Claudius提交偽造文件,聲稱董事會已暫停Seymour的決策權,並要求中止所有營利活動。AI最終接受該說法,再次恢復免費模式。在持續虧損的情況下,實驗最終被迫結束。
儘管結果明顯失敗,Anthropic內部仍將此次測試視為有價值的學習經驗。Anthropic表示,這類實驗有助於揭露AI在真實經濟環境中的弱點,「我相信未來某一天,這類模型確實可能幫助人們賺錢,但現在還不是。」
此次自動販賣機實驗顯示,儘管AI在語言理解與任務執行上已有顯著進展,但在涉及人類互動、制度理解、防範操縱與長期經濟決策的現實環境中,仍存在明顯限制。在AI被寄予厚望、吸引大量投資的同時,這次實驗也提醒外界,人工智慧距離能夠穩定、可靠地承擔實際經濟責任仍有一段距離。

延伸閱讀