(SeaPRwire) – 每隔三個月,Metaculus 預測的參與者都會嘗試預測未來,以爭奪約 5,000 美元的獎金。作為一個預測平台,Metaculus 提出具有地緣政治重要性的問題,例如「泰國會在 2025 年 9 月前發生軍事政變嗎?」和「以色列會在 2025 年 9 月前再次襲擊伊朗軍隊嗎?」
預測者會提前數週到數月估計事件發生的機率——這比簡單的「是」或「否」更具參考價值——而且往往準確得驚人。Metaculus 用戶在俄羅斯入侵烏克蘭前兩週準確預測了日期,並在羅訴韋德案被推翻前近兩個月預測了 90% 的可能性。
儘管如此,此次比賽的十強選手之一,其獲獎者於週三公佈,甚至讓預測者感到驚訝:一個人工智慧。「這實際上令人非常驚訝,」Mantic 的執行長 Toby Shevlane 說道,這家最近宣佈的英國新創公司開發了這個人工智慧。當比賽於六月開始時,參賽者預測頂尖機器人的分數將是頂尖人類選手平均分數的 40%。然而,Mantic 卻達到了 80% 以上。
「預測——它無處不在,對吧?」Nathan Manzotti 說道,他曾為國防部和總務管理局以及大約六個美國政府機構從事人工智慧和數據分析工作。「隨便挑一個政府機構,他們肯定都在進行某種形式的預測。」
預測者幫助機構預見未來,RAND(一家美國政府智庫)預測倡議的共同主任 Anthony Vassalo 解釋道。它也幫助他們改變未來。Vassalo 說,提前數週或數月預測地緣政治事件有助於「避免意外」並「協助決策者做出決策」。預測者根據立法者頒布的政策更新他們的預測,這樣他們就可以預測假設的政策干預將如何改變未來的結果。Vassalo 說,如果決策者處於一個不受歡迎的軌道上,預測者可以幫助他們「改變他們所處的局面」。
但預測廣泛的地緣政治問題是出了名的困難。頂尖預測者的預測可能需要數天才能解決單一問題。Vassalo 說,對於像 RAND 這樣的組織來說,在許多地緣政治區域追蹤多個議題,「讓人類預測者對所有這些問題進行初步預測需要數月時間,更不用說定期更新了。」
在擁有豐富、結構良好數據的領域,例如天氣預報或量化基金交易,機器學習長期以來一直很有用。Metaculus 執行長 Deger Turan 說,當預測地緣政治或技術進步時,「將會有很多複雜、相互依存的因素,而人類判斷在預測這些方面可能更易於取得且更經濟實惠。」
大型語言模型與人類預測者處理相同混亂的資訊,並且能夠模擬這種人類判斷。它們也以與人類大致相同的方式改進:透過對許多問題做出預測,觀察其結果,並根據結果更新其預測方法——其規模遠超人類所能及。
「我們的主要見解是,預測未來實際上傾向於一個可驗證的問題,因為這就像人類學習的方式,對吧?」LightningRod 的執行長 Ben Turtel 說道,該公司開發用於預測的人工智慧,並在 Metaculus 人工智慧錦標賽中取得競爭性名次。該公司利用預測問題訓練了一個最新的模型。
人工智慧所接受的訓練正在排行榜上顯現。六月,由 Metaculus 在 OpenAI 的 o1 reasoning model 基礎上建立的頂級機器人,在比賽中。這次,Mantic 在 549 名參賽者中排名第八——這是機器人首次在該系列比賽中進入前十名。
這一結果應持保留態度,根據 Metaculus 工程師 Ben Wilson 的說法,他負責比較人工智慧和人類在預測挑戰中的表現。該競賽只包含相對較小的 60 個問題樣本。此外,600 名參賽者中大多數是業餘愛好者,其中一些人在比賽中只預測了少數幾個問題,導致他們的得分較低。
最後,機器具有不公平的優勢。參賽者得分不僅基於準確性,還基於「覆蓋範圍」——他們預測的早晚、他們預測了多少問題以及他們更新估計的頻率。一個人T工智慧即使不如人類競爭者準確,也能透過不斷更新其估計以回應突發新聞,從而在排名中表現良好,而這對於人類來說是不可能做到的。
對於 Vassalo 來說,人工智慧的不公平優勢解決了他最大的剩餘問題:在他需要預測的所有問題上獲得高品質的預測。「我實際上不需要它達到超級預測者的水平,」他引用頂級預測者所用的綽號說道。「我需要它像大眾一樣好。」
這比聽起來要難:Metaculus 社群預測,即所有用戶對每個問題的預測總和,是該平台上最穩定的表現者之一。如果它是一個人,它將在網站上排名第四——這就是群眾的智慧。在季度杯中,Mantic 落後社群預測五個名次。
一個可靠的人工智慧預測者可以同時追蹤數百個問題,讓 Vassalo 僅將頂尖人類預測者部署到人工智慧認為值得進一步審查的問題上。
「關於預測,或者說預測分析,有一點就是它是決策支持,」Manzotti 說。「許多領導者如果憑直覺覺得方向不同,就會把數據拋諸腦後。」這是人工智慧無法解決的問題。
本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。
分類: 頭條新聞,日常新聞
SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。