Grok3“翻車”了 回答9.11比9.9大,遭遇了現實的考驗
時間:2025-02-19 20:45 來源:今日頭條 責任編輯:毛青青
原標題:Grok3“翻車”了 回答9.11比9.9大,遭遇了現實的考驗
在人工智能領域的激烈競爭中,科技巨頭馬斯克再次引發(fā)轟動。近日,他與xAI團隊在一場備受矚目的直播中正式發(fā)布了最新版本Grok-3,并宣稱這是"地球上最聰明的AI"。然而,這一雄心勃勃的宣言很快遭遇了現實的考驗。
馬斯克聲稱Grok-3在數學、科學和編程的基準測試中已經超越了所有主流模型。這一說法似乎得到了一定的支持,因為AI確實在處理復雜數學問題時展現出了令人驚嘆的能力。然而,當面對看似簡單的常識性問題時,AI卻暴露出了令人意外的弱點。

最具代表性的是"9.11與9.9哪個大"這個問題。這個看似簡單的比較,卻成為了檢驗AI常識判斷能力的試金石。令人意外的是,包括Grok-3在內的多個主流AI模型都在這個問題上栽了跟頭。這一現象引發(fā)了人們對AI真實智能水平的質疑:為什么能解決復雜數學題的AI,卻無法正確比較兩個簡單的數字大?
盡管遭遇挫折,馬斯克對Grok-3的未來仍然充滿信心。他預測,Grok-3將在未來三年內實現"諾貝爾獎級別的突破",甚至可能用于SpaceX的火星任務計算。這種自信并非空穴來風,背后有著強大的技術支撐。
馬斯克透露,Grok-3的訓練使用了遠超此前版本的算力和大量合成數據。特別值得一提的是,xAI自建的Colossus超級計算機為Grok-3提供了強大的計算能力,這臺由10萬個英偉達H100 GPU驅動的超級計算機,提供了2億個GPU小時的計算能力,比Grok-2使用的算力多了十多倍。
馬斯克表示,這種強大的計算能力使Grok-3能夠更好地減少AI幻覺,通過檢查數據并實現邏輯一致性來優(yōu)化表現。然而,"9.11與9.9"問題的失誤似乎暗示,單純依靠計算力的提升可能并不足以解決AI在常識推理方面的根本問題。
盡管Grok-3在某些方面表現出色,但其在常識性判斷上的失誤無疑給馬斯克和xAI團隊敲響了警鐘。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://fishbao.com.cn/