你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
Grok3“翻車”了 回答9.11比9.9大,遭遇了現實的考驗
時間:2025-02-19 20:45   來源:今日頭條   責任編輯:毛青青
    原標題:Grok3“翻車”了 回答9.11比9.9大,遭遇了現實的考驗

    在人工智能領域的激烈競爭中,科技巨頭馬斯克再次引發(fā)轟動。近日,他與xAI團隊在一場備受矚目的直播中正式發(fā)布了最新版本Grok-3,并宣稱這是"地球上最聰明的AI"。然而,這一雄心勃勃的宣言很快遭遇了現實的考驗。
 
  馬斯克聲稱Grok-3在數學、科學和編程的基準測試中已經超越了所有主流模型。這一說法似乎得到了一定的支持,因為AI確實在處理復雜數學問題時展現出了令人驚嘆的能力。然而,當面對看似簡單的常識性問題時,AI卻暴露出了令人意外的弱點。

 
  最具代表性的是"9.11與9.9哪個大"這個問題。這個看似簡單的比較,卻成為了檢驗AI常識判斷能力的試金石。令人意外的是,包括Grok-3在內的多個主流AI模型都在這個問題上栽了跟頭。這一現象引發(fā)了人們對AI真實智能水平的質疑:為什么能解決復雜數學題的AI,卻無法正確比較兩個簡單的數字大?
 
  盡管遭遇挫折,馬斯克對Grok-3的未來仍然充滿信心。他預測,Grok-3將在未來三年內實現"諾貝爾獎級別的突破",甚至可能用于SpaceX的火星任務計算。這種自信并非空穴來風,背后有著強大的技術支撐。
 
  馬斯克透露,Grok-3的訓練使用了遠超此前版本的算力和大量合成數據。特別值得一提的是,xAI自建的Colossus超級計算機為Grok-3提供了強大的計算能力,這臺由10萬個英偉達H100 GPU驅動的超級計算機,提供了2億個GPU小時的計算能力,比Grok-2使用的算力多了十多倍。
 
  馬斯克表示,這種強大的計算能力使Grok-3能夠更好地減少AI幻覺,通過檢查數據并實現邏輯一致性來優(yōu)化表現。然而,"9.11與9.9"問題的失誤似乎暗示,單純依靠計算力的提升可能并不足以解決AI在常識推理方面的根本問題。
 
  盡管Grok-3在某些方面表現出色,但其在常識性判斷上的失誤無疑給馬斯克和xAI團隊敲響了警鐘。

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://fishbao.com.cn/

川北在線-川北全搜索版權與免責聲明
①凡注明"來源:XXX(非在線)"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。
②本站所載之信息僅為網民提供參考之用,不構成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責,本站信息接受廣大網民的監(jiān)督、投訴、批評。
③本站轉載純粹出于為網民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網站,如涉及到您的版權問題,請與本網聯(lián)系,我站將及時進行刪除處理。



合作媒體
金寵物 綠植迷 女邦網 IT人
法律顧問:ITLAW-莊毅雄律師