Entwodiksyon

Èske ou panse Grok3 pral "pwen final" modèl pre-antre yo?

Elon Musk ak ekip xAI a te ofisyèlman lanse dènye vèsyon Grok la, Grok3, pandan yon emisyon an dirèk. Anvan evènman sa a, yon kantite siyifikatif enfòmasyon ki gen rapò ak sa, ansanm ak pwomosyon Musk 24 sou 24, 7 jou sou 7, te ogmante atant mondyal pou Grok3 nan nivo san parèy. Jis yon semèn de sa, Musk te deklare avèk konfyans pandan yon emisyon an dirèk pandan l t ap fè kòmantè sou DeepSeek R1, "xAI pral lanse yon pi bon modèl IA." Apati done yo prezante an dirèk, Grok3 rapòte depase tout modèl prensipal aktyèl yo nan referans pou matematik, syans ak pwogramasyon, Musk menm deklare ke Grok3 pral itilize pou travay enfòmatik ki gen rapò ak misyon SpaceX sou Mas, li predi "avans nan nivo Pri Nobèl nan twa zan." Sepandan, kounye a sa yo se jis deklarasyon Musk. Apre lansman an, mwen te teste dènye vèsyon beta Grok3 la epi mwen te poze kesyon klasik la pou gwo modèl: "Kilès ki pi gwo, 9.11 oswa 9.9?" Malerezman, san okenn kalifikasyon oswa mak, swadizan Grok3 ki pi entelijan an toujou pa t kapab reponn kesyon sa a kòrèkteman. Grok3 pa t rive idantifye siyifikasyon kesyon an avèk presizyon.

Tès sa a byen vit te atire anpil atansyon nan men anpil zanmi, e koensidansèlman, plizyè tès menm jan an lòt bò dlo te montre Grok3 ap lite ak kesyon fizik/matematik debaz tankou "Ki boul ki tonbe an premye nan Tou Panche Piza a?" Kidonk, yo te make l avèk imou kòm "yon jeni ki pa vle reponn kesyon senp."

Grok3 bon, men li pa pi bon pase R1 oubyen o1-Pro.

Grok3 te fè eksperyans "echèk" nan anpil tès konesans komen nan pratik. Pandan evènman lansman xAI a, Musk te demontre itilizasyon Grok3 pou analize klas ak efè pèsonaj yo nan jwèt Path of Exile 2 a, ke li te di li jwe souvan, men pifò nan repons Grok3 te bay yo te kòrèk. Musk pandan emisyon an dirèk pa t remake pwoblèm evidan sa a.

Erè sa a pa sèlman bay plis prèv pou entènotè etranje yo pase Musk nan rizib paske li "jwenn yon ranplasman" nan jwèt videyo, men li te soulve tou gwo enkyetid konsènan fyab Grok3 nan aplikasyon pratik yo. Pou yon "jeni" konsa, kèlkeswa kapasite reyèl li yo, fyab li nan senaryo aplikasyon trè konplèks, tankou travay eksplorasyon Mas, rete an dout.

Kounye a, anpil moun ki te fè tès epi ki te jwenn aksè a Grok3 semèn de sa, ansanm ak moun ki te fèk teste kapasite modèl la pandan kèk èdtan yè, tout rive nan yon konklizyon komen: "Grok3 bon, men li pa pi bon pase R1 oubyen o1-Pro."

Yon Pèspektiv Kritik sou "Deranje Nvidia"

Nan PPT ofisyèlman prezante a pandan lansman an, yo te montre Grok3 "byen lwen devan" nan Chatbot Arena a, men sa a te itilize teknik grafik avèk entelijans: aks vètikal la sou tablo lidè a te sèlman liste rezilta nan seri nòt 1400-1300 yo, sa ki fè diferans orijinal 1% nan rezilta tès yo parèt eksepsyonèlman siyifikatif nan prezantasyon sa a.

Nan rezilta reyèl modèl yo, Grok3 sèlman 1-2% devan DeepSeek R1 ak GPT-4.0, sa ki koresponn ak eksperyans anpil itilizatè nan tès pratik ki pa jwenn "okenn diferans aparan". Grok3 sèlman depase siksesè li yo pa 1%-2%.

Malgre Grok3 te fè pi bon nòt pase tout modèl ki teste piblikman kounye a, anpil moun pa pran sa oserye: apre tou, xAI te deja kritike pou "manipilasyon nòt" nan epòk Grok2 a. Kòm tablo klasman an te penalize stil longè repons lan, nòt yo te diminye anpil, sa ki te fè moun ki nan endistri a souvan kritike fenomèn "gwo nòt men kapasite ki ba" a.

Kit se atravè "manipilasyon" tablo klasman an oswa teknik konsepsyon nan ilistrasyon yo, yo revele xAI ak obsesyon Musk ak nosyon "lide gwoup la" nan kapasite modèl yo. Musk te peye yon pri ki wo pou maj sa yo: pandan lansman an, li te vante tèt li ke li te itilize 200,000 GPU H100 (li te deklare "plis pase 100,000" pandan emisyon an dirèk) epi li te reyalize yon tan fòmasyon total de 200 milyon èdtan. Sa te fè kèk moun kwè ke li reprezante yon lòt gwo avantaj pou endistri GPU a epi konsidere enpak DeepSeek sou sektè a kòm "san sans". Li enpòtan pou note ke gen kèk moun ki kwè ke pouvwa enfòmatik la pral lavni fòmasyon modèl la.

Sepandan, gen kèk itilizatè entènèt ki te konpare konsomasyon 2000 GPU H800 pandan de mwa pou pwodui DeepSeek V3, yo te kalkile ke konsomasyon enèji antrènman reyèl Grok3 a se 263 fwa plis pase V3 a. Diferans ki genyen ant DeepSeek V3, ki te fè 1402 pwen, ak Grok3 se jis anba 100 pwen. Apre piblikasyon done sa yo, anpil moun te byen vit reyalize ke dèyè tit Grok3 kòm "pi fò nan mond lan" gen yon efè itilite majinal klè—lojik pi gwo modèl ki jenere pi bon pèfòmans te kòmanse montre retou ki diminye.

Menm avèk "gwo nòt men kapasite ki ba," Grok2 te gen gwo kantite done premye pati kalite siperyè ki soti nan platfòm X (Twitter) pou sipòte itilizasyon. Sepandan, nan fòmasyon Grok3, xAI te natirèlman rankontre "plafon" OpenAI ap fè fas kounye a—mank done fòmasyon prim byen vit ekspoze itilite majinal kapasite modèl la.

Devlopè Grok3 yo ak Musk yo pwobableman premye moun ki konprann epi idantifye reyalite sa yo an pwofondè, se poutèt sa Musk te kontinye mansyone sou rezo sosyal yo ke vèsyon itilizatè yo ap itilize kounye a se "toujou jis beta a" epi ke "vèsyon konplè a pral soti nan mwa k ap vini yo." Musk te pran wòl responsab pwodwi Grok3 la, li sijere ke itilizatè yo bay fidbak sou divès pwoblèm yo rankontre nan seksyon kòmantè yo. Li ta ka responsab pwodwi ki pi swiv sou Latè.

Epoutan, nan yon sèl jou, pèfòmans Grok3 a san dout te sonnen alam pou moun ki te espere konte sou "gwo fòs konpitasyonèl" pou antrene gwo modèl ki pi fò: dapre enfòmasyon Microsoft ki disponib piblikman, GPT-4 OpenAI a gen yon gwosè paramèt 1.8 trilyon paramèt, plis pase dis fwa gwosè paramèt GPT-3 la. Gen rimè ki sijere ke gwosè paramèt GPT-4.5 la ta ka menm pi gwo.

Tank gwosè paramèt modèl yo ap monte an flèche, pri fòmasyon yo ap monte an flèche tou. Avèk prezans Grok3, konpetitè tankou GPT-4.5 ak lòt moun ki vle kontinye "boule lajan" pou reyalize pi bon pèfòmans modèl atravè gwosè paramèt yo dwe konsidere plafon ki klèman vizib kounye a epi reflechi sou kijan pou simonte li. Kounye a, Ilya Sutskever, ansyen chèf syantis nan OpenAI, te deja deklare an Desanm pase a, "Pre-fòmasyon nou abitye avèk la pral rive nan yon fen," sa ki te resisite nan diskisyon yo, sa ki pouse efò pou jwenn vrè chemen an pou antrene gwo modèl yo.

Pwen de vi Ilya a sonnen alam nan endistri a. Li te prevwa avèk presizyon epuizman iminan nouvo done aksesib yo, sa ki ta mennen nan yon sitiyasyon kote pèfòmans pa ka kontinye amelyore atravè akizisyon done, li te konpare sa ak epuizman konbistib fosil yo. Li te endike ke "tankou petwòl, kontni ki pwodui pa moun sou entènèt la se yon resous limite." Nan prediksyon Sutskever yo, pwochen jenerasyon modèl yo, apre fòmasyon anvan an, pral posede "vrè otonomi" ak kapasite rezònman "menm jan ak sèvo imen an."

Kontrèman ak modèl pre-antre jodi a ki prensipalman depann sou matche kontni (ki baze sou kontni modèl ki te aprann deja), sistèm IA nan lavni yo pral kapab aprann epi etabli metodoloji pou rezoud pwoblèm nan yon fason ki sanble ak "panse" sèvo imen an. Yon moun ka rive nan yon konpetans fondamantal nan yon sijè ak jis literati pwofesyonèl debaz, alòske yon gwo modèl IA mande plizyè milyon done pou rive nan efikasite nivo debaz ki pi efikas. Menm lè yo chanje yon ti kras mo yo, kesyon fondamantal sa yo ka pa byen konprann, sa ki montre ke modèl la pa vrèman amelyore nan entèlijans: kesyon debaz men ki pa gen solisyon yo mansyone nan kòmansman atik la reprezante yon egzanp klè sou fenomèn sa a.

Konklizyon

Sepandan, pi lwen pase fòs brit la, si Grok3 reyisi revele endistri a ke "modèl pre-antrene yo ap pwoche bò fen yo," sa ta gen konsekans enpòtan pou domèn nan.

Petèt apre foli ki antoure Grok3 la ap diminye piti piti, nou pral temwen plis ka tankou egzanp Fei-Fei Li a kote li "ajiste modèl pèfòmans wo sou yon seri done espesifik pou sèlman $50", epi finalman li pral dekouvri vrè chemen pou rive nan AGI.

Jwenn Solisyon Kab ELV

Kab Kontwòl

Pou BMS, BUS, Endistriyèl, Kab Enstrimantasyon.

Klike la a

Sistèm Kablaj Estriktire

Rezo ak Done, Kab Fib Optik, Kòd Patch, Modil, Plak Fasad

Klike la a

Revizyon Ekspozisyon ak Evènman 2024 yo

Dat piblikasyon: 19 Fevriye 2025

Tès Grok3 ki "pi entelijan nan mond lan" an

Entwodiksyon

Grok3 bon, men li pa pi bon pase R1 oubyen o1-Pro.

Yon Pèspektiv Kritik sou "Deranje Nvidia"

Konklizyon

Kab Kontwòl

Sistèm Kablaj Estriktire

16-18 avril 2024 Mwayen Oryan-Enèji nan Doubay

16-18 avril 2024 Securika nan Moskou

9 me 2024 LANSMAN NOUVO PWODWI AK TEKNOLOJI nan Shanghai

22-25 Oktòb 2024 SEKIRITE CHINA nan Beijing

19-20 novanm 2024 MOND KONEKTE KSA