Tès "entelijan nan mond lan" grok3

AIPU Waton Group (1)

Prezantasyon

Ou panse GROK3 pral "pwen final la" nan pre-ki resevwa fòmasyon modèl?

Elon Musk ak ekip la XAI ofisyèlman te lanse vèsyon an dènye nan Grok, Grok3, pandan yon livestream. Anvan evènman sa a, yon kantite siyifikatif nan enfòmasyon ki gen rapò, makonnen ak 24/7 musk la battage pwomosyonèl, leve soti vivan atant mondyal pou GROK3 nan nivo san parèy. Jis yon semèn de sa, musk konfyans deklare pandan yon livestream pandan y ap fè kòmantè sou Deepseek R1, "Xai se sou yo lanse yon pi bon modèl AI." Soti nan done yo prezante ap viv la, GROK3 te rapòte plis pase tout modèl endikap aktyèl nan referans pou matematik, syans, ak pwogramasyon, ak musk menm reklame ke GROK3 yo pral itilize pou travay enfòmatik ki gen rapò ak misyon Masx a, predi "avans nan nivo a pri Nobel nan twa ane." Sepandan, sa yo se kounye a jis afirmasyon musk la. Apre lansman an, mwen teste dènye vèsyon an beta nan GROK3 ak poze kesyon an klasik Trick pou modèl gwo: "Ki se pi gwo, 9.11 oswa 9.9?" Malerezman, san okenn kalifikasyon oswa mak, sa yo rele smartest GROK3 toujou pa t 'kapab reponn kesyon sa a kòrèkteman. GROK3 echwe pou pou idantifye avèk presizyon siyifikasyon kesyon an.

 

Tès sa a byen vit te trase atansyon konsiderab nan men anpil zanmi, ak azar, divès kalite tès menm jan an lòt bò dlo yo te montre GROK3 ki gen difikilte ak debaz fizik/kesyon matematik tankou "Ki boul tonbe premye soti nan gwo kay won an apiye nan Piz?" Se konsa, li te komik ki make kòm "yon jeni vle reponn kesyon senp."

640

Grok3 se yon bon bagay, men li pa pi bon pase R1 oswa O1-Pro.

GROK3 ki gen eksperyans "echèk" sou anpil tès konesans komen nan pratik. Pandan evènman an lansman XAI, musk demontre lè l sèvi avèk GROK3 analize klas yo karaktè ak efè nan chemen an jwèt nan ekzil 2, ki li te deklare ke yo jwe souvan, men pi fò nan repons yo bay nan GROK3 yo te kòrèk. Musk pandan livestream a pa remake pwoblèm sa a evidan.

 

Erè sa a pa sèlman bay plis prèv pou netizens lòt bò dlo yo moke musk pou "jwenn yon ranplasan" nan Gaming, men tou leve soti vivan enkyetid enpòtan konsènan fyab GROK3 a nan aplikasyon pou pratik. Pou tankou yon "jeni," kèlkeswa kapasite aktyèl li yo, fyab li yo nan senaryo aplikasyon trè konplèks, tankou travay eksplorasyon Mas, rete nan dout.

 

Kounye a, anpil tès ki te resevwa aksè a GROK3 semèn de sa, ak moun ki jis teste kapasite yo modèl pou kèk èdtan yè, tout pwen nan yon konklizyon komen: "GROK3 se yon bon bagay, men li pa pi bon pase R1 oswa O1-Pro."

640 (1)

Yon pèspektiv kritik sou "deranje nvidia"

Nan PPT a ofisyèlman prezante pandan lage a, GROK3 yo te montre yo dwe "byen lwen devan" nan Arena a chatbot, men sa a teknik grafik itilize grafik: aks vètikal la sou Leaderboard la sèlman ki nan lis rezilta yo nan ranje a nòt 1400-1300, fè orijinal la 1% diferans nan rezilta tès yo parèt eksepsyonèlman enpòtan nan prezantasyon sa a.

640

Nan modèl aktyèl rezilta ki fè nòt, GROK3 se jis 1-2% devan yo nan Deepseek R1 ak GPT-4.0, ki koresponn ak eksperyans anpil itilizatè yo nan tès pratik ki te jwenn "pa gen okenn diferans aparan." Grok3 sèlman depase siksesè li yo pa 1%-2%.

640

Malgre ke GROK3 te bay nòt pi wo pase tout modèl kounye a teste piblikman, anpil pa pran sa a oserye: apre tout, XAI te deja te kritike pou "manipilasyon nòt" nan epòk la GROK2. Kòm Leaderboard la penalize style repons longè, nòt yo anpil diminye, dirijan inisye endistri yo souvan kritike fenomèn nan "segondè ki fè nòt men kapasite ki ba."

 

Si wi ou non nan Leaderboard "manipilasyon" oswa ke trik nouvèl konsepsyon nan ilistrasyon yo, yo revele mani XAI ak musk a ak nosyon de "dirijan pake a" nan kapasite modèl. Musk peye yon pri apik pou marges sa yo: pandan lansman an, li te nan lè l sèvi avèk 200,000 H100 GPUs (reklame "plis pase 100,000" pandan livestream a) ak reyisi yon tan fòmasyon total de 200 milyon èdtan. Sa a te mennen kèk kwè ke li reprezante yon lòt benefis siyifikatif pou endistri a GPU ak yo konsidere enpak Deepseek a sou sektè a kòm "tèt chaje." Miyò, gen kèk kwè ke absoli pouvwa enfòmatik yo pral lavni nan fòmasyon modèl.

 

Sepandan, kèk netizens konpare konsomasyon an nan 2000 H800 GPUs sou de mwa yo pwodwi Deepseek V3, kalkile ki aktyèl konsomasyon pouvwa fòmasyon GROK3 a se 263 fwa sa yo ki an V3. Diferans ki genyen ant Deepseek V3, ki bay nòt 1402 pwen, ak GROK3 se jis anba 100 pwen. Apre liberasyon an nan done sa a, anpil byen vit reyalize ke dèyè tit Grok3 a kòm "pi fò nan mond lan" bay manti yon klè efè sèvis piblik majinal -lojik nan pi gwo modèl génération pi fò pèfòmans te kòmanse montre diminye retounen.

640 (2)

Menm ak "segondè ki fè nòt men kapasite ki ba," GROK2 te gen kantite lajan vas nan-wo kalite premye-pati done ki sòti nan X (Twitter) platfòm la sipòte l '. Sepandan, nan fòmasyon an nan GROK3, XAI natirèlman rankontre "plafon an" ki Openai kounye a fè fas a -mank nan done fòmasyon prim rapid ekspoze sèvis piblik la majinal nan kapasite modèl la.

 

Devlopè yo nan GROK3 ak musk gen plis chans premye moun ki konprann ak idantifye sa yo reyalite pwofondman, ki se poukisa musk te toujou mansyone sou medya sosyal ke itilizatè yo vèsyon yo gen kounye a se "toujou jis beta a" e ke "vèsyon an plen yo pral lage nan mwa kap vini yo." Musk te pran sou wòl nan manadjè pwodwi GROK3 a, sijere itilizatè bay fidbak sou divès kalite pwoblèm rankontre nan seksyon an kòmantè.

 

Men, nan yon jou, pèfòmans GROK3 a san dout leve soti vivan alam pou moun ki espere konte sou "masiv misk enfòmatik" nan tren pi fò modèl gwo: ki baze sou enfòmasyon ki disponib Microsoft piblikman, GPT-4 OpenAI a gen yon gwosè paramèt nan 1.8 billions paramèt, sou dis lè sa yo ki nan GPT-3. Rimè sijere ke gwosè a paramèt nan GPT-4.5 ta ka menm pi gwo.

 

Kòm gwosè a paramèt modèl transande, depans sa yo fòmasyon yo tou flanbè. Avèk prezans GROK3 a, konkiran tankou GPT-4.5 ak lòt moun ki vle kontinye "boule lajan" reyalize pi bon pèfòmans modèl nan gwosè paramèt dwe konsidere plafon an ki se kounye a klèman nan je ak kontanple ki jan yo simonte li. Nan moman sa a, Ilya Sutskever, ansyen syantis chèf nan Openai, te deja deklare Desanm dènye, "pre-fòmasyon an nou yo abitye avèk ap vini nan yon fen," ki te resurfaced nan diskisyon, pouse efò yo jwenn chemen an vre pou fòmasyon modèl gwo.

640 (3)

Opinyon Ilya a te kònen klewon alam la nan endistri an. Li avèk presizyon prevwa fatig iminan nan done ki aksesib nouvo, ki mennen ale nan yon sitiyasyon kote pèfòmans pa ka kontinye ap ogmante nan akizisyon done, tankou li nan fatig nan konbistib fosil. Li endike ke "tankou lwil oliv, moun-pwodwi kontni sou entènèt la se yon resous limite." Nan prediksyon Sutskever a, pwochen jenerasyon modèl yo, pòs-pre-fòmasyon, pral posede "otonomi vre" ak kapasite rezònman "menm jan ak nan sèvo imen an."

 

Kontrèman ak modèl pre-ki resevwa fòmasyon jodi a ki prensipalman konte sou matche kontni (ki baze sou kontni an modèl deja aprann), nan lavni sistèm AI yo pral kapab aprann epi etabli metodoloji yo rezoud pwoblèm nan yon fason analogue nan "panse a" nan sèvo imen an. Yon moun ka reyalize konpetans fondamantal nan yon sijè ki gen jis literati debaz pwofesyonèl, pandan y ap yon AI gwo modèl mande pou dè milyon de pwen done reyalize jis ki pi fondamantal antre nan nivo efikasite. Menm lè se redaksyon an chanje yon ti kras, kesyon sa yo fondamantal pa pouvwa ap kòrèkteman konprann, ilistre ke modèl la pa te vrèman amelyore nan entèlijans: kesyon yo debaz ankò ensolab mansyone nan kòmansman atik la reprezante yon egzanp klè nan fenomèn sa a.

微信图片 _20240614024031.jpg1

Konklizyon

Sepandan, pi lwen pase fòs brital, si GROK3 tout bon reyisi nan revele nan endistri a ki "modèl pre-ki resevwa fòmasyon yo ap apwoche fen yo," li ta pote enplikasyon siyifikatif pou jaden an.

Petèt apre foli ki antoure Grok3 piti piti diminye, nou pral temwen plis ka tankou egzanp Fei-Fei Li nan nan "akor modèl pèfòmans-wo sou yon dataset espesifik pou jis $ 50," finalman dekouvri chemen an vre nan AGI.

Jwenn solisyon kab ELV

Kontwòl câbles

Pou BMS, otobis, endistriyèl, kab instrumentation.

Sistèm kabl estriktire

Rezo & done, fib-optik kab, kòd patch, modil, plak

2024 Ekspozisyon & Evènman Revizyon

Apr.16th-18th, 2024 Mwayen-East-Enèji nan Emira Arab Ini

Apr.16th-18th, 2024 Securika nan Moskou

Me.9th, 2024 Nouvo Pwodwi & Technologies Lanse Evènman nan Shanghai

Oct.22nd-25th, 2024 Sekirite Lachin nan Beijing

Nov.19-20, 2024 Konekte Mondyal KSA


Post tan: Feb-19-2025