ChatGPT exceluje ve školních testech a poukazuje na chyby ve smart kontraktech!

GPT-4, nejnovější verze chatbota ChatGPT s umělou inteligencí od firmy OpenAI, která byla odprezentována v úterý a zatím je dostupná jen těm, kteří si za tuto službu zaplatí, dokáže projít americkými středoškolskými testy SAT a také zkouškami na právnické fakultě a to v obou případech téměř se skóre 90 %. Také má nové možnosti zpracování údajů, které v předchozí verzi nebyly možné.

Čísla z výsledků testů GPT-4 odhalují, že tato umělá inteligence dokáže také konvertovat obrazové, zvukové a video vstupy na text a kromě toho kreativněji a spolehlivěji zpracovávat instrukce. Její zásah se tak rozšiřuje i na širší oblast, než dosud holé texty, které vkládali uživatelé ke zpracování.

GPT-4 je tak například na rozdíl od přechodu GPT3.5 schopen nejen pracovat se slovy, ale také popisovat obrázky v reakci na jednoduché psané příkazy osoby v souvislosti s nimi.

,,Když se například zobrazí fotografie boxerské rukavice visící nad dřevěnou houpačkou s míčem na jedné straně, člověk se může zeptat, co se stane, pokud rukavice spadne, a GPT-4 odpoví, že by zasáhla houpačku a způsobil míč vyletět nahoru,“ vysvětluje portál Washington Post.

Očekává se, že ChatGPT bude schopen vytvářet i obrázky, či jiný multimediální obsah, avšak OpenAI uvedla, že tento krok ještě odložili, protože má obavy z jejího zneužití.

Tento nástroj by byl například schopen podívat se na obraz velké skupiny lidí a nabídnout o nich známé informace včetně jejich identity. To by mohlo být dokonce zneužito k hromadnému sledování.

Ve škole by exceloval

„Prošel simulovanou advokátní zkouškou se skóre kolem 10 % nejlepších účastníků testu. Na druhé straně, skóre GPT-3.5 bylo kolem spodních 10 %,“ tvrdí OpenAI.

Čísla ukazují, že GPT-4 dosáhl na zkoušce LSA skóre 163, což je 88 %.Tuto zkoušku musí studenti v USA absolvovat, aby mohli být přijati na právnickou fakultu.

GPT4 prošel testem pro 20 nejlepších právnických fakult

Skóre GPT4 by mu zaručilo přijetí na 20 nejlepších právnických fakult. Zároveň mu chybělo jen několik bodů potřebných k přijetí na prestižní školy, jako jsou Harvard, Stanford, Princeton nebo Yale. Předchozí verze ChatGPT dosáhla pouze 149 bodů na LSAT, čímž se dostala na spodních 40 % škol.

GPT-4 také dosáhl skóre 298 ze 400 v Uniform Bar Exam. Tímto testem procházejí absolventi právnických fakult a umožňuje jim vykonávat právnickou praxi v kterékoli jurisdikci USA. Stará verze ChatGPT měla v tomto testu problémy a skončila ve spodních 10 % se skóre 213 ze 400.

Co se týče zkoušek SAT, které absolvují studenti středních škol v USA na měření jejich připravenosti na vysokou školu, GPT-4 dosáhl 93% a 89%. GPT-4 vyniká i ve vědách, přičemž dosáhl výrazně nadprůměrného skóre v biologii (85–100 %), chemii (71–88 %) a ve fyzice(66–84 %).

Nicméně jeho skóre z AP Calculus, co jsou matematické zkoušky, bylo poměrně průměrné, a dosáhlo 43 % a 59 %.

Další oblastí, kde má GPT-4 nedostatky, byly zkoušky z anglické literatury, kde bylo zaznamenáno skóre 8% a 44 % ve dvou samostatných testech. OpenAI uvedla, že GPT-4 a GPT-3.5 absolvovaly tyto testy z praktických zkoušek 2022-2023 a že nástroje pro zpracování jazyka neabsolvovaly žádný specifický trénink.

„Na tyto zkoušky jsme neabsolvovali žádný specifický trénink. Většinu problémů na zkouškách viděl model poprvé, ale věříme, že výsledky budou reprezentativní.“

Výsledky vyvolaly obavy

Výsledky vyvolaly strach i v komunitě na Twitteru. Nick Almond, zakladatel Factory DAO, řekl 14. března, že GPT4 vystraší lidi a zhroutí globální vzdělávací systém.

They’ve basically trained it to pass all the tests that we use in the education system, and it does, ace them.

So… we either need a new way of measuring intelligence, or 90% of us are dumber than the machines. https://t.co/1UCRS7ANSh

— drnick (@DrNickA) March 14, 2023

Bývalý ředitel Coinbase Conor Grogan řekl, že do GPT-4 vložil ETH smart kontrakt. Chatbot okamžitě poukázal na několik bezpečnostních chyb a nastínil, jak lze kód zneužít.

I dumped a live Ethereum contract into GPT-4.

In an instant, it highlighted a number of security vulnerabilities and pointed out surface areas where the contract could be exploited. It then verified a specific way I could exploit the contract pic.twitter.com/its5puakUW

— Conor (@jconorgrogan) March 14, 2023

Dřívější testy smart kontraktů na ChatGPT zjistily, že i jeho první verze byla schopna v přiměřené míře odhalit chyby kódu.

Rowan Cheung, zakladatel informačního bulletinu AI The Rundown, sdílel video, na kterém GPT přepisuje ručně nakreslenou webovou stránku na kus papíru do kódu.

I just watched GPT-4 turn a hand-drawn sketch into a functional website.

This is insane. pic.twitter.com/P5nSjrk7Wn

— Rowan Cheung (@rowancheung) March 14, 2023

Stále dělá i chyby

OpenAI během prezentace uvedla, že ChatGPT4 stále není zdaleka dokonalý. Dělá mnoho chyb předchozích verzí, kam zařadili i tzv. „halucinace“, sociální předsudky či špatné rady.

Nové verzi také stále chybí data po září 2021, což znamená, že nepracuje s nejnovějšími informacemi. ChatGPT se také ještě nedokáže učit ze svých zkušeností, což omezuje jeho schopnost učit se nové věci.

OpenAI také prozradila, že nová verze ChatGPT4 byla využívána již měsíc v prohlížeči Bing od Microsoftu.

Zdroj: cointelegraph.com