ChatGPTin edistyneet kyvyt, kuten koodin korjaaminen, esseen kirjoittaminen tai vitsin kertominen, ovat johtaneet sen massiiviseen suosioon. Kyvyistään huolimatta sen avustaminen on tähän asti rajoittunut tekstiin – mutta se on muuttumassa.
Tiistaina OpenAI julkisti GPT-4:n, suuren multimodaalisen mallin, joka hyväksyy sekä teksti- että kuva-aineistot ja tuottaa tekstiä.
Myös: Kuinka saada ChatGPT tarjoamaan lähteitä ja viittauksia
Ero GPT-3.5:n ja GPT-4:n välillä on "hienovarainen" satunnaisessa keskustelussa. Uusi malli tulee kuitenkin olemaan paljon kyvykkäämpi luotettavuuden, luovuuden ja jopa älykkyyden suhteen.
OpenAI:n mukaan GPT-4 sijoittui parhaimman 10 prosentin joukkoon simuloitussa baari- tentissä, kun taas GPT-3.5 sijoittui noin huonoimman 10 prosentin joukkoon. GPT-4 myös suoriutui paremmin kuin GPT-3.5 useissa benchmark-testeissä, kuten alla olevasta kaaviosta näkyy.
ChatGPT:in yhteydessä käytetään kieli mallia, joka on hienosäädetty 3.5 -sarjan mallista, minkä avulla chatbotti pystyy tuottamaan vain tekstiä.
OpenAI:n GPT-4:n julkistus seurasi viime viikolla Microsoft Saksan CTO:n, Andreas Braunin, puheesta, jossa hän kertoi GPT-4:n saapuvan pian ja mahdollistavan tekstin muuttamisen videoksi.
Lisäksi: Kuinka ChatGPT toimii?
"Esittelemme GPT-4:n ensi viikolla; siellä meillä on multimodaalisia malleja, jotka tarjoavat täysin erilaisia mahdollisuuksia -- esimerkiksi videoita," kertoi Braun Heiselle, saksalaiselle uutisjulkaisulle, tapahtuman aikana.
Vaikka GPT-4 on monimuotoinen, väitteet teksti-videogeneraattorista olivat hieman liioiteltuja. Malli ei vielä pysty tuottamaan videoita, mutta se pystyy ottamaan vastaan visuaalisia syötteitä, mikä on merkittävä muutos aiempaan malliin nähden.
Yksi esimerkeistä, jonka OpenAI tarjosi tämän ominaisuuden esittelemiseksi, näyttää kuinka ChatGPT skannaa kuvaa yrittäen selvittää, mikä kuvassa oli hauskaa, käyttäjän syötteen perusteella.
Muita esimerkkejä olivat kuvagraafin lataaminen ja GPT-4:ltä laskemisten pyytäminen tai työkirjan lataaminen ja sitä kysymysten ratkaiseminen.
Lisäksi: 5 tapaa, joilla ChatGPT voi auttaa sinua kirjoittamaan esseitä
OpenAI ilmoittaa, että se julkaisee GPT-4:n tekstinsyöttökyvyn ChatGPT:n ja sen ohjelmointirajapinnan kautta odotuslistan kautta. Sinun täytyy odottaa hieman kauemmin kuvansyöttöominaisuuden kanssa, koska OpenAI tekee yhteistyötä yhden kumppanin kanssa sen käynnistämiseksi.
Jos olet pettynyt siitä, ettei sinulla ole tekstistä videoon -muunninta, älä huoli, se ei ole täysin uusi käsite. Suuret teknologiajätit kuten Meta ja Google jo kehittävät malleja tähän tarkoitukseen. Metalla on Make-A-Video ja Googlessa on Imagen Video, jotka molemmat käyttävät tekoälyä videojen tuottamiseen käyttäjän syötteestä.