OpenAI:n käännös: Ei kouluteta GPT-4:ää API-asiakastiedoilla

openai-privacy-changes-6457d3fd3d25f-sej-760x400.png

Merkittävästi aiemmista käytännöistään poiketen OpenAI on ilmoittanut, että se ei enää käytä asiakkaan tietoja, jotka on lähetetty sen API-käyttöliittymän kautta, kouluttaakseen laajoja kielimallejaan, kuten GPT-4.

Muutos vahvistettiin avoinAI:n toimitusjohtajan Sam Altmanin antamassa haastattelussa CNBC:lle.

OpenAI:n uusi lähestymistapa käyttäjätietoon

OpenAI:n muutos politiikassa otettiin käyttöön 1. maaliskuuta 2023, kun yritys hiljaisesti päivitti käyttöehtonsa heijastaakseen tätä uutta sitoutumista käyttäjän yksityisyyteen.

Altman selvensi, "Asiakkaat haluavat selvästi, ettemme kouluta heidän tietojaan, joten olemme muuttaneet suunnitelmiamme: Emme tee niin."

APIt eli sovellusliittymät ovat teknologisia kehyksiä, jotka mahdollistavat asiakkaiden suoran yhteyden OpenAI:n ohjelmistoon.

Altman totesi, että OpenAI ei ole käyttänyt API-tietoja mallikoulutukseen "jo jonkin aikaa", mikä viittaa siihen, että tämä virallinen ilmoitus muodollistaa jo olemassa olevan käytännön.

Vaikutukset yritysasiakkaille

OpenAI:n toimenpide on kauaskantoisia vaikutuksia, erityisesti sen liiketoimintakumppaneille, joihin kuuluvat jättiläiset kuten Microsoft, Salesforce ja Snapchat.

Näitä yrityksiä on todennäköisesti enemmän, jotka hyödyntävät OpenAI:n API:n kykyjä toiminnassaan, joten yksityisyys ja tietosuojan muutos on erityisen tärkeää heidän kannaltaan.

Kuitenkin uudet tietosuojamenetelmät koskevat ainoastaan yrityksen API-palveluita käyttäviä asiakkaita. OpenAI:n päivitetyissä käyttöehdoissa todetaan: "Voimme käyttää sisältöä muista palveluista kuin API:stamme."

Näin ollen muita datan syöttömuotoja, kuten ChatGPT-chatbotiin syötettyä tekstiä, voidaan edelleen käyttää OpenAI:n toimesta, ellei dataa jaeta API:n kautta.

Laittoman Toiminnan Laajempi Vaikutus

OpenAI:n politiikkamuutos tapahtuu samalla kun teollisuudet painiskelevat suurten kielimallien, kuten OpenAI:n ChatGPT:n, mahdollisten vaikutusten kanssa. Nämä voivat korvata ihmisten perinteisesti luomaa materiaalia.

Esimerkiksi Writers Guild of America aloitti äskettäin lakon kun neuvottelut killan ja elokuvastudioiden välillä kariutuivat. Killan oli kannattanut rajoituksia OpenAI:n ChatGPT:n käyttämiseen käsikirjoituksen luomiseen tai uudelleenkirjoittamiseen.

OpenAI:n päätös olla käyttämättä asiakastietoja koulutukseen on käännekohta jatkuvassa keskustelussa tietosuojasta ja tekoälystä. Kun yritykset jatkavat tekoälyteknologian tutkimista ja rajojen venyttämistä, käyttäjän yksityisyyden varmistaminen ja luottamuksen säilyttäminen pysyvät todennäköisesti näiden keskustelujen keskiössä.

ChatGPT:n kehitys: GPT-3 GPT-4:ään

On tärkeää huomata, että OpenAI:n sitoumus olla käyttämättä asiakkaan tietoja koulutukseen koskee sen uusinta kielimallia, GPT-4, joka julkaistiin 14. maaliskuuta 2023.

GPT-4 toi mukanaan useita parannuksia edeltäjäänsä, GPT-3:een, mukaan lukien merkittävä sanamäärän rajoituksen kasvu (25 000 verrattuna ChatGPT:n 3 000 sanan rajoitukseen), suurempi kontekstin ikkunan koko sekä parannettu päättely- ja ymmärrystaito.

Toinen merkittävä GPT-4:n ominaisuus on sen multimodaalisuus eli kyky ymmärtää ja päätellä tietoa kuvista lisäksi tekstistä. Tämä uusin malli generoi ihmismäisempiä tekstejä hyödyntäen esimerkiksi hymiöitä henkilökohtaisemman tunnelman luomiseksi.

Kuitenkin GPT-4:n tarkka koko ja arkkitehtuuri pysyvät julkistamattomina, mikä herättää spekulaatioita mallin yksityiskohtien suhteen.

Vaikka näistä huhuista huolimatta, OpenAI:n toimitusjohtaja on kiistänyt tarkat väitteet mallin koosta.

Mitä suorituskykyyn tulee, GPT-4 on osoittanut vahvuutensa tekstinluonnissa, mutta sillä on myös joitain rajoituksia. Esimerkiksi se sai pistemääränsä 54. persentiilissä Graduate Record Examination (GRE) -kirjoitustehtävässä ja suoriutui 43. - 59. persentiilissä AP Calculus BC -kokeessa.

Lisäksi se suoriutui hyvin helpoista Leetcode-ohjelmointitehtävistä, mutta sen suorituskyky laski vaikeampien tehtävien myötä.

Vaikka GPT-4:n koulutusprosessin yksityiskohtia ei virallisesti ole dokumentoitu, tiedetään että GPT-mallit yleensä sisältävät laajamittaista koneoppimista monipuolisella valikoimalla internet-tekstiä.

Odotamme innolla

OpenAI:n tietojenkäytäntöjen muutosten seurauksena sen kielimallien koulutukseen käytettävät tiedot eivät sisällä API:n kautta jaettua tietoa, elleivät käyttäjät nimenomaisesti suostu antamaan sitä tähän tarkoitukseen.

Vaikka tämä teknologia kehittyy ja saa yhä suuremman roolin elämässämme, on mielenkiintoista miten yritykset kääntyvät ja reagoivat huoliin tietojen yksityisyyden suojaamisesta ja ihmisten luottamuksen ansaitsemisesta.

Liittyvät artikkelit

Näytä lisää >>

Avaa tekoälyn voima HIX.AI:lla!