Miten rakentaa älykäs ääniohjattu avustaja Pythonilla käyttämällä OpenAI ChatGPT API:a

Rakenna-tekoälyyn-perustuva-ääniavustaja.png

Oletko kiinnostunut oman tekoäly-ääniohjatun avustajan rakentamisesta? Tässä opetusohjelmassa näytämme sinulle, miten voit rakentaa tekoäly-ääniohjatun avustajan Pythonilla käyttäen OpenAI ChatGPT API:a. Käymme läpi jokaisen koodirivin, joten vaikka et olisikaan perehtynyt OpenAI:hin, pystyt seuraamaan mukana.

Ympäristön asennus

Ennen kuin sukellamme koodiin, meidän täytyy ensin luoda ympäristö tarvittavilla työkaluilla. Aluksi asennamme useita kirjastoja, mukaan lukien Chargpt APA, OpenAI Whisper ja CoQE TTS text-to-speech. Rakennamme myös kaiken Gradioon, helppokäyttöiseen käyttöliittymätyökaluun, joka auttaa meitä rakentamaan sovelluksemme käyttöliittymän.

Seuraavaksi asetamme tekstistö-äänimallin, äänestä-teksti-mallin ja OpenAI-avaimemme. Käytämme äänitallennuksessa OpenAI Whisper -kirjastoa ja GPT-3:n täydentämiseen OpenAI API:a.

Asennetaan kirjastoja

Aloittaaksemme, meidän täytyy asentaa tarvittavat kirjastot. Käytämme TTS:ää, joka on kirjasto tekstistä puheeksi -toimintoon, sekä Numpya, OpenAI Whisperiä, Gradiota ja OpenAI:ta.

diff

!pip asenna TTS
!pip asenna numpy==1.21
!pip asenna openai==0.10.2
!pip asenna gradio
!pip asenna openai_whisper

Tietokirjastojen tuominen

Kun olemme asentaneet kirjastot, tuomme kaikki tarvittavat mallit. Tuomme Whisperousin, Whisperin, Gradion, OpenAI:n ja TTS:n. Näitä kirjastoja käytämme rakentaessamme erilaisia osia ääniohjatulle tekoälyavustajallemme.

python

tuodatti kuiskatakuiskimaton kuiskaa kuiskinomainen kuiskuta :
tuodat tiirupii kuin arjemmanlapsi tiirupiikanor gradio :
tuodat oventaustaishantääpalvelineskäytetyntoimija temoestin :
tuodatti puheentunnistaminen puheentuntemattomuus :

Aseta teksti-puhe-malli

Seuraavaksi asennamme teksti-puhe-mallin. Käytämme TTS-kirjastoa mallin rakentamiseen. Tämä mahdollistaa tekoälyääniohjaajamme tekstin muuttamisen puheeksi.

makefile

# Määritä TTS-malli
tts = TTS.TTS()
tts.load_model(engine="tts", lang="fi")

Aseta puheentunnistusmalli

Meidän täytyy myös asettaa puheen tunnistaminen malli. Käytämme OpenAI Whisper -kirjastoa tämän mallin rakentamiseen. Näin AI-ääniohjauksemme avulla muunnetaan puhe tekstiksi.

csharp

# Aseta Whisper
wh = whisper.Whisper()
wh.init(whisper.DeviceType.GPU, "fi-FI")

Aseta OpenAI API-avain

Viimeiseksi asetamme OpenAI API-avaimemme. Tämä mahdollistaa GPT-3:n käytön kielen täydentämisessä.

makefile

# Aseta OpenAI:n API-avain
api_key = "SINUN_API_AVAIN"
api.api_key = api_key

Rakennetaan AI-ääniohjainta

Nyt kun olemme asettaneet ympäristömme, olemme valmiita aloittamaan AI-ääniohjatun avustajamme rakentamisen. Käytämme Gradioa sovelluksemme käyttöliittymän rakentamiseen. Tämä mahdollistaa käyttäjien kysymysten esittämisen ja vastausten saamisen AI-ääniohjatulta avustajaltamme.

python

def generoi_vastaus(teksti):
    # Muunna teksti puheeksi
    audio = tts.hanki_puhe(teksti, "nainen")

    # Muunna puhe tekstiksi
    teksti = wh.transkriboi(audio, "fi-FI")

    # Generoi vastaus käyttäen GPT-3:a
    ohje = "Vastaa seuraavaan kysymykseen: " + teksti
    vastaus = api.Completion.create(engine="text-davinci-002", prompt=ohje, max_tokens=1000)

    # Muunna vastaus tekstiksi
    vastaus = vastaus.choices[0].text

    # Muunna teksti puheeksi
   

Päätelmä

Lopuksi, OpenAI ChatGPT -rajapinnan ja Pythonin avulla AI-ääniavustajan rakentaminen on erinomainen tapa tutkia tekoälyteknologian mahdollisuuksia. Kirjastojen ja työkalujen avulla on helppo luoda ympäristö ja luoda AI-ääniavustaja, joka pystyy vastaamaan käyttäjien tiedusteluihin ja suorittamaan erilaisia tehtäviä.

Tässä opetusohjelmassa kävimme läpi ympäristön asennusprosessin, asennimme tarvittavat kirjastot ja mallit. Rakensimme sitten tekstin puheeksi ja puheeksi tekstiksi -mallit ja asetimme OpenAI API-avaimen. Viimeiseksi käytimme Gradiota luodaksemme käyttöliittymän ääniavustajallemme.

Vaikka tämä opas on loistava lähtökohta, on olemassa monia muita tapoja parantaa ja mukauttaa AI-ääniohjaajaasi. Esimerkiksi voit lisätä lisää toiminnallisuutta, kuten kyvyn lähettää sähköposteja, soittaa musiikkia tai hallita älykkäitä kodin laitteita. Lisäksi voit kouluttaa AI-malliasi tiettyihin aihepiireihin tai parantaa sen tarkkuutta hienosäädöllä.

Kaiken kaikkiaan, AI-ääniavustajan rakentaminen on hauska ja palkitseva projekti, joka voi tarjota paljon arvoa käyttäjille. OpenAI ChatGPT API:n ja Pythonin voimalla mahdollisuudet ovat rajattomat.

Usein kysytyt kysymykset

Totisesti, tässä on muutamia hyödyllisiä usein kysyttyjä kysymyksiä Pythonin avulla toteutettavan tekoälyääniohjatun avustajan rakentamiseen OpenAI ChatGPT API:n avulla:

K1: Mikä on älykäs puheavustaja?

A1: Tekoälyyn perustuva ääniohjaaja on ohjelmisto, joka käyttää tekoälyä ja luonnollisen kielen käsittelyä kommunikoidakseen käyttäjien kanssa puhutun kielen avulla.

K2: Mitä kirjastoja tarvitaan AI-ääniohjatun avustajan rakentamiseen Pythonilla käyttäen OpenAI ChatGPT API:a?

A2: Sinun täytyy asentaa ja tuoda (import) kirjastot, kuten Chargpt APA, OpenAI Whisper, CoQE TTS -tekstistä-puheeksi, Gradio ja Numpy.

K3: Mitä on Gradio ja miten sitä käytetään AI-ääniohjatun avustajan rakentamisessa?

A3: Gradio on helppokäyttöinen käyttöliittymätyökalu, jota voidaan käyttää AI-ääniohjauksen käyttöliittymän rakentamiseen. Se mahdollistaa käyttäjien kysymysten esittämisen ja vastauksien saamisen AI-ääniavustajalta.

K4: Miten asetat tekstin puheeksi muuntautumis mallin tekoälyavustajalle?

A4: Voit käyttää Pythonin TTS-kirjastoa asettaaksesi teksti-puhe-mallin tekoääniavustajaasi varten.

K5: Kuinka asetat puheen tekstiksi -mallin tekoälyä avustavaan ääniohjainjärjestelmään?

A5: Voit käyttää OpenAI Whisper-kirjastoa Pythonissa asettaaksesi puheen tunnistusmallin AI-ääniohjukseesi.

K6: Kuinka asennetaan OpenAI API-avain tekoälyääniohjelman käyttöön?

A6: Sinun tulee rekisteröityä OpenAI API-käyttäjäksi ja asettaa se ympäristöösi Pythonin avulla, jotta voit käyttää GPT-3:sta kielen täydennykseen.

K7: Voitteko räätälöidä tekoälyääniohjaimen suorittamaan tiettyjä tehtäviä?

A7: Kyllä, voit lisätä toiminnallisuutta tekoälyavustajaan suorittaaksesi tehtäviä, kuten sähköpostien lähettämisen, musiikin soiton tai älylaitteiden hallinnan.

K8: Voitteko parantaa tekoääniohjauksen tarkkuutta?

A8: Kyllä, voit hienosäätää tekoälymallia tiettyjen alojen osalta tai käyttää muita tekniikoita parantaaksesi sen tarkkuutta.

Liittyvät artikkelit

Näytä lisää >>

Avaa tekoälyn voima HIX.AI:lla!