![Rakenna-tekoälyyn-perustuva-ääniavustaja.png](https://static-lib.s3.amazonaws.com/cms/Build_an_AI_Voice_Assistant_5df851500e.png)
Oletko kiinnostunut oman tekoäly-ääniohjatun avustajan rakentamisesta? Tässä opetusohjelmassa näytämme sinulle, miten voit rakentaa tekoäly-ääniohjatun avustajan Pythonilla käyttäen OpenAI ChatGPT API:a. Käymme läpi jokaisen koodirivin, joten vaikka et olisikaan perehtynyt OpenAI:hin, pystyt seuraamaan mukana.
Ympäristön asennus
Ennen kuin sukellamme koodiin, meidän täytyy ensin luoda ympäristö tarvittavilla työkaluilla. Aluksi asennamme useita kirjastoja, mukaan lukien Chargpt APA, OpenAI Whisper ja CoQE TTS text-to-speech. Rakennamme myös kaiken Gradioon, helppokäyttöiseen käyttöliittymätyökaluun, joka auttaa meitä rakentamaan sovelluksemme käyttöliittymän.
Seuraavaksi asetamme tekstistö-äänimallin, äänestä-teksti-mallin ja OpenAI-avaimemme. Käytämme äänitallennuksessa OpenAI Whisper -kirjastoa ja GPT-3:n täydentämiseen OpenAI API:a.
Asennetaan kirjastoja
Aloittaaksemme, meidän täytyy asentaa tarvittavat kirjastot. Käytämme TTS:ää, joka on kirjasto tekstistä puheeksi -toimintoon, sekä Numpya, OpenAI Whisperiä, Gradiota ja OpenAI:ta.
diff
!pip asenna TTS
!pip asenna numpy==1.21
!pip asenna openai==0.10.2
!pip asenna gradio
!pip asenna openai_whisper
Tietokirjastojen tuominen
Kun olemme asentaneet kirjastot, tuomme kaikki tarvittavat mallit. Tuomme Whisperousin, Whisperin, Gradion, OpenAI:n ja TTS:n. Näitä kirjastoja käytämme rakentaessamme erilaisia osia ääniohjatulle tekoälyavustajallemme.
python
tuodatti kuiskatakuiskimaton kuiskaa kuiskinomainen kuiskuta :
tuodat tiirupii kuin arjemmanlapsi tiirupiikanor gradio :
tuodat oventaustaishantääpalvelineskäytetyntoimija temoestin :
tuodatti puheentunnistaminen puheentuntemattomuus :
Aseta teksti-puhe-malli
Seuraavaksi asennamme teksti-puhe-mallin. Käytämme TTS-kirjastoa mallin rakentamiseen. Tämä mahdollistaa tekoälyääniohjaajamme tekstin muuttamisen puheeksi.
makefile
# Määritä TTS-malli
tts = TTS.TTS()
tts.load_model(engine="tts", lang="fi")
Aseta puheentunnistusmalli
Meidän täytyy myös asettaa puheen tunnistaminen malli. Käytämme OpenAI Whisper -kirjastoa tämän mallin rakentamiseen. Näin AI-ääniohjauksemme avulla muunnetaan puhe tekstiksi.
csharp
# Aseta Whisper
wh = whisper.Whisper()
wh.init(whisper.DeviceType.GPU, "fi-FI")
Aseta OpenAI API-avain
Viimeiseksi asetamme OpenAI API-avaimemme. Tämä mahdollistaa GPT-3:n käytön kielen täydentämisessä.
makefile
# Aseta OpenAI:n API-avain
api_key = "SINUN_API_AVAIN"
api.api_key = api_key
Rakennetaan AI-ääniohjainta
Nyt kun olemme asettaneet ympäristömme, olemme valmiita aloittamaan AI-ääniohjatun avustajamme rakentamisen. Käytämme Gradioa sovelluksemme käyttöliittymän rakentamiseen. Tämä mahdollistaa käyttäjien kysymysten esittämisen ja vastausten saamisen AI-ääniohjatulta avustajaltamme.
python
def generoi_vastaus(teksti):
# Muunna teksti puheeksi
audio = tts.hanki_puhe(teksti, "nainen")
# Muunna puhe tekstiksi
teksti = wh.transkriboi(audio, "fi-FI")
# Generoi vastaus käyttäen GPT-3:a
ohje = "Vastaa seuraavaan kysymykseen: " + teksti
vastaus = api.Completion.create(engine="text-davinci-002", prompt=ohje, max_tokens=1000)
# Muunna vastaus tekstiksi
vastaus = vastaus.choices[0].text
# Muunna teksti puheeksi
Päätelmä
Lopuksi, OpenAI ChatGPT -rajapinnan ja Pythonin avulla AI-ääniavustajan rakentaminen on erinomainen tapa tutkia tekoälyteknologian mahdollisuuksia. Kirjastojen ja työkalujen avulla on helppo luoda ympäristö ja luoda AI-ääniavustaja, joka pystyy vastaamaan käyttäjien tiedusteluihin ja suorittamaan erilaisia tehtäviä.
Tässä opetusohjelmassa kävimme läpi ympäristön asennusprosessin, asennimme tarvittavat kirjastot ja mallit. Rakensimme sitten tekstin puheeksi ja puheeksi tekstiksi -mallit ja asetimme OpenAI API-avaimen. Viimeiseksi käytimme Gradiota luodaksemme käyttöliittymän ääniavustajallemme.
Vaikka tämä opas on loistava lähtökohta, on olemassa monia muita tapoja parantaa ja mukauttaa AI-ääniohjaajaasi. Esimerkiksi voit lisätä lisää toiminnallisuutta, kuten kyvyn lähettää sähköposteja, soittaa musiikkia tai hallita älykkäitä kodin laitteita. Lisäksi voit kouluttaa AI-malliasi tiettyihin aihepiireihin tai parantaa sen tarkkuutta hienosäädöllä.
Kaiken kaikkiaan, AI-ääniavustajan rakentaminen on hauska ja palkitseva projekti, joka voi tarjota paljon arvoa käyttäjille. OpenAI ChatGPT API:n ja Pythonin voimalla mahdollisuudet ovat rajattomat.
Usein kysytyt kysymykset
Totisesti, tässä on muutamia hyödyllisiä usein kysyttyjä kysymyksiä Pythonin avulla toteutettavan tekoälyääniohjatun avustajan rakentamiseen OpenAI ChatGPT API:n avulla:
K1: Mikä on älykäs puheavustaja?
A1: Tekoälyyn perustuva ääniohjaaja on ohjelmisto, joka käyttää tekoälyä ja luonnollisen kielen käsittelyä kommunikoidakseen käyttäjien kanssa puhutun kielen avulla.
K2: Mitä kirjastoja tarvitaan AI-ääniohjatun avustajan rakentamiseen Pythonilla käyttäen OpenAI ChatGPT API:a?
A2: Sinun täytyy asentaa ja tuoda (import) kirjastot, kuten Chargpt APA, OpenAI Whisper, CoQE TTS -tekstistä-puheeksi, Gradio ja Numpy.
K3: Mitä on Gradio ja miten sitä käytetään AI-ääniohjatun avustajan rakentamisessa?
A3: Gradio on helppokäyttöinen käyttöliittymätyökalu, jota voidaan käyttää AI-ääniohjauksen käyttöliittymän rakentamiseen. Se mahdollistaa käyttäjien kysymysten esittämisen ja vastauksien saamisen AI-ääniavustajalta.
K4: Miten asetat tekstin puheeksi muuntautumis mallin tekoälyavustajalle?
A4: Voit käyttää Pythonin TTS-kirjastoa asettaaksesi teksti-puhe-mallin tekoääniavustajaasi varten.
K5: Kuinka asetat puheen tekstiksi -mallin tekoälyä avustavaan ääniohjainjärjestelmään?
A5: Voit käyttää OpenAI Whisper-kirjastoa Pythonissa asettaaksesi puheen tunnistusmallin AI-ääniohjukseesi.
K6: Kuinka asennetaan OpenAI API-avain tekoälyääniohjelman käyttöön?
A6: Sinun tulee rekisteröityä OpenAI API-käyttäjäksi ja asettaa se ympäristöösi Pythonin avulla, jotta voit käyttää GPT-3:sta kielen täydennykseen.
K7: Voitteko räätälöidä tekoälyääniohjaimen suorittamaan tiettyjä tehtäviä?
A7: Kyllä, voit lisätä toiminnallisuutta tekoälyavustajaan suorittaaksesi tehtäviä, kuten sähköpostien lähettämisen, musiikin soiton tai älylaitteiden hallinnan.
K8: Voitteko parantaa tekoääniohjauksen tarkkuutta?
A8: Kyllä, voit hienosäätää tekoälymallia tiettyjen alojen osalta tai käyttää muita tekniikoita parantaaksesi sen tarkkuutta.