Stemmegenkendelsesmoduler: Arbejdsprocedure og applikationer

Prøv Vores Instrument Til At Fjerne Problemer





Fremskridt inden for teknologi har udviklet en intelligent grænseflade-teknik mellem mand og maskine, der letter computere eller maskiner eller robotter, der skal betjenes ved hjælp af et menneskes stemmekommandoer uden brug af inputsystemer, såsom tastaturer eller mus. Dette interface mellem mennesker og mennesker (HMI) kan opnås ved hjælp af stemmegenkendelse moduler. I denne artikel vil vi diskutere stemmegenkendelsesmodulerne sammen med deres arbejdsprocedure og applikationer.

Stemmemodul

Stemmemodul



Stemmegenkendelsesmodul

Stemmegenkendelse er en teknik, der letter en naturlig og praktisk grænseflade mellem menneske og maskine ved hjælp af stemmegenkendelsesmodulet. Det ekstraherer og analyserer stemmefunktioner hos mennesker, der leveres til en maskine eller computer via mikrofonen. Stemmegenkendelsesteknik er klassificeret i mange typer baseret på forskellige kriterier, såsom brugernes omfang, et antal ord, der bruges til genkendelse, naturlighed ved at tale. Hvis stemmegenkendelsesniveauet er mere end 95%, bruges kun stemmegenkendelse praktisk.


Stemmegenkendelsesmodulets arbejdsprincip

HM2007 er en single-chip CMOS stemmegenkendelsesmodul. Det er et on-chip analog frontend integreret kredsløb i stor skala med stemmeanalyse, talegenkendelse og stemmegenkendelsessystemkontrolprocesser. HM2007 kan betjenes i to tilstande: manuel tilstand og CPU-styringstilstand.



HM2007

HM2007 Pin Diagram

I den manuelle driftstilstand bruges stemmegenkendelsesmodulet HM2007 til at opbygge et simpelt genkendelsessystem ved at forbinde komponenter såsom et tastatur, SRAM på 8Kbyte-hukommelse og andre komponenter. Hvis strømmen er tændt, starter HM2007 en initialiseringsproces, og hvis WAIT-stiften er L, kontrollerer HM2007 den eksterne hukommelse: 8Kbyte SRAM - om den er perfekt eller ej. Men hvis VENTET er H, springes hukommelseskontrolprocessen over af HM2007. Efter denne initialiseringsproces skifter HM2007 til genkendelsestilstand. I genkendelsestilstand, hvis WAIT-stiften er H, er HM2007 klar til at acceptere stemmen og begynder genkendelsesprocessen. Hvis WAIT-stiften er L, accepterer HM2007 ikke den stemme, der skal genkendes. Derefter er træning af nye mønstre ved at rydde trænede mønstre de to operationer, der udføres ved hjælp af funktionstasterne: TRN og CLR. Alle mønstre i HM2007 kan ryddes ved at indtaste nummertast 99 og trykke på CLR.

I CPU-styringstilstanden er flere funktioner såsom RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET-funktioner til stemmegenkendelsesmodulet HM2007 tilvejebragt i denne tilstand. I lighed med en manuel driftsform udføres i denne tilstand også tænding, genkendelse, træning, resulterende, upload, downloading og nulstilling af operationer baseret på forskellige kriterier.

Anvendelser af stemmegenkendelsesmodul

Stemmestyret robotkøretøj

Stemmestyret projektkit til robotkøretøjer

Stemmestyret projektkit til robotkøretøjer

Et stemmestyret robotkøretøj med et langdistance-talegenkendelsessystem er designet til at blive styret ved hjælp af en grænseflade mellem menneske-maskine og stemmekommandoer til robotkøretøjets fjernbetjeninger. En 8051 mikrokontroller bruges sammen med et stemmegenkendelsesmodul eller talegenkendelsesmodul til opnåelse af den ønskede operation. Retningen af ​​robotkøretøjets bevægelse kan styres ved hjælp af stemmekommandoer eller trykknapper. Stemmekommandoer sendes af RF fra den senderende ende mod den modtagende ende. Robotkøretøjet bevæger sig således fremad, bagud, venstre eller højre retning baseret på de kommandoer, som modtageren modtager.


Senderblokdiagram over stemmestyret robotkøretøj

Senderblokdiagram over stemmestyret robotkøretøj

Denne bevægelse af robotkøretøj i en bestemt retning kan styres ved hjælp af to motorer, der er grænseflade med 8051-serien mikrocontroller. RF-sender konverterer kommandoerne ved hjælp af en switchpresse eller stemmekommandoer, der konverteres til kodede digitale data til fordel for det acceptable rækkevidde (op til 200 meter) fra robotkøretøjet. De kodede data, der modtages i modtagerkredsløbet, afkodes til at blive sendt til en anden mikrokontroller til at drive jævnstrømsmotorer ved hjælp af motordriver IC til at styre motorernes retning og bevægelse ved hjælp af de dekodede data fra stemmekommandoer.

Modtagerblokdiagram over stemmestyret robotkøretøj

Modtagerblokdiagram over stemmestyret robotkøretøj

Dette stemmestyrede robotkøretøj med langdistance talegenkendelsesprojekter kan integreres med en DTMF-teknologi der letter styringen af ​​robotkøretøjet ved hjælp af en mobiltelefon. Denne DTMF-teknologi giver en meget langtrækkende kommunikation sammenlignet med RF-teknologien - robotbiler kan således fjernstyres fra en meget lang afstand.

Stemmeoptagelse og afspilningskredsløb

APR 9301 IC

APR 9301 IC

APR 9301 IC

APR 9301 IC består af 28 ben og ikke-flygtig flashhukommelse. Det letter optagelsen af ​​100K cyklusser og lagring af hukommelse i omkring 100 år. Kun den lave spænding 5V og 25mA strøm kræves til den normale funktionsdrift af det integrerede kredsløb APR 9301.

Arbejde med Voice Recording og Playback Circuit

APR 9301 IC udfører stemmeoptagelse og afspilning operationer. Optagelsesfunktion kan udføres ved at modtage stemmesignaler ved hjælp af god kvalitet (af enhver art) kondensatormikrofon forbundet til 17 og 18 ben i et integreret kredsløb. Hvis vi lukker kontakten S1, kan optagelsestilstanden startes for let at optage en stemmemeddelelse i 20-30 sekunder. Som en indikation af optagelses-LED tilsluttet pin 25 i APR 9301 IC vil blinke, så længe L pin 27 er jordforbundet.

Stemmeoptagelse og afspilningskredsløb

Stemmeoptagelse og afspilningskredsløb

Efter afslutningen af ​​20 cyklusser med den sidste hukommelse, afsluttes optagelsesprocessen automatisk ved at ændre værdien af ​​en modstand R1, der er forbundet til benene 6 og 7 på APR 9301 IC. En maksimal optagelsestid på 20 sekunder, 24 sekunder og 30 sekunder kan opnås ved at ændre værdierne for modstanden R1 henholdsvis 52K, 67K og 89K.

Indgangssektionen dæmpes automatisk under afspilningstilstand. Hvis kontakten S2 er lukket, kommer der en besked fra højttaleren fra begyndelsen af ​​de optagede beskeder. Hvis optagelses- eller afspilningsfunktionerne er afsluttet, går APR 9301 IC i standbytilstand.

Dette kredsløb kan akkumuleres på et fælles printkort. Lod APR 9301 IC-basen omhyggeligt, så der ikke opstår kortslutning mellem stifterne i det integrerede kredsløb. Kontroller kredsløbet efter montering på printkortet, og tilslut derefter IC i IC-basen. Inden du giver strømforsyning til kredsløbet, skal du kontrollere stikforbindelserne nøje. 5-volt regulator IC-baseret strømforsyning bruges til at give strømforsyning til kredsløbet. En 2-tommer-8-ohm højttaler af god kvalitet bruges til at få en klar lyd. Optagelse kan ske ved at trykke på kontakten S1. Lydsignalerne (tale eller musik) samles op af mikrofonen og sendes til IC'en, hvori stemmesignalerne er lagret i hukommelsescellerne. Hvis vi lukker kontakten S2, starter afspilningen, og vi kan høre den optagede besked gennem højttaleren.

Stemmegenkendelsesmodul kan bruges i mange applikationer, såsom til styring af flysystemerne ved hjælp af pilotens stemmekommandoer, til styring af motoriseret hjulbil ved hjælp af stemmeaktiveret multiprocessor osv. Hvis du er interesseret i at vide om elektriske og elektroniske projekter baseret på stemmegenkendelsesmodulet, så kan du henvende dig til os ved at sende dine kommentarer i kommentarfeltet nedenfor.

Fotokreditter: