Moduly rozpoznávania hlasu: Pracovný postup a aplikácie

Vyskúšajte Náš Nástroj Na Odstránenie Problémov





Pokrok v technológii vyvinul techniku ​​inteligentného rozhrania človek - stroj, ktorá umožňuje obsluhu počítačov alebo strojov alebo robotov pomocou hlasových príkazov človeka bez použitia akýchkoľvek vstupných systémov, ako sú napríklad klávesnice alebo myš. Toto rozhranie človek - stroj (HMI) je možné dosiahnuť pomocou rozpoznávanie hlasu modulov. V tomto článku sa budeme zaoberať modulmi rozpoznávania hlasu spolu s ich pracovným postupom a aplikáciami.

Hlasový modul

Hlasový modul



Modul rozpoznávania hlasu

Rozpoznávanie hlasu je technika, ktorá uľahčuje prirodzenú a pohodlnú prácu rozhranie človek - stroj pomocou modulu rozpoznávania hlasu. Extrahuje a analyzuje hlasové vlastnosti človeka dodávané do stroja alebo počítača cez mikrofón. Technika rozpoznávania hlasu je klasifikovaná do mnohých typov na základe rôznych kritérií, ako napríklad rozsah používateľov, počet slov použitých na rozpoznanie, prirodzenosť hovorenia. Ak je úroveň rozpoznávania hlasu viac ako 95%, potom sa prakticky použije iba rozpoznávanie hlasu.


Princíp fungovania modulu rozpoznávania hlasu

HM2007 je jednočipový CMOS modul rozpoznávania hlasu. Jedná sa o analógový front-end rozsiahly integrovaný obvod na čipu s procesmi hlasovej analýzy, rozpoznávania reči a rozpoznávania hlasu. HM2007 je možné prevádzkovať v dvoch režimoch: manuálny režim a režim riadenia CPU.



HM2007

Schéma pinov HM2007

V manuálnom režime prevádzky sa modul rozpoznávania hlasu HM2007 používa na vytvorenie jednoduchého systému rozpoznávania pripojením komponentov, ako sú klávesnica, SRAM s pamäťou 8 kB a ďalšie komponenty. Ak je napájanie zapnuté, potom HM2007 spustí proces inicializácie a ak je WAIT pin L, potom HM2007 skontroluje externú pamäť: 8Kbyte SRAM - či je dokonalá alebo nie. Ale ak WAIT je H, potom proces kontroly pamäte HM2007 preskočí. Po tomto inicializačnom procese sa HM2007 prepne do režimu rozpoznávania. V režime rozpoznávania, ak je WAIT pin H, je HM2007 pripravený prijať hlas a začne proces rozpoznávania. Ak je WAIT pin L, potom HM2007 neprijíma hlas, ktorý má byť rozpoznaný. Potom trénovaním nových vzorov vymazaním trénovaných vzorov sú dve operácie vykonávané pomocou funkčných klávesov: TRN a CLR. Všetky vzory v HM2007 je možné vymazať zadaním číselného klávesu 99 a stlačením CLR.

V prevádzkovom režime riadenia CPU je v tomto režime poskytovaných niekoľko funkcií ako funkcie RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET modulu hlasového rozpoznávania HM2007. Podobne ako v manuálnom režime činnosti, aj v tomto režime sa operácie zapnutia, rozpoznávania, tréningu, výsledkov, nahrávania, sťahovania a vynulovania vykonávajú podľa rôznych kritérií.

Aplikácie modulu rozpoznávania hlasu

Hlasom ovládané robotické vozidlo

Hlasovo ovládaná sada robotických vozidiel

Hlasovo ovládaná sada robotických vozidiel

Hlasovo ovládané robotické vozidlo so systémom rozpoznávania reči na veľkú vzdialenosť je navrhnuté tak, aby sa dalo ovládať pomocou rozhrania človek - stroj a hlasovými príkazmi na diaľkové ovládanie robotického vozidla. An Mikrokontrolér 8051 sa používa spolu s modulom rozpoznávania hlasu alebo modulom rozpoznávania reči na dosiahnutie požadovanej operácie. Smer pohybu robotického vozidla je možné ovládať pomocou hlasových príkazov alebo tlačidiel. Hlasové príkazy sú vysielané RF z vysielacieho konca do prijímacieho konca. Robotické vozidlo sa teda pohybuje v smere dopredu, dozadu, doľava alebo doprava na základe príkazov prijatých prijímačom.


Bloková schéma vysielača hlasom riadeného robotického vozidla

Bloková schéma vysielača hlasom riadeného robotického vozidla

Toto hnutie robotické vozidlo v konkrétnom smere možno ovládať pomocou dvoch motorov, ktoré sú prepojené s mikrokontrolérom série 8051. RF vysielač prevádza príkazy stlačením spínača alebo hlasovými príkazmi, ktoré sa prevádzajú na zakódované digitálne údaje v prospech prijateľného dosahu (do 200 metrov) od robotického vozidla. Kódované dáta prijaté v obvode prijímača sa dekódujú na odoslanie do iného mikrokontroléra na riadenie jednosmerných motorov pomocou budiča IC na riadenie smeru a pohybu motorov pomocou dekódovaných údajov hlasových príkazov.

Bloková schéma prijímača hlasom riadeného robotického vozidla

Bloková schéma prijímača hlasom riadeného robotického vozidla

Toto hlasom ovládané robotické vozidlo s projektmi rozpoznávania reči na veľkú vzdialenosť je možné integrovať s DTMF technológia ktorá uľahčuje riadenie robotického vozidla pomocou mobilného telefónu. Táto technológia DTMF poskytuje v porovnaní s technológiou RF veľmi dlhú komunikáciu - robotické vozidlá tak možno ovládať na diaľku z veľmi veľkej vzdialenosti.

Obvod hlasového záznamu a prehrávania

APR 9301 IC

APR 9301 IC

APR 9301 IC

APR 9301 IC sa skladá z 28 pinov a energeticky nezávislej pamäte flash. Uľahčuje zaznamenávanie 100 000 cyklov a ukladanie pamäte približne na 100 rokov. Pre normálnu prácu integrovaného obvodu APR 9301 je potrebných iba nízke napätie 5 V a 25 mA.

Fungovanie obvodu hlasového záznamu a prehrávania

APR 9301 IC funguje nahrávanie a prehrávanie hlasu operácie. Operáciu záznamu je možné vykonať príjmom hlasových signálov pomocou kvalitného (akéhokoľvek druhu) kondenzátorového mikrofónu pripojeného k 17 a 18 pinom integrovaného obvodu. Ak zatvoríme prepínač S1, potom je možné spustiť režim záznamu pre ľahké nahrávanie hlasovej správy po dobu 20 - 30 sekúnd. Ako indikácia záznamu bude LED pripojená na pin 25 APR 9301 IC blikať, pokiaľ je L pin 27 uzemnený.

Obvod hlasového záznamu a prehrávania

Obvod hlasového záznamu a prehrávania

Po dokončení 20 cyklov s poslednou pamäťou sa záznamový proces automaticky ukončí zmenou hodnoty odporu R1 pripojeného k pinom 6 a 7 IC APR 9301. Maximálnu dobu záznamu 20 sekúnd, 24 sekúnd a 30 sekúnd možno dosiahnuť zmenou hodnôt odporu R1 na 52K, 67K a 89K.

Počas režimu prehrávania je vstupná časť automaticky stlmená. Ak je prepínač S2 zopnutý, potom bude od reproduktora prichádzať správa od začiatku zaznamenaných správ. Ak sú funkcie nahrávania alebo prehrávania dokončené, APR 9301 IC prejde do pohotovostného režimu.

Tento obvod je možné akumulovať na spoločnej doske s plošnými spojmi. Spájkujte základňu IC APR 9301 opatrne, aby nedošlo k skratu medzi kolíkmi integrovaného obvodu. Po namontovaní na DPS skontrolujte obvod a potom pripojte IC k základni IC. Pred napájaním obvodu dôkladne skontrolujte zapojenie pinov. Na napájanie obvodu sa používa 5-voltový regulátor založený na IC. Na získanie čistého zvuku sa používa kvalitný reproduktor s uhlopriečkou 2 palce a 8 ohmov. Záznam je možné vykonať stlačením spínača S1. Zvukové signály (reč alebo hudba) zachytáva mikrofón a odovzdávajú ich IC, kde sa hlasové signály ukladajú do pamäťových buniek. Ak zatvoríme spínač S2, potom sa spustí prehrávanie a cez reproduktor môžeme počuť zaznamenanú správu.

Modul rozpoznávania hlasu je možné použiť v mnohých aplikáciách, napríklad na riadenie leteckých systémov pomocou hlasových povelov pilotov, na riadenie motorových vozidiel s použitím hlasom ovládaného multiprocesora atď. Ak máte záujem vedieť o elektrické a elektronické projekty na základe modulu rozpoznávania hlasu nás potom môžete kontaktovať uverejnením svojich komentárov v sekcii komentárov nižšie.

Fotografické úvery: