CMU Sphinx

CMU Sphinx, er den generelle betegnelse for en gruppe af talegenkendelsessystemer udviklet på Carnegie Mellon University. Det omfatter en række programmer til talegenkendelse og en akustisk model coach.

I 2000 gruppen Sphinx lovede at udvikle forskellige komponenter til stemmegenkendelse, herunder senere Sphinx Sphinx 2 og 3. De tale dekodere kommer med akustiske modeller og prøve applikationer. Tilgængelige ressourcer omfatter også software til akustiske uddannelse modeller, udarbejdelse af et sprog model og udtale ordbog cmudict kaldes public domain.

Sphinx omfatter en række softwaresystemer begyndende sphinx 1, så var der versioner 2, 3, 4 og Pocket Sphinx alle har forskellige applikationer, selv om dens funktion er den samme, reconomiento tale beskrev alt, hvad de nedenfor.

Sphinx

Sphinx er et system med løbende tale og talegenkendelse hjælp skjulte Markov model og statistiske sprog modellering af n-gram. Den blev udviklet af Kai-Fu Lee. Sphinx spiller kontinuerligt talt stemme, talegenkendelse til stort ordforråd.

Sphinx 2

Det er et system til talegenkendelse med høj opløsning af Xuedong Huang oprindeligt udviklet på Carnegie Mellon, som udgav deres kode som fri software med en BSD-licens. Sphinx 2 fokuserer på reconocmiento stemme i realtid, er den egnet til talesprog applikationer. Det indeholder funktioner som ultimo peger, delvis hypotese generation, dynamisk sprog model skift blandt andre. Det bruges i dialog-systemer og systemer for at lære sprog.

Sphinx 2 bruger en semi-kontinuert akustisk modellering til repræsentation.

Det kan bruges i computer-baserede systemer som Asterisk PBX. Sphinx 2 kode er også blevet indarbejdet i en række kommercielle produkter.

Sphinx 3

HMM godkendte den fortsatte og hyppig repræsentation bruges primært til høj præcision, ikke realtid anerkendelse. Den seneste udvikling har gjort Sphinx arbejder "næsten" i realtid, selv om det stadig ikke egnet til interaktive applikationer. Sphinx 3 er under udvikling og i samarbejde med SphinxTrain giver adgang til en række moderne modellering teknikker, såsom LDA / MLLT, MLLR og VTLN, som forbedrer anerkendelse nøjagtighed.

Sphinx 4

Sphinx 4 er en komplet omskrivning af maskinen sphinx, med det formål at give en mere fleksibel for forskning i rammerne talegenkendelse er udelukkende skrevet i programmeringssproget Java. Sun Microsystems støtter udviklingen af ​​Sphinx 4 og bidrog erfaring i softwareudvikling for projektet. Blandt deltagerne var der folk i lejren, MIT og CMU. Skrevet i Java, kan anvendes i en bred vifte af operativsystemer og hardware.

De nuværende udviklingsmål inkluderer:

  • Udviklingen af ​​en ny træner
  • Implementering af tilpasning af person, der taler
  • Forbedret konfigurationsstyring
  • Oprettelse af en grafisk brugergrænseflade baseret på grafisk systemdesign.

Pocket Sphinx

Pocket Sphinx er en version af Sphinx, der kan bruges i indlejrede systemer. PocketSphinx blive evalueret for at udvikle og indarbejde funktioner såsom fast punkt aritmetiske og effektive algoritmer til beregning af blandede modeller. Det kan bruges i mange bærbare computere og mobiltelefoner.

  0   0
Forrige artikel Chris Cornell
Næste artikel Juan Carlos Copes

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha