From data
To meaning

Text-O-Phone

Tecnologia vocale avanzata

Text-O-Phone (ToP) è la soluzione di front-end per sistemi di sintesi vocale (text-to-speech) sviluppata da CELI: completa, flessibile, multilingue, semplice da integrare. Text-O-Phone copre l’intera pipeline di analisi, dal testo standard all’annotazione fonetica – incluse le informazioni di accento e di prosodia.

Perché scegliere Text-O-Phone:

  • Tecnologia proprietaria, progettata per la robustezza e l’affidabilità
  • Sviluppato grazie a competenze linguistiche altamente qualificate
  • Facilità di integrazione
  • Elevata qualità unita a un total cost of ownership inferiore rispetto alle soluzioni open source

Architettura

Text-O-Phone è una suite di componenti multilingui, dotati di capacità di Natural Language Processing. Ognuno di essi è responsabile delle diverse fasi di trattamento dei dati testuali:

  • Trattamento dell’input SSML
  • Regole di pronuncia e normalizzazione impostate dall’utente
  • Tokenizzazione e trattamento delle non standard words
  • Analisi morfologica e POS tagging
  • Disambiguazione
  • Chunking e phrasing
  • Trascrizione fonetica (grafema-fonema e fonema-fonema)
  • Annotazione di tratti soprasegmentali (prosodia, pause ed intonazione)

I moduli sono concepiti come componenti software indipendenti dalla lingua, che possono essere specializzati per una particolare lingua attraverso l’uso di risorse e configurazioni specifiche.

Lingue

  • Italiano
  • Finlandese
  • Francese (inclusa variante canadese)
  • Greco
  • Spagnolo (inclusa variante messicana)
  • Portoghese (inclusa la variante brasiliana)
  • Tedesco
  • Inglese britannico (inclusa variante americana e canadese)
  • Indonesiano
  • Norvegese
  • Olandese
  • Polacco
  • Rumeno
  • Russo
  • Slovacco
  • Svedese
  • Ungherese

Stiamo lavorando per estendere la lista delle lingue coperte. E’ inoltre possibile sviluppare, su richiesta del cliente, nuove lingue o versioni specializzate di lingue esistenti per particolari domini.

Risorse Linguistiche

  • Dizionario fonetico
  • Corpora testuali che coprono una varietà di domini
  • Database morfologico
  • Collezioni di parole non standard (set di regole)
  • Test suite verificata manualmente

Specifiche Tecniche

Text-O-Phone:

  • Gestisce parametri di input SSML say-as, sub and phoneme
  • Formati di output IPA o X-SAMPA
  • Interamente scritto in ANSI C per ottenere un elevato rapporto performance/memoria
  • Codice sorgente e strumenti per la generazione del codice sorgente disponibili
  • Progettato per sistemi mobili ed embedded
  • Multi-piattaforma (Windows e Linux) integrabili via ANSI CAPI
  • Accuratezza fino al 99%*, in riferimento a una test suite annotata da due madrelingua
  • Velocità media: 75 mila bytes per secondo, con riferimento ad Intel(R) Xeon(R) CPU E3-1230 V2 @ 3.30GHz
  • Dimensione: 2 MB, compilata a 32 bit (varia a seconda della lingua)
  • Memoria 0.6 MB (varia a seconda della lingua)

*Libraries messicano e francese canadese

Contattaci per una demo





Autorizzo il trattamento dei miei dati personali secondo la normativa sulla privacy ai sensi dell’Art. 13 D.LGS 30/06/2003, n.196 e ai sensi del D.lgs. 196/2003 e successivi