From data
To meaning
Text-O-Phone - Soluzione per la Trascrizione Fonetica
Tecnologia vocale avanzataText-O-Phone (ToP) è la soluzione di front-end per sistemi di sintesi vocale (text-to-speech) sviluppata da CELI: completa, flessibile, multilingue, semplice da integrare. Text-O-Phone copre l’intera pipeline di analisi, dal testo standard all’annotazione fonetica – incluse le informazioni di accento e di prosodia.
Perché scegliere Text-O-Phone:
- Tecnologia proprietaria, progettata per la robustezza e l’affidabilità
- Sviluppato grazie a competenze linguistiche altamente qualificate
- Facilità di integrazione
- Elevata qualità unita a un total cost of ownership inferiore rispetto alle soluzioni open source
Architettura
Text-O-Phone è una suite di componenti multilingui, dotati di capacità di Natural Language Processing. Ognuno di essi è responsabile delle diverse fasi di trattamento dei dati testuali:
- Trattamento dell’input SSML
- Regole di pronuncia e normalizzazione impostate dall’utente
- Tokenizzazione e trattamento delle non standard words
- Analisi morfologica e POS tagging
- Disambiguazione
- Chunking e phrasing
- Trascrizione fonetica (grafema-fonema e fonema-fonema)
- Annotazione di tratti soprasegmentali (prosodia, pause ed intonazione)
I moduli sono concepiti come componenti software indipendenti dalla lingua, che possono essere specializzati per una particolare lingua attraverso l’uso di risorse e configurazioni specifiche.

Lingue
- Italiano
- Finlandese
- Francese (inclusa variante canadese)
- Greco
- Spagnolo (inclusa variante messicana)
- Portoghese (inclusa la variante brasiliana)
- Tedesco
- Inglese britannico (inclusa variante americana e canadese)
- Indonesiano
- Norvegese
- Olandese
- Polacco
- Rumeno
- Russo
- Slovacco
- Svedese
- Ungherese
Stiamo lavorando per estendere la lista delle lingue coperte. E’ inoltre possibile sviluppare, su richiesta del cliente, nuove lingue o versioni specializzate di lingue esistenti per particolari domini.
Risorse Linguistiche
- Dizionario fonetico
- Corpora testuali che coprono una varietà di domini
- Database morfologico
- Collezioni di parole non standard (set di regole)
- Test suite verificata manualmente
Specifiche Tecniche
Text-O-Phone:
- Gestisce parametri di input SSML say-as, sub and phoneme
- Formati di output IPA o X-SAMPA
- Interamente scritto in ANSI C per ottenere un elevato rapporto performance/memoria
- Codice sorgente e strumenti per la generazione del codice sorgente disponibili
- Progettato per sistemi mobili ed embedded
- Multi-piattaforma (Windows e Linux) integrabili via ANSI CAPI
- Accuratezza fino al 99%*, in riferimento a una test suite annotata da due madrelingua
- Velocità media: 75 mila bytes per secondo, con riferimento ad Intel(R) Xeon(R) CPU E3-1230 V2 @ 3.30GHz
- Dimensione: 2 MB, compilata a 32 bit (varia a seconda della lingua)
- Memoria 0.6 MB (varia a seconda della lingua)
*Libraries messicano e francese canadese