Nuovo servizio

Audio API

Trascrizione e sintesi vocale compatibili con gli standard di settore con voci italiane naturali, voice cloning istantaneo e supporto multilingua. Infrastruttura italiana, latenza bassa e tariffa unica trasparente: €4.00 per milione di caratteri.

Un solo prezzo, per tutto
€4.00 / 1M caratteri sia per la trascrizione (STT) che per la sintesi (TTS). Nessuna tariffa nascosta per lingua, voce o voice cloning.

Due modelli, infinite applicazioni

Speech-to-Text con timestamp segmentati e sottotitoli pronti all'uso. Text-to-Speech con 58 voci naturali in 17 lingue e voice cloning da 3 secondi di audio.

Speech-to-Text

Trascrivi qualunque file audio (WAV, MP3, FLAC, OGG, M4A) con altissima accuratezza. Auto-detect della lingua fra 99 lingue supportate.

€4.00 / 1M caratteri trascritti
POST /v1/audio/transcriptions

Text-to-Speech

Sintesi vocale naturale multilingua con 58 voci preimpostate. Alias compatibili con gli standard di mercato (alloy, echo, nova, shimmer…) per drop-in replacement.

€4.00 / 1M caratteri sintetizzati
POST /v1/audio/speech

Voice Cloning

Clona una voce a partire da soli 3 secondi di audio di riferimento, per brand voice dedicate o personalizzazioni.

€4.00 / 1M caratteri — stessa tariffa TTS
POST /v1/audio/clone

Sottotitoli pronti

Esporta direttamente in formato SRT o WebVTT per editor video, player HTML5 e piattaforme di streaming.

Incluso nel prezzo STT
response_format=srt | vtt

Multilingua nativo

STT in 99 lingue, TTS in 17 lingue principali (italiano, inglese, francese, tedesco, spagnolo, portoghese, giapponese…).

Nessun costo extra per lingua
language=it | en | fr …

Standard di settore

Endpoint e payload conformi allo standard REST /v1/audio/*. Sostituisci la base URL e la chiave: drop-in replacement.

Zero refactoring
Bearer sk-runai-…

Perché RunAI Audio

Voci italiane autentiche, dati che non lasciano l'Italia, pricing semplice e compatibilità con gli standard di settore. Tutto quello che serve per portare l'audio nella tua applicazione senza compromessi.

Inizia ora
  • Voci italiane naturali — selezione curata di voci che pronunciano correttamente italiano, inglese e principali lingue UE.
  • Zero data retention — audio e testi non vengono mai salvati dopo l'elaborazione, log tecnici minimi.
  • Un solo prezzo, senza sorprese — €4/1M caratteri, fatturazione al millesimo di centesimo in euro.
  • Latenza italiana — infrastruttura in Italia, risposta media STT < 2s, TTS < 10s.
  • Drop-in standard — API REST conformi allo standard di settore per STT e TTS, migrazione in minuti.

Integrazione in 5 minuti

Tre chiamate, tre endpoint. Copia e incolla, sostituisci la chiave e sei pronto.

curl "https://api.runai.it/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-runai-<your_key>" \
  -F "file=@audio.wav" \
  -F "model=runai-stt" \
  -F "language=it" \
  -F "response_format=verbose_json"

# Risposta JSON (con timestamp per segmento)
{
  "text": "Ciao, questo è un test di trascrizione.",
  "language": "it",
  "duration": 3.12,
  "segments": [{ "start": 0.0, "end": 2.46, "text": "..." }]
}
curl "https://api.runai.it/v1/audio/speech" \
  -H "Authorization: Bearer sk-runai-<your_key>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "runai-tts",
    "input": "Benvenuto nel nostro servizio.",
    "voice": "nova",
    "language": "it"
  }' \
  --output output.wav

# La risposta è uno stream binario audio/wav
curl "https://api.runai.it/v1/audio/clone" \
  -H "Authorization: Bearer sk-runai-<your_key>" \
  -F "input=Questo audio usa la mia voce clonata." \
  -F "language=it" \
  -F "speaker_wav=@riferimento.wav" \
  --output clonata.wav

# Consigliato: almeno 3 secondi di audio pulito di riferimento

58 voci, 17 lingue

Scegli fra 58 voci naturali con alias compatibili con gli standard di mercato per una migrazione istantanea dal tuo stack attuale.

Alias standard supportati

I nomi voce standard del settore sono mappati su voci RunAI curate per una buona pronuncia italiana ed europea:

  • alloy, echo, fable, onyx, nova, shimmer
  • ash, sage, coral, ballad, verse

Lingue supportate (TTS)

Una singola chiave per generare audio in tutte queste lingue:

Italiano Inglese Francese Tedesco Spagnolo Portoghese Polacco Turco Russo Olandese Ceco Arabo Cinese Giapponese Ungherese Coreano Hindi

Dati audio sotto controllo

Infrastruttura fisicamente in Italia, zero data retention, nessun file audio conservato dopo la risposta. Ideale per settori regolamentati come sanità, legal, finance e PA.

Scopri la nostra policy privacy

Porta la voce nelle tue applicazioni

Trascrizione, sintesi e voice cloning a tariffa unica. Compatibilità con gli standard di mercato, dati in Italia, fatturazione in euro. Prova in 5 minuti.