Audio API

Audio API

Trascrizione e sintesi vocale compatibili con gli standard di settore con voci italiane naturali, voice cloning istantaneo e supporto multilingua. Infrastruttura italiana, latenza bassa e tariffa unica trasparente: €4.00 per milione di caratteri.

Pricing trasparente, in euro

STT €4.00 e TTS / Voice Cloning €50.00 per 1M caratteri. Nessuna tariffa nascosta per lingua o voce.

Speech-to-Text

Trascrivi qualunque file audio (WAV, MP3, FLAC, OGG, M4A) con altissima accuratezza. Auto-detect della lingua fra 99 lingue supportate.

€4.00 / 1M caratteri trascritti

POST /v1/audio/transcriptions

Text-to-Speech

Sintesi vocale naturale multilingua con 58 voci preimpostate. Alias compatibili con gli standard di mercato (alloy, echo, nova, shimmer…) per drop-in replacement.

€50.00 / 1M caratteri sintetizzati

POST /v1/audio/speech

Voice Cloning

Clona una voce a partire da soli 3 secondi di audio di riferimento, per brand voice dedicate o personalizzazioni.

€50.00 / 1M caratteri — stessa tariffa TTS

POST /v1/audio/clone

Sottotitoli pronti

Esporta direttamente in formato SRT o WebVTT per editor video, player HTML5 e piattaforme di streaming.

Incluso nel prezzo STT

response_format=srt | vtt

Multilingua nativo

STT in 99 lingue, TTS in 17 lingue principali (italiano, inglese, francese, tedesco, spagnolo, portoghese, giapponese…).

Nessun costo extra per lingua

language=it | en | fr …

Standard di settore

Endpoint e payload conformi allo standard REST /v1/audio/*. Sostituisci la base URL e la chiave: drop-in replacement.

Zero refactoring

Bearer sk-runai-…

curl "https://api.runai.it/v1/audio/transcriptions" \ -H "Authorization: Bearer sk-runai-<your_key>" \ -F "file=@audio.wav" \ -F "model=runai-stt" \ -F "language=it" \ -F "response_format=verbose_json" # Risposta JSON (con timestamp per segmento) { "text": "Ciao, questo è un test di trascrizione.", "language": "it", "duration": 3.12, "segments": [{ "start": 0.0, "end": 2.46, "text": "..." }] }

curl "https://api.runai.it/v1/audio/speech" \ -H "Authorization: Bearer sk-runai-<your_key>" \ -H "Content-Type: application/json" \ -d '{ "model": "runai-tts", "input": "Benvenuto nel nostro servizio.", "voice": "nova", "language": "it" }' \ --output output.wav # La risposta è uno stream binario audio/wav

curl "https://api.runai.it/v1/audio/clone" \ -H "Authorization: Bearer sk-runai-<your_key>" \ -F "input=Questo audio usa la mia voce clonata." \ -F "language=it" \ -F "speaker_wav=@riferimento.wav" \ --output clonata.wav # Consigliato: almeno 3 secondi di audio pulito di riferimento

Due modelli, infinite applicazioni

Speech-to-Text

Text-to-Speech

Voice Cloning

Sottotitoli pronti

Multilingua nativo

Standard di settore

Perché RunAI Audio

Integrazione in 5 minuti

58 voci, 17 lingue

Alias standard supportati

Lingue supportate (TTS)

Dati audio sotto controllo

Porta la voce nelle tue applicazioni

Accedi

Verifica in due passaggi

Crea Account

Recupera Password

Audio API

Due modelli, infinite applicazioni

Speech-to-Text

Text-to-Speech

Voice Cloning

Sottotitoli pronti

Multilingua nativo

Standard di settore

Perché RunAI Audio

Integrazione in 5 minuti

58 voci, 17 lingue

Alias standard supportati

Lingue supportate (TTS)

Dati audio sotto controllo

Porta la voce nelle tue applicazioni