Docparse API

Docparse API

Converti PDF, DOC, DOCX, RTF e ODT in Markdown strutturato con intestazioni, articoli e tabelle preservate. OCR italiano integrato per scansioni, infrastruttura in Italia e fatturazione per pagina trasparente.

Input PDF

CCNL_Studi_Professionali.pdf
88 pagine · 2.4 MB

Articolo 1 — Premessa
Le parti firmatarie…
[tabella retribuzioni]
Articolo 2 — Sfera…

Output Markdown

# CCNL Studi Professionali

## Articolo 1 — Premessa
Le parti firmatarie del…

| Livello | Min. | Max. |
|---------|------|------|
| Q | 2150 | 2680 |

Fatturazione per pagina elaborata

Tariffa unica per pagina, identica per PDF testuali e scansioni con OCR. Nessun costo per upload o conversioni interne (.doc, .docx, .rtf, .odt).

PDF → Markdown

PDF testuali con intestazioni, articoli, elenchi e tabelle preservate in Markdown standard. Pronti per LLM, RAG e indicizzazione.

Per pagina elaborata

POST /v1/convert/pdf-to-markdown

DOC, DOCX, RTF, ODT

Carica direttamente i formati Office: vengono convertiti server-side in PDF tramite LibreOffice headless e poi processati. Nessun pre-processing lato client.

+3–8 s di overhead conversione

POST /v1/convert/pdf-to-markdown

OCR italiano nativo

Per PDF interamente scansionati: OCR italiano accelerato su hardware dedicato. Lingua bilingue supportata (es. ita,eng per CCNL).

Stessa tariffa — per pagina

POST /v1/ocr/scanned

Tabelle estratte

Tabelle restituite sia inline nel Markdown sia come array tables[] separato per parsing programmatico.

Incluso nel prezzo

extract_tables=true

Da URL pubblico

In alternativa all'upload, passa direttamente l'URL di un PDF pubblico in JSON: il gateway lo scarica e processa per te.

Zero passaggi client

{"url": "https://….pdf"}

Range pagine

Processa solo le pagine che ti servono con pages_range. Utile per documenti voluminosi (CCNL, manuali, atti) di cui ti interessa una sezione specifica.

Risparmio proporzionale

pages_range=1-50,80-90

curl "https://api.runai.it/v1/convert/pdf-to-markdown" \ -H "X-API-KEY: YOUR_API_KEY" \ -F "file=@CCNL_Studi_Professionali.pdf" \ -F "extract_tables=true" # Risposta JSON (estratto) { "engine": "runai-docparse", "markdown": "# CCNL Studi Professionali\n\n## Articolo 1 ...", "metadata": { "n_pages": 88, "language": "ita", "has_text_layer": true }, "tables": [ ... ], "elapsed_s": 18.4 }

curl "https://api.runai.it/v1/convert/pdf-to-markdown" \ -H "X-API-KEY: YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "url": "https://example.com/contract.pdf", "force_ocr": false, "extract_tables": true }' # Stesso schema di risposta della variante upload

curl "https://api.runai.it/v1/ocr/scanned" \ -H "X-API-KEY: YOUR_API_KEY" \ -F "file=@scansione_atto_notarile.pdf" \ -F "lang=ita" \ -F "dpi=200" # Per scansioni > 100 pp imposta timeout client ≥ 30 minuti

Tutto quello che serve per estrarre testo strutturato

PDF → Markdown

DOC, DOCX, RTF, ODT

OCR italiano nativo

Tabelle estratte

Da URL pubblico

Range pagine

Perché RunAI Docparse

Integrazione in 3 minuti

Casi d'uso reali

CCNL & contrattualistica

Atti notarili & sentenze

Bilanci & fascicoli

Manuali & normativa tecnica

PA & enti pubblici

RAG & knowledge base

Documenti sotto controllo

Trasforma i tuoi PDF in dati strutturati

Accedi

Verifica in due passaggi

Crea Account

Recupera Password

Docparse API

Tutto quello che serve per estrarre testo strutturato

PDF → Markdown

DOC, DOCX, RTF, ODT

OCR italiano nativo

Tabelle estratte

Da URL pubblico

Range pagine

Perché RunAI Docparse

Integrazione in 3 minuti

Casi d'uso reali

CCNL & contrattualistica

Atti notarili & sentenze

Bilanci & fascicoli

Manuali & normativa tecnica

PA & enti pubblici

RAG & knowledge base

Documenti sotto controllo

Trasforma i tuoi PDF in dati strutturati