Loghi REACT-EU, MUR, PON

Workflow (immagine → TEI) bozza

Obiettivo

Realizzare una filiera unica e user‑friendly per manoscritti con struttura calendariale (calendari, martirologi): immagine → HTR/OCR → correzione (stile OCR) → export TEIpubblicazione online.

Pipeline (versione operativa)

  1. Ingest immagini (preferibilmente IIIF quando disponibile) + pre‑processing (dewarp/denoise).
  2. Segmentazione layout (righe/colonne/aree: mese, giorni, marginalia, rubriche).
  3. HTR/OCR con modelli addestrabili (latino come core; pilot greco in scope controllato).
  4. Correzione human‑in‑the‑loop con interfaccia unica e preset (minimo settaggi, massimo feedback).
  5. Parsing strutturale (giorno → entry; metadati; entità) senza cancellare varianti locali.
  6. Export in TEI (edizione) e/o JSON/CSV (catalogazione/analisi).
  7. Pubblicazione (EVT/TEI viewer) + rilascio dataset versionati.

Asset già presenti sul portale

Nota su EVT

Le visualizzazioni EVT presenti sono prototipi (alpha). Nel progetto la pubblicazione TEI sarà agganciata direttamente all'output della pipeline HTR/correzione.