Benchmark & baseline v0.1
1) Gold set (template)
Il gold set è un campione di righe/entry trascritte e verificate manualmente (calendari + martirologi). Si usa per calcolare errori e tempi di correzione.
- benchmark_goldset_template.tsv (template TSV)
- benchmark_readme.txt (schema campi e istruzioni)
2) KPI (metriche)
| Area | KPI | Cosa misura | Unità |
|---|---|---|---|
| Layout | Accuratezza segmentazione | Qualità segmentazione (righe/colonne/aree: mese, giorni, marginalia) | % |
| HTR | CER / WER | Errori carattere/parola rispetto al gold set | % |
| Operatività | Tempo per pagina | Tempo complessivo: ingest → output revisionato | min/pagina |
| Usabilità | Azioni di correzione | Numero medio di interventi e curva di apprendimento (correzione OCR-like) | #azioni / min |
| Output | Export TEI valido | Validità e completezza dell'export (TEI + JSON/CSV) | sì/no + % |
3) Baseline
- Baseline 0 (manuale): trascrizione umana + TEI (tempo e qualità “gold”).
- Baseline 1 (HTR): output HTR con configurazione standard (senza ottimizzazioni ad hoc).
- Baseline 2 (layout): segmentazione automatica out-of-the-box su pagine difficili (marginalia, bleed-through).
4) Uso pratico (release rapide)
- Seleziona 2–3 pagine calendario + 2–3 pagine martirologio (link alle fonti).
- Compila il gold set su 20–40 righe totali (prima release).
- Registra tempi di correzione (min/pagina) e principali errori ricorrenti.
- Pubblica una nuova release aggiornando i file in
/datae la versione (v0.2, v0.3...).