| parsing | ||
| voc1 | ||
| voc2 | ||
| voc3 | ||
| .gitignore | ||
| .python-version | ||
| join.ipynb | ||
| main.py | ||
| pyproject.toml | ||
| README.md | ||
| romagnolo.db | ||
| uv.lock | ||
Digitalizzare i 3 dizionari
La Visione Globale (Il Database)
Immagina che il lavoro sia finito. Un utente apre il tuo software o consulta il file Excel. Non vedrà il caos delle pagine originali, ma una struttura pulita e interrogabile.
L'obiettivo è creare il "Minimo Comune Multiplo": una struttura capace di ospitare sia le definizioni semplici, sia le note storiche complesse, sia le coniugazioni grammaticali, senza obbligare a riempire tutto se l'informazione non c'è.
Le Colonne del Database
Ecco cosa ci sarà dentro, colonna per colonna:
| Nome Colonna | Cosa contiene (Concetto) | Esempio Pratico |
|---|---|---|
| ID_FONTE | La sigla del dizionario di provenienza. Fondamentale per tracciare l'origine. | GAL, MASA, MGN |
| VOCABOLO | La parola romagnola (il "Lemma"). È la chiave di ricerca principale. | Abach, Gal, Mavôr |
| VARIANTI | Altre forme dello stesso vocabolo (spesso tra parentesi o graffe). | Abàch, Purmètar |
| TRADUZIONE | La corrispondenza italiana secca. Serve per cercare "Come si dice X in romagnolo?". | Abaco, Gallo, Maggio |
| CAT_GRAMM | La categoria grammaticale. | sm. (sost. maschile), vn. (verbo neutro), sf. |
| FORME_GRAMM | (Plurale / Femminile / Participio). Qui finiscono le coniugazioni. | Pl. Maşê, Prt. Acadù, F. éda |
| DEFINIZIONE | La spiegazione estesa del significato. | Libricino di tavole per imparare a far conti. |
| AMBITO | Il contesto d'uso o il registro linguistico. | T. agr. (agricolo), Scherz. (scherzoso), (del vino) |
| MODI_DI_DIRE | Frasi fatte, proverbi, esempi d'uso elencati sotto la parola. | Fèr e galantom (Far da galantuomo); Aprir li occhi. |
| NOTE_CULTURALI | Etimologia, storia, citazioni letterarie, canzoni, nomi scientifici. | Lat. med. massa; Phasianus domesticus; Citazione del Carducci... |
| VEDI_ANCHE | Rimandi ad altre parole nel dizionario. | V. Guardiān, V. Guton |
Istruzioni Operative per Dizionario
1. vocabolarioromag00morruoft.pdf
Riconoscibile da: Testo fitto, discorsivo, font antico. (Es. voci: Gajon, Gal, Oca)
Questo dizionario è un racconto. Nasconde le informazioni dentro frasi lunghe.
- VOCABOLO: È la prima parola in Grassetto Maiuscolo.
- TRADUZIONE: È subito dopo la categoria (s.m.), solitamente in Corsivo.
- ATTENZIONE AI "SOTTO-LEMMI": Spesso, dentro la colonna di testo, trovi frasi in grassetto (es. sotto OCA trovi Aprir li occhi).
- Regola: Se è una lista lunga, crea una nuova riga per ogni frase in grassetto. Se è breve, inseriscila nella colonna
MODI_DI_DIRE.
- Regola: Se è una lista lunga, crea una nuova riga per ogni frase in grassetto. Se è breve, inseriscila nella colonna
- SCIENTIFICO & AUTORI: Se trovi nomi in latino (Phasianus domesticus) o citazioni di autori ("Carducci disse..."), NON metterli nella definizione. Spostali nella colonna
NOTE_CULTURALI. - AMBITO: Cerca sigle come T. agr. (Termine agricolo) o T. cont. (Termine contadinesco) e mettile nella colonna
AMBITO.
2. vocabolarioroma02mattgoog.pdf
Riconoscibile da: Uso di parentesi graffe {, maiuscoletto per l'italiano. (Es. voci: Mèsadréja, Oli)
Questo è il più insidioso ("La Trappola"). Tende a spiegare parole italiane usando il dialetto.
- LE GRAFFE { : Se vedi una graffa che unisce due parole (es.
Mèsadréja{Mezadrì), metti entrambe nella colonnaVOCABOLOo usa la colonnaVARIANTI. - LA TRAPPOLA DELLE PAROLE ITALIANE:
- Spesso, dopo la definizione, elenca parole italiane in MAIUSCOLETTO (es. sotto Oli trovi OLIARIO, OLIERA).
- Regola AUREA: Se queste parole italiane non hanno una parola in grassetto romagnola prima, NON CREARE NUOVE RIGHE. Sono solo arricchimenti. Ignorale o mettile nelle note.
- Estrai solo ciò che è in Grassetto.
- BOTANICA: Se trovi scritto Vulg. (Volgare), trattalo come un sinonimo o nota.
3. vocabolarioromag00ercouoft.pdf
Riconoscibile da: Sfondo giallino, molto schematico, elenchi puntati. (Es. voci: Masa, Mavôr)
Questo è il più prezioso per la grammatica. Qui bisogna essere precisi come chirurghi.
- MORFOLOGIA (Fondamentale): È l'unico che riporta sistematicamente come cambia la parola.
- Copia tutto ciò che trovi dopo Prt. (Participio), Pl. (Plurale), F. (Femminile) nella colonna
FORME_GRAMM. Non perderle!
- Copia tutto ciò che trovi dopo Prt. (Participio), Pl. (Plurale), F. (Femminile) nella colonna
- I SEPARATORI | : Le barre verticali separano significati diversi (es. Accomodare | Riparare). Usale per popolare la
TRADUZIONEo i sinonimi. - STORIA E FOLKLORE: Ci sono paragrafi interi che parlano di storia (es. "nel 1252...") o testi di canzoni (es. "L'è venuti magi...").
- Regola: Tutto questo testo va in
NOTE_CULTURALI. La colonnaDEFINIZIONEdeve rimanere pulita.
- Regola: Tutto questo testo va in
- VARIANTI: Le parole tra parentesi tonde subito dopo il lemma (es. Mavôr (Mont)) vanno nella colonna
VARIANTI.
Note Finali e Consigli Utili
- Comanda il Grassetto: Se non è in grassetto, probabilmente non è un vocabolo romagnolo da indicizzare.
- Separa l'Italiano: La traduzione (es. "Gallo") va separata dalla spiegazione ("Uccello domestico...").
- Caccia al Tesoro Grammaticale: Se vedi Pl., F., Prt. (soprattutto nel dizionario Giallo), catturali sempre.
- Non mischiare la Storia: Date, latino, citazioni poetiche vanno nelle Note, non nella definizione.
- Occhio ai "Vedi": V. significa "Vedi", non "Verbo". È un indirizzo, non una definizione.