Questa pagina presenta lo strumento di Validación del repositorio del Catalogo Nazionale dei Dati Semantici (NDC), gestito congiuntamente dal Dipartimento per la trasformazione digitale e da ISTAT.
Lo strumento esegue una verifica completa di un repository GitHub prima della pubblicazione su NDC, riproducendo on-demand gli stessi controlli che il catalogo applica automaticamente durante l’harvesting.
Consente quindi ai maintainer di una Pubblica Amministrazione di sapere in anticipo se il proprio repository — e gli asset semantici che contiene — è pronto per essere ingerito correttamente nel catalogo nazionale.
L’operazione non ha alcun effetto collaterale: non scrive nulla sul triple store, sull’indice di ricerca o sul database del catalogo.
È un controllo a sola lettura, ripetibile quante volte si desidera.
Lo strumento permette di agevolare il processo di pubblicazione delle risorse semantiche nel catalogo, eseguendo in un’unica passata tre famiglie di controlli su tutti gli asset (.ttl) presenti nel repository:
adms:status).dati-semantic-cookiecutter di Team Digitale (directory standard, workflow CI, hook di pre-commit).Gli esiti di tutte le verifiche vengono aggregati in un report unificato e classificati secondo una tassonomia comune a tre livelli (Bloccante, Advertencia, Migliorativo), così da offrire una vista omogenea e facilmente interpretabile.
Compilare il modulo iniziale indicando il repository GitHub da analizzare.
| Campo | Obbligatorio | Descripción |
|---|---|---|
| Propietario GitHub | Sì | Utente o organizzazione proprietaria del repository (es. istat). |
| Repositorio | Sì | Nome del repository (es. ts-ontologie-vocabolari-controllati). |
| Revisión | No | Branch, tag o commit SHA da validare. Se non specificata, viene usata la default branch del repository. |
Premere quindi «Avvia validazione». Il pulsante «Riprova» consente di rilanciare la validazione (ad esempio dopo aver corretto il repository o per cambiare i parametri).
Il repository deve essere pubblico su GitHub. L'URL viene costruito automaticamente come:
https://github.com/{owner}/{repository}
La validazione è un'operazione asincrona: a seconda della dimensione del repository può richiedere da alcuni secondi a qualche minuto (clonazione, scoperta degli asset, validazione di ogni file).
Durante l'elaborazione la pagina mostra l'avanzamento in tempo reale:
PENDIENTE → CLONING → DISCOVERING → VALIDATING → COMPLETEDFAILED in caso di errore).Non è necessario tenere la pagina sempre in primo piano: lo stato viene aggiornato automaticamente fino al completamento.
Al termine viene mostrato un riepilogo aggregato con i contatori complessivi del report:
Il riepilogo offre una valutazione immediata dello stato di salute del repository.
La sezione finale consente di esplorare gli esiti nel dettaglio attraverso tre schede:
.ttl scoperto, con i relativi problemi (sintassi e metadati), il percorso del file, il tipo di asset e l'indicazione se l'asset è stato saltato.Sono disponibili filtri per severità (Bloccante, Advertencia, Migliorativo) e per tipo di asset, oltre a una ricerca per individuare rapidamente un asset.
Il pulsante «Esporta report (JSON)» permette di scaricare il report completo per archiviazione, confronto o analisi successive.
Tutti i problemi rilevati sono classificati secondo una tassonomia unificata a tre livelli:
| Severità | Significato |
|---|---|
| Bloccante | L'asset o il repository presenta un problema che impedisce l'ingestione corretta. Deve essere risolto prima di qualsiasi (ri)pubblicazione. Esempi: sintassi RDF non valida, proprietà dct:license mancante su una distribuzione, directory assets/ assente. |
| Advertencia | Anomalia non bloccante: l'asset verrebbe comunque ingerito, ma con riserva. È consigliabile correggerla per evitare degradi futuri. Esempi: adms:status con valore non standard, workflow validate.yaml non allineato al template. |
| Migliorativo | Nessun impatto sull'ingestione: rappresenta un suggerimento di allineamento alle best practice. |
I controlli sulla struttura del repository verificano in particolare:
assets/ e delle sottodirectory per tipo di assetontologies, controlled-vocabularies, schemas);.github/workflows/ e del workflow validate.yaml, nonché il suo allineamento al template cookiecutter;.pre-commit-config.yaml e la copertura degli hook semantici pubblicati da dati-semantic-tools.I check superati (PASADO) restano tracciati nel report a fini di rendicontazione, ma non incidono sui contatori del riepilogo.
Per ogni asset il report indica il path del file, il tipo
(ONTOLOGY / CONTROLLED_VOCABULARY / SCHEMA)
e la lista dei problemi.
Per i problemi di sintassi sono riportate, quando disponibili, riga e colonna;
per i problemi di metadati viene indicato il campo interessato (es. distributions).
Un asset marcato come saltato (skipped) non è stato validato fino in fondo, tipicamente perché un errore di sintassi ne ha impedito il parsing dei metadati.
.ttl).