DTD, XML, URN... Come
funzionerà il sistema di ricerca "Normeinrete"
06.07.2000
Mettere in rete gli atti normativi non è
difficile. Il vero problema è trovarli, come qualsiasi altro contenuto
disponibile sull'internet.
Questa è la sfida che deve essere affrontata per costruire un efficiente
sistema di reperimento delle norme, perché la Gazzetta ufficiale non riporta
tutti i provvedimenti che vengono emanati ogni giorno da centinaia di enti.
Dalle leggi dello Stato a quelle regionali, dalle ordinanze comunali alle
circolari ministeriali, dalla giurisprudenza ai provvedimenti delle autorità
indipendenti, migliaia di testi vengono emanati ogni anno e devono essere messi
a disposizione dei cittadini.
Il progetto intersettoriale "Norme in
Rete", promosso dall'Autorità per l'informatica nella pubblica
amministrazione, viene sviluppato da diversi enti; il Ministero della giustizia,
il Senato, La Camera dei Deputati, l'Istituto per la documentazione giuridica
del CNR e il consorzio interuniversitario CINECA.
Alcuni di questi soggetti sono anche "produttori" o
"editori" di testi normativi e ciascuno adotta un proprio sistema di
archiviazione e ricerca delle norme. Quindi il primo punto che deve essere
affrontato per realizzare il grande archivio distribuito è la standardizzazione
del formato dei testi. Per avere un'idea delle dimensioni del problema, si pensi
a quante forme diverse può assumere l'indicazione della data: solo per il mese,
ad esempio, si può avere l'indicazione per esteso (gennaio), abbreviata senza
punto (gen), abbreviata col punto (gen.), a una cifra (1), a due cifre (01)... E
non parliamo della ricerca per parole chiave o a testo libero. Sappiamo che può
rivelarsi una trappola, sia per la presenza di termini simili o sinonimi, sia
perché di solito genera una quantità eccessiva di riferimenti inutili, tra i
quali la selezione è lunga e frustrante.
Bastano questi pochi cenni per capire la portata
del compito che deve essere affrontato per la realizzazione di un sito internet
dal quale reperire con sicurezza qualsiasi norma, dovunque si trovi, e con tutti
i necessari riferimenti.
Il sistema, ancora non definitivo, messo a punto da diversi gruppi di studio è
fondato su una serie di soluzioni all'avanguardia e perfettamente integrate
nella visione della Rete come sistema informativo complesso. Vediamole in
estrema sintesi:
- Il testo del singolo atto normativo.
Costituisce l'unità informativa di base e rimane sul server dell'ente che lo ha
emanato. Si realizza quindi un database distribuito.
- L'indicatore logico della risorsa. E'
necessario una sintassi unica per identificare l'atto, in sostanza una stringa
che ne contenga, secondo un formato prestabilito, le indicazioni essenziali. Si
chiama URN (Uniform Resource Name) e funziona un po' come il sistema dei
numeri IP: le risorse vengono reperite dal motore di ricerca che funziona sullo
schema di un domain name server (DNS)
- La metainformazione. E' costituita dai
dati che si riferiscono al testo. Per avere un'idea di che cosa si intende per
metainformazione, si vedano sul sito del Senato le schede informative dei
progetti di legge, che illustrano l'iter parlamentare e rimandano alle diverse
versioni dei testi. Si sta valutando se conviene lasciare le metainformazioni
sul database distribuito, insieme ai testi a cui si riferiscono, o raccoglierle
in un server centralizzato.
- La definizione del testo. Si chiama DTD (Document
Type Definition), definisce le classi di documenti e quindi serve a generare
le metainformazioni, compresi i link a documenti esterni (di solito i testi
richiamati dalle norme in esame).
- La marcatura del contenuto. Consiste
nell'inserimento di una serie definita di tag che indicano le parti del
testo e altri dettagli (per esempio, titolo, articolo, comma ecc.). Per questi
si usa il codice XML, che funziona come l'HTML, ma non influenza l'aspetto del
testo come appare all'utente (HTML e XML sono sottoinsiemi del linguaggio SGML (Standard
Generalized Markup Language).
Tutto questo dovrà essere applicato,
gradualmente, all'intero corpus normativo italiano, partendo dai
provvedimenti più recenti e risalendo indietro nel tempo (per la cronaca, il
Senato già da un anno pubblica sul web i disegni di legge marcati secondo
standard che saranno compatibili con le soluzioni definitive).
Sembra un lavoro ai limiti dell'impossibile, ma di fatto la difficoltà riguarda
soprattutto la produzione "periferica", perché è necessario
convincere - o costringere - anche il più sperduto comune a pubblicare ogni
atto secondo gli standard che saranno adottati.
Invece, per quanto riguarda l'elaborazione della produzione normativa del
passato, la parte più importante è ordinata negli archivi della Cassazione in
forme rigidamente strutturate. Di conseguenza l'operazione di
"ammodernamento" delle grandi basi di dati potrà essere compiuta con
procedure automatiche.
Questo, a grandi linee e con le inevitabili
imprecisioni della sintesi, è il progetto "Norme in rete". Che avrà
un altro merito oltre a quello, ovvio, di mettere ordine nella normativa
italiana e rendere rintracciabile ogni testo: darà un nuovo valore a quello
straordinario archivio che è il Centro di documentazione elettronica della
Cassazione e riporterà al passo dei tempi l'informatica giuridica, una materia
che da troppi anni è rimasta ferma alle passate glorie.
Un'altra conseguenza positiva potrebbe essere un miglioramento del livello della
produzione normativa, ma qui siamo nel campo del futuribile. C'è solo da
sperare che non sia futuribile tutto il progetto e che i risultati si possano
vedere in tempi brevi, anche se è ragionevole dubitare che tutto possa essere
fatto nei tempi ristretti del Piano d'azione del Governo.
Un dato confortante è che il sito sperimentale Normeinrete,
nei limiti della documentazione disponibile, sembra funzionare abbastanza bene.
|