Strumenti di elaborazione dati
Metadata e sistemi semantici
Siamo attualmente in un momento di grande sviluppo di servizi telematici distribuiti sulla rete e di diffusione del cloud computing. La pluralità crescente di informazioni disponibili in Internet rende pressoché indispensabile la realizzazione di meccanismi che aiutino l’utente nella ricerca delle informazioni di cui necessita.
Data la grande varietà dei contenuti, si sono affermati da alcuni anni delle tecniche di indicizzazione basate sulla semantica, ovvero sull’utilizzo di dizionari, spesso multilingua, che migliorino l’efficacia degli algoritmi di ricerca sfruttando i legami di significato tra i diversi vocaboli.
Caratteristiche principali
Metadato significa letteralmente “dato sul dato”, e indica precisamente il corredo di informazioni accessorie che accompagna un dataset. Il metadato descrive le caratteristiche globali di una risorsa informativa come ad esempio la numerosità degli elementi (record, features, tessere di immagini …) l’area geografica (bounding box), i riferimenti di contatto e la struttura degli attributi (elenco dei campi e tipo). Si tratta generalmente di un database indice con una serie di puntatori alla risorsa fisica (URL, percorso fisico, URL del servizio web …). Per la gestione efficace di un sistema di metadati è necessario un apposito software che può essere sviluppato sia in ambiente locale, sia in ambiente web.
La problematica dell’etichettatura dei contenuti è piuttosto importante. Le diverse modalità con cui ogni operatore assegna nomi alle risorse o anche ai singoli attributi può creare dei disallineamenti tra indici e risorse per cui un buon sistema di metadatazione incorpora un dizionario terminologico che contiene numerosi legami di significato tra vocaboli correlati. Questo insieme di legami consente agli algoritmi di ricerca di indicizzare una risorsa anche se questa non è etichettata con il termine più appropriato ma con uno ad essa riconducibile.
Tecnologie correlate
I sistemi di metadati sono applicati di norma a dataset pubblicati in rete tramite geoweb services. In questi contesti si impiegano di norma sistemi GIS, geoDatabase, server di mappe.