Παρασκευή, 19 Νοεμβρίου 2010

Συνέδριο Eurovoc conf day 2

Η δεύτερη μέρα του συνεδρίου είχε να κάνει περισσότερο με συναντήσεις μεανθρώπους και λιγότερο με παρουσιάσεις. Θα ξεκινήσω με τις παρουσιάσεις καικυρίως με την πρώτη όπου ο Ralf Steinberger παρουσίασε την εφαρμογήαυτόματης ταξινόμισης κατά Eurovoc. Πληροφορίες σχετικά με την εφαρμογή καιτον Steinberger δίνω παρακάτω.
Automatic EuroVoc indexing of parliamentary texts in all official EUlanguages(Ralf Steinberger, EC Joint Research Centre, Ispra)
JRC European Commission
Χρησιμοποιούν automatic learning tools με descriptors
83 % επιτυχία για Αγγλικά
80% επιτυχία για Ισπανικά
Spanish Congress og Deputies work from 2006 as an interactive tool
Η καθυστέρηση οφειλόταν στα διαφορετικά format που ήταν αποθηκευμένη η πληροφορία
Η λύση που βρήκαν ήταν να κάνεις XML input και XML output + additionaldescriptorSoftware learns from previously manually indexed documents. θα είναιδιαθέσιμο για 22 γλώσσες. Θα μπορεί να κάνει retraining
Ralf.Steinberger@jrc.ec.europa.eu &l 
http://langtech.jrc.ec.europa.eu
Automatic EuroVoc indexing of Parliamentary documentation - Livedemonstration 
(Victoria Fernández Mera Congreso de los Diputados, Spain)
Συμπερασματικά ανέφερε
It is able to assign keywords from a controlled language
High average of correct descriptors among 10 first assigned
It s able to retrain the assignmentIt is a reliable system
Semi automatic too to help support indexers workFirst step in an interactive indexing process
Eurovoc and parliamentary documents: a semi-automatic classificationexperience at the italian Camera dei deputati"
(Calogero Salamone, Biblioteca Camera dei Deputati, Roma, Italy)
Camera 72 was an automatic dictionary for classification of italian law 1978
Είχαν full text για νόμους, συμφωνίες κλπ από το 1848
Εγκαταλήφθηκε γιατί το ανώτατο δικαστήριο έφτιαξε το δικό του σύστημα.
In 1992 έφταιξαν το TESEO
To TESEO έχει 3650 όρους σε 45 θεματικές κατηγορίες kata UDC UnoversalDecimical Classification
Θα μεταφερθούν από το TESEO στο Eurovoc και για αυτό έχουν φτιάξει έναmapping system. (Ίσως ένα θέμα είναι να γίνει ένα mapping από το indexingτου Ραπτάρχη στο Eurovoc)
Normativa fisrt free & public database of italian legislation, they willclassify 70000 texts of italian legislation with automatic tools with eurovoc.
Από το 2008 έχουν εισάγει το eurovoc για την Senate and the Chamber ofDeputies
They use semantic technology solution of COGITO by Expert System(proprietary)Cameravoc is an opensource for user interface
salamone_c@camera.it 
Vocabulaire juridique multilingue comparé
(Caroline Reichling, Court of Justice of the European Union)
Imigration Law and Family Law
24 νομικοί για τα 24 για τις 23 γλώσσες
French and Spanish where used as a pivot
Curia Term Η σημασιολογική βάση του Δικαστηρίου
Επίσης από το παράλληλο session κάποιες μικρές σημειώσεις.
Multilingual access to online content - the Europeana experience
Vivien Petras, Humboldt-University Berlin
To Europeana είναι ένα interface από το οποίο μπορείς να πλοηγηθείς σε βιβλία, άρθρα, πορτρέτα, κάρτες, τέχνη και φωτογραφικό υλικό.Το Europeana δείχνει να είναι αρκετά δημοφιλές με 1 εκατομμύριο επισκέψειςμόνο για το έτος 2010. Χρησιμοποιεί 10 γλώσσες και ένα interface με στατικέςσελίδες. 
http://www.europeana.eu
The Vocabulary Mapping Framework and its potential for improving metadata interoperability in the Semantic Web
Gordon Dunsire, Centre for Digital Library Research - University of Strathclyde, UK
Το Vocabulary Mapping Framework δημιουργήθηκε από το UK's Joined informationsystems και έχει ολοκληρωθεί μόνο πρώτο στάδιο, σκοπός του είναι να φτιάξειένα εργαλείο που θα υποστηρίζει την αυτοματοποιημένη αντιστοίχιση και λεξικάαπό τα standards των μεταδεδομένων.
http://cdlr.strath.ac.uk/vmf.documents.htm

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου