Δευτέρα 3 Οκτωβρίου 2011

Διαχείριση μεγάλης κλίμακας δεδομένων και εξόρυξη γνώσης

Εισηγούμαστε την αξιοποίηση υπηρεσιών επιστημονικής υποστήριξης στην ευρύτερη περιοχή της ολοκλήρωσης και διαχείρισης μεγάλης κλίμακας δεδομένων στα πληροφοριακά συστήματα του δημόσιου τομέα με έμφαση στην δια-λειτουργικότητα, την ορθότητα των δεδομένων και την εξόρυξη γνώσης για την στήριξη αποφάσεων σε τακτικό και στρατηγικό επίπεδο.  Η συνεισφορά θα αφορά επιστημονική και τεχνική υποστήριξη για την ανάπτυξη αλγορίθμων εξόρυξης δεδομένων (data mining) για περιπτώσεις μεγάλης κλίμακας ετερογενών συνόλων δεδομένων από διαφορετικές υπηρεσίες του κρατικού μηχανισμού.
Ειδικότερα προτείνονται δυο συγκεκριμένες δράσεις:

1. Ταυτοποίηση δικαιωμάτων ιδιοκτησίας για την μεγιστοποίηση απόδοσης είσπραξης του τέλους ακινήτων που εισπράττεται με τους λογαριασμούς ρεύματος.

Ο υπολογισμός του Ειδικού Τέλους Ακίνητων (Ε.Τ.ΑΚ.)  γίνεται από την ΔΕΗ με βάση την επιφάνεια του ακίνητου, την παλαιότητα, την τιμή ζώνης και χρεώνεται στον αριθμό παροχής και στο ονοματεπώνυμο του υπόχρεου του λογαριασμού της ΔΕΗ. Για να πραγματοποιηθεί η αντιστοίχηση του τέλους που έχει χρεωθεί με τα στοιχεία του ιδιοκτήτη ή των ιδιοκτητών του κάθε ακινήτου απαιτείται να αναπτυχθούν τεχνικές λύσεις, αυτοματοποιημένες σε σημαντικό βαθμό, που θα επιτρέπουν την ταυτοποίηση ακινήτων αντιμετωπίζοντας προβλήματα όπως: 
α. σε πολλές περιπτώσεις τα στοιχεία αφορούν στους ενοικιαστές ή αλλά πρόσωπα ή δεν υπάρχουν ΑΦΜ  
β. μη ακριβή στοιχεία για την επιφάνεια του ακίνητου 
γ. αξιοπιστία λεξικού οδών / οικισμών και γεω-αναφορά.

Στόχος είναι η ανάπτυξη μηχανισμού ταυτοποίησης των ακίνητων σε σχέση με τους αριθμούς παροχής ηλεκτρικού ρεύματος για την αποδοτικότερη και εγκυρότερη είσπραξη του Ειδικού Τέλους Ακίνητων (Ε.Τ.ΑΚ.) – μια πολύ σημαντική πηγή εσόδων για τον προϋπολογισμό, ειδικά κάτω από τις τρέχουσες κρίσιμες συνθήκες.

2. Ανάλυση και εξόρυξη γνώσης από δεδομένα του δημόσιου τομέα  με στόχο την ανίχνευση κρυφών/αδήλωτων εισοδημάτων στο πλαίσιο καταπολέμησης φοροδιαφυγής/αποφυγής. Η φοροδιαφυγή και φορο αποφυγή αναγνωρίζονται ως ένα από τα κυρία οικονομικά και κοινωνικά προβλήματα στην Ελλάδα αλλά και διεθνώς. Η ευρεία διαθεσιμότητα λεπτομερών οικονομικών δεδομένων, όπως δηλώσεις εισοδήματος, χρηματιστηριακές δοσοληψίες, και άλλα δίνουν την δυνατότητα για άνευ προηγουμένου δυνατότητες αλλαγής μεθόδου για την ανίχνευση και αποτροπή του οικονομικού εγκλήματος. Πάντως καθώς τα δεδομένα αυτά γίνονται διαθέσιμα αλλά σε μεγάλη λεπτομέρεια και πολυδιάστατη αναπαράσταση αυξάνει η δυσκολία και η πολυπλοκότητα της ανάλυσης τους η όποια πλέον μπορεί να γίνει αποτελεσματικά μόνο με μεθόδους Εξόρυξης Δεδομένων οι οποίες δίνουν την δυνατότητα για την ανακάλυψη χρήσιμης πληροφορίας και γνώσης κρυμμένης σε μεγάλες και ετερογενείς πήγες πληροφορίας.

Στο πλαίσιο αυτό στόχος είναι η μελέτη και ανάλυση ετερογενών πηγών πληροφορίας για αντικειμενικά κριτήρια διαβίωσης και η αντιστοίχιση τους μετά δηλωθέντα εισοδήματα. Τέτοια  μεγέθη είναι η κατανάλωση ηλεκτρικού ρεύματος, νερού, κινήσεις πιστωτικών καρτών, ιδιοκτησίες ακίνητων και κινητών αξιών συγγενικών προσώπων κλπ.  Η μελέτη των δεδομένων που προαναφέρθηκαν θα οδηγήσει στην δημιουργία ενός συνόλου κανόνων και δεικτών για την πρόβλεψη οικονομικού εγκλήματος (πχ.Φοροδιαφυγής). Η προτεινόμενη δράση θα προσφέρει τεχνικές λύσεις στο ζήτημα της μη-τετριμμένης στατιστικής ανάλυσης διαφορετικών πηγών πληροφορίας με σκοπό την εξαγωγή κρίσιμης και έγκαιρης επιχειρησιακής γνώσης.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου