Στις 30/4/2012 πραγματοποιήθηκε η 2η συνάντηση της Ομάδας Εργασίας για την Καταπολέμηση της Φοροδιαφυγής.
Στην προηγούμενη συνάντηση έχει γίνει μια καταγραφή των πηγών από τις όποιες μπορεί να υπάρχει δημιουργία αξιόπιστης κατά το δυνατόν εικόνας για την πραγματική οικονομική κατάσταση φυσικών πρόσωπων. Η λίστα με τις πηγές είναι στο παράρτημα στο τέλος του κειμένου.
Αρχικά υπήρξε ενημέρωση από τον κ. Λασκαρίδη για το νόμο που καθορίζει το πλαίσιο ανταλλαγής δεδομένων μεταξύ φορέων (πχ. Τραπεζών, εταιρειών ύδρευσης, τηλεφωνίας, ηλ. ρεύματος κλπ) και ΓΓΠΣ για την δημιουργία πληρέστερης εικόνας για την οικονομική κατάσταση φυσικών πρόσωπων.
Υπήρξαν απόψεις για την προσθήκη στην λίστα πηγών των ακολούθων πηγών:
- ιδιωτική ασφάλιση (νοσοκομειακά, ασφάλειες ζωής, επενδυτικά προϊόντα!)
- εξυπηρέτηση δάνειων (υπάρχουν ύποπτες μορφές εξόφλησης δάνειων)
- πιστωτικές κάρτες (άντληση δεδομένων από συναλλαγές πιστωτικών καρτών).
Το αλγοριθμικό πλαίσιο για τον υπολογισμό τεκμαρτού εισοδήματος πρέπει να έχει τα ακόλουθα συστατικά:
- Ένα ικανό δείγμα με ground truth – δηλαδή μια λίστα με φυσικά πρόσωπα (η ομάδες συνδεόμενων με συγγενικούς δεσμούς), την εικόνα της ακίνητης ιδιοκτησίας τους και τις καταναλώσεις τους από τις προαναφερθείσες πηγές
- Δημιουργία πιθανοτήτων κατανομών καταναλώσεων σε σχέση με το φορολογητέο εισόδημα (έτσι ώστε να δημιουργηθεί η αναμενόμενη συμπεριφορά)
- Η ανακάλυψη outliers από τις παραπάνω κατανομές - δηλαδή περιπτώσεις υψηλού ρίσκου που προτείνονται για παραπέρα εξέταση από τις αρχές. Η αλγοριθμική προσέγγιση θα στηρίζεται σε κάποια μέθοδο πρόβλεψης (πχ. Regression, decision trees, Bayesian networks etc.) η σε κατάλληλο συνδυασμό τους και με βάση κάποια από τα χαρακτηριστικά καταναλώσεων και σχετικά βάρη: Risk = f (id/gid, declared_income, consumptions, properties), είναι μια συνάρτηση με εισόδους:
- id/gid: η ταυτοποίηση του φυσικού πρόσωπου η της ομάδας διασυνδεομένων φυσικών πρόσωπων
- declared_income: το δηλωθέν εισόδημα (με στοιχεία ιστορικότητας ώστε να αποσβηστούν απότομες μεταβολές εισοδήματος,
- consumptions: καταναλώσεις ύδρευσης, τηλεφωνίας, ηλ. Ρεύματος και άλλες
- properties: μια κανονικοποιημενη εικόνα/άξια των ακίνητων του πρόσωπου η της ομάδας
Το αποτέλεσμα της συνάρτησης θα είναι μια τιμή που θα προβλέπει το ρίσκο φοροδιαφυγής για το συγκεκριμένο πρόσωπο/ομάδα πρόσωπων.
Στόχοι βραχυπρόθεσμα θα είναι:
- Η αποτύπωση προδιαγραφών για λεξικό ονομάτων / επίθετων και η δημιουργία οικογενειακών συγγενικών γραφημάτων από τις διαθέσιμες πηγές ταυτοποίησης (ΑΜΚΑ, εκλογικός κατάλογος κλπ)
- Πληρέστερη σχεδίαση του αλγοριθμικού πλαισίου για την πρόβλεψη ρίσκου σε επίπεδο φοροδιαφυγής για φυσικά πρόσωπα και ομάδες διασυνδεομένων πρόσωπων.
Προτεινόμενες Ενέργειες:
- Οι συμμετέχοντες να προσφέρουν προς ενοποίηση ένα λεξικό που διαθέτουν εσωτερικά. Προτείνεται οι φορείς Οικονομική Αστυνομία, ΗΔΙΚΑ, ΓΓΠΣ να παρέχουν το λεξικό ονομάτων και επώνυμων που έχουν για την ευθυγράμμιση και κανονικοποιηση τους.
- Η ΓΓΠΣ να αποστείλει την πιο πρόσφατη έκδοση του νόμου για την παροχή δεδομένων στην ΓΓΠΣ
- ΗΔΙΚΑ να μας παρέχει ένα κατάλληλο αντίγραφο του αρχείο ΑΜΚΑ για την πιλοτική δημιουργία συγγενικών γραφημάτων
Ο μεσοπρόθεσμος στόχος που πρέπει να εξυπηρετηθεί είναι η εξασφάλιση της *ποιότητας* δεδομένων που διατηρούνται σε δημόσια ψηφιακά αρχεία.
Ο στόχος αυτός μπορεί να εξυπηρετηθεί με τις ακόλουθες δράσεις:
- Δημιουργία εθνικών προδιαγραφών για λεξικά διευθύνσεων, ονομάτων, επώνυμων
- Δημιουργία και συντήρησης των λεξικών αυτών που θα εξασφαλίσουν διαλειτουργικότητα μεταξύ των πληροφοριακών συστηματων του Δημοσιου τομεα μεχρι την υιοθετηση ενός μοναδικου κωδικού ταυτοποιησης για κάθε πολίτη από όλες τις υπηρεσίες. Mια τέτοια προσπάθεια μπoρει να βρεθεί στο: http://dict.opengov.gr με το λεξικό διευθύνσεων και οικισμών της επικρατείας.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου