Ο αλγόριθμος που βρίσκεται στην καρδιά του τεράστιου σκανδάλου με την παραβίαση των δεδομένων τουλάχιστον 50 εκατομμυρίων χρηστών του Facebook για την υποστήριξη της προεκλογικής καμπάνιας του Ντόναλντ Τραμπ ακούγεται πάρα πολύ δυστοπικός για να είναι πραγματικός. Κι όμως είναι.
Ψαρεύει μέσα από τα φαινομενικά πιο ασήμαντα posts – τα likes που οι χρήστες μοιράζουν όσο περιηγούνται στον ιστότοπο – για να συλλέξει ευαίσθητες προσωπικές πληροφορίες σχετικά με τον σεξουαλικό προσανατολισμό, τη φυλή, το φύλο ακόμη και την νοημοσύνη ή και τα παιδικά τραύματα των χρηστών.
Η επιστήμη των likes
Μερικές ντουζίνες likes μπορούν να δώσουν στοιχεία για μια καλή πρόβλεψη σχετικά με το πολιτικό κόμμα που θα ψηφίσει ο χρήστης. Αποκαλύπτουν το φύλο του και κατά πάσα πιθανότητα το αν ο σύντροφός του είναι άντρας ή γυναίκα. Επίσης δίνουν ισχυρές ενδείξεις για το αν οι γονείς τους έμεναν μαζί ή χώρια όταν ήταν παιδιά και ίσως προδώσουν το αν είναι ή όχι ευάλωτοι σε κάποια κατάχρηση ουσιών. Και μπορούν να τα κάνουν όλα αυτά χωρίς να χρειαστεί να ψάξει κανείς για προσωπικά μηνύματα, αναρτήσεις, ενημερώσεις της κατάστασης, φωτογραφίες ή άλλες πληροφορίες που έχει το Facebook.
Ορισμένα από τα αποτελέσματα μπορεί να μοιάζουν περισσότερο με αποτελέσματα μιας online ενημέρωσης παρά μιας εξελιγμένης ανάλυσης δεδομένων. Το να κάνεις like σε μια σελίδα πολιτικής καμπάνιας είναι λίγο διαφορετικό από το να αναρτήσεις μια αφίσα. Ωστόσο, πριν από πέντε χρόνια κάποιοι ερευνητές της ψυχολογίας έδειξαν, όπως γράφει ο Guardian, ότι συμπεράσματα για ιδιαίτερα περίπλοκα χαρακτηριστικά γνωρίσματα, αόρατα σε έναν άνθρωπο – παρατηρητή, μπορούν να συναχθούν από τα προφίλ στο Facebook.
Όταν οι χρήστες κάνουν like στις τηγανίτες πατάτες – «δαχτυλίδια» ή τα καλλυντικά Sephora αυτό καταγράφεται ως ένδειξη εξυπνάδας. Τα likes στα Hello Kitty καταγράφονται ως ένδειξη πολιτικής άποψης ενώ η σύγχυση όταν ξυπνάς από έναν υπνάκο συνδέεται με την σεξουαλικότητα.
Αυτές ήταν μόνο μερικές από τις απροσδόκητες αλλά συνεπείς συσχετίσεις που σημειώθηκαν σε ένα άρθρο του περιοδικού Πρακτικά της Εθνικής Ακαδημίας Επιστημών των ΗΠΑ το 2013. «Λίγοι χρήστες ήταν συνδεδεμένοι με likes που αποκάλυπταν ρητά τα χαρακτηριστικά τους. Για παράδειγμα, λιγότεροι από το 5% των χρηστών που χαρακτηρίστηκαν ως ομοφυλόφιλοι συνδέονταν σαφώς με ομοφυλόφιλες ομάδες, σύμφωνα με την έρευνα.
Οι ερευνητές Μικάλ Κοσίνσκι, Ντέιβιντ Στίλγουελ και Θορ Γκράπελ, είδαν τις δυστοπικές δυνατότητες της μελέτης και έθιξαν κάποια ζητήματα για την προστασία της ιδιωτικής ζωής. Εκείνη την περίοδο τα likes του Facebook ήταν δημόσια από προεπιλογή. «Η πρόβλεψη των ατομικών χαρακτηριστικών από τα αρχεία ψηφιακής συμπεριφοράς μπορεί να έχει σημαντικές αρνητικές συνέπειες, διότι μπορεί εύκολα να εφαρμοστεί σε μεγάλο αριθμό ανθρώπων χωρίς τη συγκατάθεσή τους και χωρίς να το αντιληφθούν», σημειώνουν οι ερευνητές. Οι εμπορικές εταιρείες, οι κυβερνητικοί θεσμοί ή ακόμη και οι φίλοι ενός χρήστη του Facebook μπορούν να χρησιμοποιήσουν το λογισμικό για βγάλουν συμπεράσματα για τη νοημοσύνη, τον σεξουαλικό προσανατολισμό και τις πολιτικές απόψεις ενός ατόμου χωρίς αυτό να έχει την πρόθεση να μοιραστεί αυτές τις πληροφορίες», ανέφεραν οι τρεις ερευνητές, σύμφωνα με τον Guardian.
Η Cambridge Analytica για… ψάρεμα
Αυτό σε κάποιους ακούστηκε σαν επιχειρηματική ευκαιρία. Μέχρι τις αρχές του 2014, ο διευθύνων σύμβουλος της εταιρείας Cambridge Analytica που εργάστηκε στην προεκλογική καμπάνια του Ντόναλντ Τραμπ, Αλεξάντερ Νιξ είχε υπογράψει συμφωνία με έναν από τους συναδέλφους του Κοσίνσκι, τον λέκτορα Αλεκσάντρ Κόγκαν. Ήταν ένα ιδιωτικό εμπορικό εγχείρημα που δεν είχε να κάνει με τα καθήκοντα του Κόγκαν στο Πανεπιστήμιο αλλά είχε με ένα τρόπο να κάνει με το έργο του Κοσίνσκι.
Ο ακαδημαϊκός είχε αναπτύξει μια εφαρμογή στο Facebook που περιείχε εάν κουίζ προσωπικότητας. Επειδή ο ίδιος δεν τα βρήκε με την Cambridge Analytica, ο Κόγκαν πρότεινε στην εταιρεία να σχεδιάσει μια παρόμοια εφαρμογή. Η Cambridge Analytica διαφήμιζε το κουίζ σε μεγάλες πλατφόρμες όπως η Amazon’s Mechanical Turk και πλήρωνε (2 έως 5 δολάρια) τους χρήστες του διαδικτύου για να το κάνουν.
Για να κάνει το κουίζ ο χρήστης έπρεπε να λογκαριστεί με τα στοιχεία του Facebook. Αυτό σήμαινε ότι η εφαρμογή είχε τη δυνατότητα να συλλέξει δεδομένα από τον λογαριασμό του χρήστη αλλά και των φίλων του στο Facebook. Τα αποτελέσματα του τεστ συνδυάστηκαν με τα δεδομένα του Facebook κάθε χρήστη ώστε να αναζητηθούν μοτίβα και να δημιουργηθεί ένας αλγόριθμος που θα κάνει προβλέψεις αποτελεσμάτων και για άλλους χρήστες του Facebook. Τα προφίλ των φίλων των χρηστών του Facebook παρείχαν ένα πεδίο δοκιμής για την αναζήτηση της φόρμουλας και – ακόμη πιο σημαντικό – έναν πόρο που θα καθιστούσε τον αλγόριθμο πολιτικά πολύτιμο.
Εκτός από το να έχει λογαριασμό στο Facebook ένας χρήστης θα έπρεπε επίσης να είναι ψηφοφόρος στις ΗΠΑ προκειμένου να μπορεί να κάνει το κουίζ. Έτσι δεκάδες εκατομμύρια προφίλ θα μπορούσαν στην ουσία να αντιστοιχούν σε εκλογικούς καταλόγους. Από μια αρχική δοκιμή περίπου 1.000 seeders η εταιρεία συγκέντρωσε περίπου 160.000 προφίλ ή περίπου 160 ανά χρήστη. Τελικά μερικές εκατοντάδες χιλιάδες αμειβόμενοι χρήστες ήταν το κλειδί για την απόκτηση των δεδομένων ενός μεγάλου πλήθους Αμερικανών ψηφοφόρων. Συνολικά η Cambridge Analytica ξόδεψε 7 εκατομμύρια δολάρια για να συγκεντρώσει τα δεδομένα που ήθελε.
«Μικρο-στόχευση» ψηφοφόρων
Η κλίμακα της συλλογής δεδομένων από την Cambridge Analytica ήταν τόσο μεγάλη που προκάλεσε τον τερματισμό της εφαρμογής. Ο Κόγκαν – όπως λέει ένας συνάδελφός του – μίλησε με έναν μηχανικό για να βρει τόπο να άρει τον περιορισμό. Έτσι μέσα σε δυο ημέρες η εφαρμογή συνέχισε να λειτουργεί.
Μέσα σε λίγους μήνες ο Κόγκαν και η Cambridge Analytica είχαν μια βάση δεδομένων εκατομμυρίων Αμερικανών ψηφοφόρων. Είχαν επίσης τον δικό τους αλγόριθμο για να σαρώνει αυτά τα δεδομένα και να εντοπίζει συγκεκριμένα πολιτικά προφίλ και χαρακτηριστικά προσωπικότητας. Στη συνέχεια η εταιρεία μπορούσε να αποφασίσει ποιους χρήστες θα στοχεύσει με συγκεκριμένα μηνύματα, μια πολιτική προσέγγιση, γνωστή ως «μικρο-στόχευση».
Τα κλεμμένα δεδομένα και η αντίδραση του Facebook
Η συλλογή των δεδομένων αυτών θα μπορούσε εξ αρχής να θεωρηθεί παράνομη καθώς ο Κόγκαν δεν είχε άδεια για τη συλλογή ή τη χρήση τους για εμπορικούς σκοπούς. Η άδεια που είχε από το Facebook περιοριζόταν – ειδικά – στην ακαδημαϊκή χρήση. Μάλιστα τα δεδομένα για των φίλων των χρηστών ήταν για χρήση μόνο στο ίδιο το Facebook για να υπάρξει ενθάρρυνση της αλληλεπίδρασης.
Η πώληση των δεδομένων ή χρήση τους για άλλους σκοπούς, συμπεριλαμβανομένου του πολιτικού μάρκετινγκ της Cambridge Analytica, απαγορευόταν αυστηρά. Οι δε νόμοι της Βρετανίας απαγορεύουν την πώληση ή την χρήση προσωπικών δεδομένων χωρίς τη συγκατάθεση των ίδιων των ατόμων. Αυτό περιλαμβάνει και τις περιπτώσεις όπου η συγκατάθεση του ατόμου παρέχεται για έναν σκοπό αλλά τα δεδομένα χρησιμοποιούνται για έναν άλλο. Κανένας από τους χρήστες δεν συμφώνησε να χρησιμοποιηθούν τα δεδομένα τους για να δημιουργηθεί ένα εργαλείο πολιτικού μάρκετινγκ ή να τοποθετηθούν σε μια τεράστια βάση δεδομένων μιας πολιτικής καμπάνιας.
Ο Κόγκαν υποστηρίζει ότι όλα όσα έκανε ήταν νόμιμα και λέει ότι είχε «στενή εργασιακή σχέση» με το Facebook, το οποίο του είχε χορηγήσει άδεια για τις εφαρμογές του. Το Facebook από την πλευρά του, αρνείται ότι έχει εμπλοκή σε παραβίαση δεδομένων. Ο αντιπρόεδρος του κοινωνικού μέσου, Πολ Γκρέγουαλ, δήλωσε σχετικά: «η προστασία των πληροφοριών των ανθρώπων βρίσκεται στο επίκεντρο όλων όσων κάνουμε και απαιτούμε το ίδιο και από ανθρώπους που χρησιμοποιούν εφαρμογές στο Facebook. Αν αυτές οι αναφορές είναι αληθείς, πρόκειται για σοβαρή κατάχρηση των κανόνων μας».
Στην πραγματικότητα πάντως οι αντιδράσεις του Facebook ήρθαν με μεγάλη καθυστέρηση. Μόλις την Παρασκευή ανακοινώθηκε ότι το Facebook αναστέλλει την Cambridge Analytica και τον Κόγκαν από την πλατφόρμα εν αναμονή πληροφοριών σχετικά με την κακή χρήση δεδομένων που σχετίζονται με την εφαρμογή της εταιρείας.
Επιπλέον το Facebook αμφισβητεί ότι η συλλογή δεκάδων εκατομμυρίων προφίλ από την Cambridge Analytica ήταν παραβίαση δεδομένων. Σε μια δήλωση, η εταιρεία αναφέρει ότι ο Κόγκαν απέκτησε πρόσβαση σε αυτές τις πληροφορίες με νόμιμο τρόπο και με μέσω των σωστών διαύλων αλλά «δεν ακολούθησε στη συνέχεια τους κανόνες μας» επειδή διέδωσε τις πληροφορίες σε τρίτους.
Πηγή Tromaktiko