Το ΜΙΤ κατεβάζει ρατσιστική βιβλιοθήκη δεδομένων

Το ΜΙΤ κατεβάζει ρατσιστική βιβλιοθήκη δεδομένων

Συντάκτης: Deasy @ 02.07.2020

Το ΜΙΤ απομάκρυνε από το διαδίκτυο ένα σετ δεδομένων το οποίο «εκπαίδευε» συστήματα τεχνητής νοημοσύνης με ρατσιστικές και μισογυνιστικές εκφράσεις, μετά από ενημέρωση που έλαβε από το βρετανικό The Register.

Το συγκεκριμένο σετ είχε δημιουργηθεί από το ίδιο το ΜΙΤ για να ενσωματωθεί σε συστήματα τεχνητής νοημοσύνης προκειμένου να ξεχωρίζουν ανθρώπους και αντικείμενα σε φωτογραφίες. Το σετ είχε βεβαίως πολλές αθώες εκφράσεις αλλά όπως αποδείχθηκε  όταν οι φωτογραφίες εμφάνιζαν γυναίκες, χρησιμοποιούνταν σεξιστικές εκφράσεις, ενώ οι δημιουργοί του dataset είχαν ενσωματώσει ρατσιστικά σχόλια όταν απεικονίζονταν άνθρωποι με καταγωγή από την Ασία ή την Αφρική.

Το ΜΙΤ ζήτησε συγγνώμη, με στελέχη του να παραδέχονται πως θα έπρεπε να είχαν δει την επίμαχη συλλογή δεδομένων και κάλεσε όλους τους ερευνητές που είχαν χρησιμοποιήσει το dataset  να το καταργήσουν από τα δικά τους συστήματα εκμάθησης. Όπως αναφέρουν οι καλοί συνάδελφοι του The Register, το dataset δημιουργήθηκε το 2008 και περιείχε 80 εκατ. εικόνες. Βεβαίως οι καλοί συνάδελφοι δεν ήταν εκείνοι που άρχισαν να σκαλίζουν τη συγκεκριμένη βιβλιοθήκη εικόνων για να βρουν προβληματικό περιεχόμενο.

Αυτό ήταν δουλειά μιας startup από την Σίλικον Βάλεϊ ονόματι UnifyID που συνεργάστηκε με την Abeba Birhane μεταπτυχιακή φοιτήτρια του Πανεπιστημιου του Δουβλίνου. Η έρευνά τους έδειξε πως στη βιβλιοθήκη υπήρχαν μερικές χιλιάδες φωτογραφίες με ετικέτες παιδοφιλικού περιεχομένου, περισσότερες από 3.000 φωτογραφίες με υποτιμητικούς χαρακτηρισμούς για τις γυναίκες και άλλες τόσες με ρατσιστικές περιγραφές.