Έχεις σίγουρα ακούσει πρωτοβουλίες για να χαρίσεις βιβλία που θα πάνε σε βιβλιοθήκες σχολείων, δήμων ή φυλακών αλλά δεν έχεις ακούσει για βιβλία που θα χρησιμοποιηθούν για να εκπαιδεύονται chatbots.
Κάποτε θα συνέβαινε και αυτό και την αρχή την έκανε το Πανεπιστήμιο Χάρβαρντ, ανακοινώνοντας ότι θα διαθέσεσι ένα σετ δεδομένων που αποτελείται από ένα εκατ. βιβλία, στα οποία δεν ισχύουν πλέον οι περιορισμοί της νομοθεσίας περί προστασίας των πνευματικών δικαιωμάτων.
Το σετ είναι πέντε φορές μεγαλύτερο από εκείνο που χρησιμοποιήθηκε για την εκπαίδευση του Llama της Meta (το οποίο για την ώρα δεν είναι διαθέσιμο στην Ευρώπη λόγω άλλων νομοθετικών περιορισμών αλλά αυτό είναι άλλη ιστορία).
Η δωρεά του Χάρβαρντ περιλαμβάνει ένα ευρύ φάσμα τίτλων από θεατρικά έργα του Σέξπιρ και διηγήματα του Ντίκενς μέχρι τον Δάντη και λεξικά διαφόρων γλωσσών ανά τον κόσμο.
Η δωρεά είναι μέρος της πρωτοβουλίας του πανεπιστημίου που ονομάζεται Institutional Data Initiative και η οποία προβλέπει τη συνεργασία του Χάρβαρντ με βιβλιοθήκες, πανεπιστήμια και κρατικές αρχές για τη διάθεση δεδομένων που θα χρησιμοποιηθούν στην τεχνητή νοημοσύνη και αλλού.
Η σχετική αναγγελία έγινε στις 12 Δεκεμβρίου σε μια σελίδα που έχει τον ωραίο τίτλο "Hello World" αν έχετε ασχοληθεί ποτέ με τον προγραμματισμό θα καταλάβατε. Αν αρχίσετε να ψάχνετε για το σετ θα απογοητευτείτε αλλά θα χρειαστεί να κάνετε λίγη υπομονή. Σύμφωνα με το Χάρβαρντ, οι πρώτες εκδόσεις θα είναι διαθέσιμες στις αρχές του 2025, οπότε αν έχεις κάποιο chatbot και θέλεις να το εκπαιδεύσεις θα πρέπει να περιμένεις μερικές εβδομάδες.