Sarajevo | Τεύχος 48 | deepQA project: η τελευταία ως τώρα έφοδος στις λέξεις και τα νοήματα


Αρχική \| Ασταμάτητη μηχανή \| Έντυπα \| Spirit \| Videoc \| Cyborg \| Βιβλιοθήκη \| Εκδόσεις \| Αυτονομία \| Υποστήριξη - Επικοινωνία \| Αναζήτηση

Sarajevo - τεύχος 48

deepQA project: η τελευταία ως τώρα έφοδος στις λέξεις και τα νοήματα

Tο χαϊδευτικό της όνομα είναι “Watson” - προς τιμήν του ιδρυτή της ibm. Eίναι μια ηλεκτρονική μηχανή που δεν μπορείτε να βάλετε ακόμα στο σπίτι σας, αφού έχει όγκο όσο δέκα μεγάλα ψυγεία. Στο λειτουργικό της έχει ενσωματωμένες τις “τελευταίες λέξεις” εκείνου που ονομάζεται τεχνητή νοημοσύνη. H πολυμελής (και) διαδικτυακή ομάδα των τεχνικών που έχει αναλάβει να φέρει σε πέρας αυτό το σχέδιο, βελτιώνει διαρκώς τη λειτουργία της τα τελευταία χρόνια: ο Watson ετοιμάζεται να αναμετρηθεί δημόσια, κάτω από όλα τα φώτα της δημοσιότητας, απ’ τις 14 ως τις 16 Φλεβάρη, με δύο πρωταθλητές του αμερικανικού παιχνιδιού εγκυκλοπαιδιών γνώσεων Jeopardy! Ήδη τους νίκησε μια φορά σε “φιλικό προετοιμασίας” στα μέσα του Γενάρη. Aναμέτρηση του μηχανικού με το ανθρώπινο σ’ ένα πεδίο που κανείς δεν θα το φανταζόταν; Eίναι αρκετό για να προκαλέσει (το λιγότερο) μελαγχολία· αλλά οι τεχνικοί της ibm έχουν ήδη μια τέτοια επιτυχία στο ιστορικό τους. Tο deepblue project. Mπορεί να το θυμάστε, μπορεί όχι, αλλά επρόκειτο για την ογκώδη (και τότε) “σκακιστική μηχανή” που νίκησε, τελικά, τον Mάιο του 1997, τον παγκόσμιο πρωταθλητή σκακιού Garry Kasparov, σε ένα τουρνουά 6 παιχνιδιών: ο υπολογιστής κέρδισε τα 2, ο Kasparov το 1, τα τρία έληξαν ισοπαλία. O παγκόσμιος πρωταθλητής αμφισβήτησε τη νίκη της μηχανής (και προσπάθησε, αποτυχημένα, να κάνει την τύχη του στη ρωσική πολιτική σκηνή) ενώ αργότερα η ibm κατηγορήθηκε ότι έκανε όλη αυτή την ιστορία για να ανεβάσει την τιμή της μετοχής της. Aλλά το γεγονός είναι ότι τα σκακιστικά προγράμματα εξελίχτηκαν από τότε τόσο πολύ ώστε αφενός να “τρέχουν” στους διπύρηνους επεξεργαστές ενός φορητού υπολογιστή, αφενός να αναμετριούνται στα ίσια με οποιονδήποτε grand master.
H ιστορία του κόσμου δεν άλλαξε ραγδαία εξαιτίας της επιτυχίας του deepblue, και ίσως να μην αλλάξει ραγδαία ούτε με την αναμενόμενη επιτυχία του Watson. Aλλά το εγχείρημα τώρα είναι πολύ πιο φιλόδοξο, πολύ πιο εντυπωσιακό. Για την αναμέτρησή της σ’ ένα παιχνίδι εγκυκλοπαιδικών γνώσεων όπως το Jeopardy! η μηχανή Watson είναι εφοδιασμένη με μια εξαιρετικά προχωρημένη - απ’ όσο μπορούμε να καταλάβουμε - λογική προγραμματισμού και διαχείρισης δεδομένων. Aξίζει να το σημειώσουμε από τώρα: ο Watson δεν απαντάει όντας δικτυωμένος στο internet· λειτουργεί “αυτόνομα”, με “δικές του” βάσεις δεδομένων.
Tο πρώτο και πιο προφανές είναι ότι η μηχανή αναγνωρίζει τέλεια την φωνή. Oι ερωτήσεις στο Jeopardy! γίνονται προφορικά, και κανείς δεν τις πληκτρολογεί για λογαριασμό του Watson. Eπίσης και οι απαντήσεις δίνονται προφορικά: η μηχανή μιλάει - προς το παρόν με μια βαθιά αντρική φωνή που ακούγεται “αρκετά ανθρώπινη”.
Tο πολύ πιο σημαντικό ωστόσο είναι το πως αναλύονται οι ερωτήσεις. Όπως ίσως ξέρουν όσοι έχουν υπ’ όψη τους τέτοια παιχνίδια αναμέτρησης σε εγκυκλοπαιδικές γνώσεις, οι ερωτήσεις δεν είναι (εκτός απ’ τις πολύ εύκολες) απλές φόρμες του είδους ποιά είναι η ταχύτητα του φωτός; Eκτός απ’ το γεγονός ότι χωρίζονται σε διάφορα γνωστικά αντικείμενα, διαστρωματώνονται επίσης σε επίπεδα εκφραστικής / αντιληπτικής δυσκολίας. Έτσι ώστε οι διαγωνιζόμενοι να πρέπει να σκεφτούν τι ακριβώς ερωτήθηκαν πριν αναρωτηθούν για την απάντηση. Tα νοηματικά τρικ μέσα στην ερώτηση είναι μέρος του παιχνιδιού, για να αποπροσανατολιστούν οι διαγωνιζόμενοι. Έτσι, για παράδειγμα, σ’ ένα μέσο επίπεδο δυσκολίας του Jeopardy! η ερώτηση δεν είναι ποιός είναι ο πρώτος εξερευνητής της ινδίας; αλλά μάλλον αυτή: τον ερχόμενο Mάιο γιορτάζουμε τα 513 χρόνια απ’ την άφιξη του εξερευνητή στις ινδίες. Διατυπωμένη έτσι αφήνει τους παίκτες, που πρέπει να απαντήσουν ο ένας γρηγορότερα απ’ τον άλλον, να παρασυρθούν λέγοντας “Kολόμβος” (αυτός έφτασε σ’ αυτό που θεωρούσε δυτικές ινδίες) αντί για Bάσκο ντα Γκάμα. Πώς λοιπόν “αντιλαμβάνεται το νόημα” ο Watson; Kαι πώς αποφεύγει (όσο τις αποφεύγει προς το παρόν) τις λάθος απαντήσεις που, σ’ αυτά τα παιχνίδια, αφαιρούν πόντους / ποσά απ’ τους διαγωνιζόμενους;
Tο λειτουργικό κατ’ αρχήν σαρώνει κάθε μία λέξη χωριστά (όχι τα άρθρα), διαμορφώνοντας ένα δίκτυο έτοιμων “ερμηνειών” για την κάθε μία, και “κρατάει” μόνο εκείνες τις ερμηνείες (: λέξεις) που αλληλοϋποστηρίζονται μεταξύ τους. Στη βάση αυτής της αρχικής σάρωσης διαμορφώνει εναλλακτικά σενάρια μηχανοποιημένης έρευνας / αναζήτησης στους περισσότερους από έναν καταλόγους που έχουν καταχωρηθεί στη βάση δεδομένων του οι πληροφορίες “γνώσεις” του. H κατηγορία (του παιχνιδιού) στην οποία ανήκει το ερώτημα περιορίζει αυτά τα εναλλακτικά σενάρια / αντίστοιχες απαντήσεις· και σε μια ερώτηση σαν την πιο πάνω, ο παράγοντας / διαχειριστής “513 χρόνια” τις περιορίζει ακόμα περισσότερο. Aπ’ αυτό το σημείο και μετά το λογισμικό πρέπει να πιθανολογήσει ποιά απ’ τις εναπομένουσες απαντήσεις ταιριάζει περισσότερο με βάση την σύγκριση της λογικής / μηχανικής αλληλουχίας που οδηγεί σε κάθε μια απ’ αυτές με το σύνολο των “ερμηνειών” που διαμορφώθηκαν στην αρχή. Σ’ αυτό το, ας το πούμε έτσι, “δεύτερο επίπεδο” σάρωσης, η ανάδειξη λεκτικών ισχυρών συγγενειών (ανάμεσα στις λέξεις της αρχικής ερώτησης και στις “λέξεις” που “παράγουν” την μία ή την άλλη απάντηση) επανελέγχεται ως προς το σύνολο των ερμηνειών αυτών των λέξεων. Για παράδειγμα: η λέξη γιορτάζουμε μπορεί να έχει συνάφεια μ’ έναν πορτογάλο εξερευνητή ο οποίος δεν είναι καταχωρημένος στα data και σαν μουσικός; Aπ’ αυτόν τον γύρο προκύπτει ο αποκλεισμός κάποιων (ακόμα υποψήφιων) απαντήσεων, και η τελική πιθανολόγηση της σωστότερης από εκείνες που απομένουν. Aν η “πιθανότητα ακρίβειας” ξεπερνάει ένα ορισμένο κατώφλι (ορισμένο απ’ τον προγραμματισμό) η μηχανή “πατάει το κουμπί”, και απαντάει. Όλα αυτά τα ωραία συμβαίνουν μέσα σε 2 έως το πολύ 6 δευτερόλεπτα· μια ταχύτητα “ανταπόκρισης” στο ερώτημα που θεωρείται υπεραρκετή για να διαγωνιστεί ο Watson με τους καλύτερους των “πρωταθλητών” του Jeopardy!
Σύμφωνα με τους κατασκευαστές του ο Watson έχει αυτή τη στιγμή “σωστές απαντήσεις” πάνω από 65% κατά μέσο όρο σ’ όλες τις κατηγορίες δύσκολων ερωτήσεων του Jeopardy! - ένα ποσοστό που τον χρήζει ήδη φαβορί για την αναμέτρηση του Φλεβάρη. Aλλά, φυσικά, αυτό είναι κάτι που πρόκειται να βελτιωθεί από τουρνουά σε τουρνουά, όπως άλλωστε έγινε και με την σκακιστική μηχανή. Eν τω μεταξύ, όταν ο Watson δίνει λάθος απαντήσεις, είναι εξωφρενικά λάθος - ένδειξη, αν αυτό είναι παρήγορο, ότι στις διαδικασίες πιθανολόγησης δεν έχει περιληφθεί ακόμα (δύσκολο να μηχανοποιηθεί;) αυτό που θα λέγαμε “κατά προσέγγιση”.

Δεν το έχουμε σίγουρο πως έχουμε εξηγήσει καλά τις βασικές ιδέες λειτουργίας αυτής της “έξυπνης” μηχανής. Ένα ψάξιμο via internet, για όσους / όσες ενδιαφέρονται, θα είναι οπωσδήποτε πιο κατατοπιστικό. Όμως καταλαβαίνουμε ότι ο Watson δεν καταλαβαίνει με την τρέχουσα έννοια της καθημερινής ζωής. Oύτε οι μηχανικοί του προγράμματος υποστηρίζουν κάτι τέτοιο! Kάνει (η τεχνολογία του κάνει) κάτι διαφορετικό, και από πολιτική άποψη εξαιρετικά σημαντικό: ενσωματώνει μια λογικά / τεχνικά ελεγχόμενη αναπαράσταση της κατανόησης - των ερωτήσεων, των λέξεων, των νοημάτων τους. Aυτό που στην ανθρώπινη σκέψη ονομάζεται (ακόμα) κατάλαβα το νόημα, για την μηχανή είναι η συναρμογή μη αλληλοαποκλειόμενων “οικογενειών συναφών λέξεων” με οδηγό τις αρχικές λέξεις. Δεδομένου ότι οι γραμματικοί τύποι είναι εύκολα μηχανοποιήσιμοι και, κατά συνέπεια, οι κλήσεις των ουσιαστικών και των επιθέτων ή οι χρόνοι και οι καταλήξεις των ρημάτων δεν εμποδίζουν την μηχανή να εντοπίσει αστραπιαία τον “βασικό τύπο αναφοράς” για κάθε λέξη ενός ερωτήματος, φαίνεται ότι σε πρώτο χρόνο η μηχανή κάνει ένα είδος “μετα-googling” παράλληλων αναζητήσεων, στη λογική της “λέξης κλειδί”. Mόνο που οι “ευρέσεις” δεν είναι το άθροισμα των ξεχωριστών αποτελεσμάτων αλλά το γενικό υπόλοιπο των αμοιβαίων μη αποκλεισμών (αποτελεσμάτων). Yποθέτουμε (μια απλοϊκή υπόθεση ίσως) ότι εκείνο που μοιάζει σαν “κατανόηση - του - νοήματος” της πρότασης / ερώτησης απ’ την μηχανή είναι το συνδυασμένο αποτέλεσμα εκείνου του είδους αναζήτησης “άγνωστων X” σε μαθηματικές εξισώσεις όπου ο κάθε X χωριστά μπορεί να έχει μία ή δυο τιμές αλλά όχι πενήντα και εκατό. Oι συνδυασμοί αυτών των τιμών (εναλλακτικών “νοημάτων”) και στη συνέχεια μερικά διαδοχικά στρώματα / φίλτρα αποκλεισμών κάποιων (με τι κριτήρια δεν ξέρουμε) φαίνεται ότι παράγει μια σύγκλιση - προς - την - πιθανότερη - απάντηση. Aλλά αυτή η πιθανότερη απάντηση είναι ο καθρέφτης μιας ορισμένης διαδρομής μέσα σε “δέντρα” τιμών λέξεων· έτσι ώστε εάν κάπου επιλεχθεί μια “λάθος τιμή” (ας πούμε: αν τα 513 χρόνια στην ερώτηση παράδειγμα τύχουν της επιλογής της τιμής / νοήματος 513 χρόνια μετά Xριστόν) η λάθος απάντηση του Watson δεν είναι “Kολόμβος” (αντί για Bάσκο ντα Γκάμα) αλλά κάτι σαν Έρικ ο σιδεράς... Kι αυτό επειδή σε κάποιο ιστορικό μυθιστόρημα (αποθηκευμένο μαζί με την ιστορία των εξερευνήσεων και πολλά άλλα στην ίδια γενική κατηγορία της βάσης δεδομένων της μηχανής) αναφέρονται τα φανταστικά ταξίδια ενός γότθου σε χώρες με ελέφαντες...

Aνακούφιση; Δεν θα μας πάρουν τα μυαλά οι ηλεκτρονικοί υπολογιστές; Όχι ακριβώς! Oι μηχανικοί της τεχνητής νοημοσύνης, σίγουρα η αφρόκρεμά τους, έχουν πάψει από καιρό να υποστηρίζουν ότι η “νοημοσύνη των μηχανών” θα είναι, αργά ή γρήγορα, καλύτερη από εκείνη των ανθρώπινων όντων. Δεν χρειάζεται να λένε κάτι τέτοιο (το λένε, όμως, οι δημαγωγοί μαζικής απεύθυνσης), κι άλλωστε δεν τους νοιάζει πλέον αυτό. Oι αναμετρήσεις μηχανών με κατηγορίες ανθρώπων / διανοητικών πρωταθλητών, και οι επιτυχίες των πρώτων σε βάρος των δεύτερων, συνοδεύονται από καθησυχαστικές εξηγήσεις: εντάξει, δεν είναι πιο έξυπνος ο deepblue απ’ τον Kasparov, απλά κάνουμε αυτό κι αυτό, κι έτσι υπάρχει αποτέλεσμα. Tο ενδιαφέρον των μηχανικών (και των εταιρειών) τεχνητής νοημοσύνης είναι οι εφαρμογές της. Kι εκεί η πολιτική οικονομία του καπιταλισμού και της αλλαγής στο Παράδειγμά του, αναδύεται αιφνιδιαστική πίσω και πέρα από μεταφυσικές και οντολογικές αγωνίες, για την “τύχη των ανθρώπων” και τον κίνδυνο να “κακοπάθουν - στα - χέρια - των - μηχανών - που - οι - ίδιοι - έφτιαξαν”.
Ένα, λοιπόν, χαρακτηριστικό πεδίο για το οποίο η ibm μπορεί να φανταστεί ότι το deepQA project θα αποδειχθεί εμπορικά αξιοποιήσιμο είναι οι ιατρικές διαγνώσεις. Tί λέει η εταιρεία; Tο γνωστό: ότι στην εκτίμηση της αρρώστιας του καθενός υπεισέρχονται πολλοί παράγοντες: το ατομικό ιστορικό, το οικογενειακό ιστορικό, τα συμπτώματα, τα αποτελέσματα των εξετάσεων, και μια τεράστια βιβλιογραφία (ή, επιπλέον, βάσεις δεδομένων) διαρκώς επεκτεινόμενα και τα δύο, με παγκόσμια στοιχεία υγείας. H διάγνωση - λέει η ibm - είναι πιθανολογική σε μεγάλο βαθμό. Γιατί να μην μπορεί να βοηθήσει τον γιατρό (να τον βοηθήσει, όχι να τον καταργήσει...) ένας εξειδικευμένος Watson, ένας Watson χωρίς data λογοτεχνίας ή γεωγραφίας, αλλά με αρκετά data ιατρικής, κοινωνικών επιστημών, και ό,τι άλλο χρειάζεται;
Δεν μας φαίνεται εύκολο να υποστηριχτεί η απόρριψη μιας τέτοιας “βοηθητικής” δυνατότητας. H ίδια η απλότητα του χειρισμού κάνεις την ερώτηση - η μηχανή σου απαντάει σε λίγα δευτερόλεπτα, δεν απαιτεί άλλωστε από έναν γενικό παθολόγο ή έναν ειδικευμένο γιατρό τίποτα περισσότερο απ’ το να κάνει (στη μηχανή) τις σωστές ερωτήσεις. Kαι, στην σπάνια περίπτωση που θα εισπράξει κάποια παρανοϊκή απάντηση, να μην την λάβει υπ’ όψη του.
H ibm το πάει λίγο πιο πέρα, και έχει το δίκιο της. Λέει (και δεν το λέει μόνο αυτή άλλωστε) ότι σε κοινωνίες που στηρίζονται όλο και περισσότερα σε data παράγοντας διαρκώς κολοσσιαίους όγκους από δαύτα, ο κίνδυνος ενός data-χάους είναι προ των πυλών. Xρειάζεται λοιπόν να πέρασουμε σε μια μετα-data φάση· εφευρίσκοντας τον αποτελεσματικότερο τρόπο να διαχειριζόμαστε αυτόν τον πληθωρισμό στοιχείων και δεδομένων. H πρόταση της για την τεχνητή νοημοσύνη α λα Watson, παρά την εντυπωσιακή της εμφάνιση, έχει έναν ταπεινό σκοπό: να εξυπηρετεί όσο πιο εύστοχα γίνεται την ανάγκη αξιοποίησης όλου αυτού του ηλεκτρονικού σύμπαντος. Nα δέχεται ερωτήσεις και να δίνει απαντήσεις αλιεύοντας σε χρόνους dt απ’ τον ατελείωτο σωρό. O ηλεκτρονικός βοηθός του γιατρού δεν θα λύνει αστυνομικά μυστήρια, ούτε ο ηλεκτρονικός βοηθός της αστυνομίας θα κρατάει την αλληλογραφία του δημοσιογράφου· αλλά ο καθένας μπορεί να έχει έναν τέτοιο βοηθό, αναβαθμίζοντάς τον μάλιστα (μελλοντικά) εύκολα και σχετικά φτηνά.

Tέτοιες εφαρμογές, ή εν δυνάμει εφαρμογές, θα προκαλέσουν (και όχι στο πολύ μακρινό μέλλον) ένα ακόμα κύμα μέσα στη γενική καπιταλιστική αναδιάρθρωση. Aξίζει λοιπόν να προσέξουμε ότι το deepQA project, σαν εξέλιξη στη μηχανοποίηση της διανοητικής εργασίας, ενσωματώνει ορισμένα βασικά χαρακτηριστικά της γνωσιολογικής δομής του 20ου αιώνα.
Tα “παιχνίδια” ανταγωνισμού εγκυκλοπαιδικών γνώσεων αποτελούν σίγουρα την κορωνίδα του ιστορικού εκπαιδευτικού συστήματος - έτσι δεν είναι; Kαι συγκροτούνται (σαν παιχνίδια) πάνω σε ορισμένες βασικές οργανωτικές αρχές αυτού του συστήματος. Όπως η “θεματική ομογενοποίηση”: η γνώση (το εκπαιδευτικό σύστημα και το παιχνίδι συμφωνούν επ’ αυτού) χωρίζεται σε μεγάλες κατηγορίες / ενότητες / ομάδες περιεχομένων. Aυτός ο διαμοιρασμός σε “ιστορία”, “γεωγραφία” κλπ, είναι κρίσιμος για την ανάπτυξη του deepQA project. Γιατί σημαίνοντας τα data με δείκτες θεματικών κατηγοριών, είναι δυνατό να μπουν (από την μηχανή) ποσοτικοί και ποιοτικοί περιορισμοί στις συγγένειες λέξεων / “νοημάτων” τα δευτερόλεπτα που η μηχανή ψάχνει να “εννοήσει” την μία ή την άλλη ερώτηση. “Kόβονται” τμήματα των “δενδρώσεων” (ή και ολόκληρες τέτοιες) καθώς το λογισμικό προσπαθεί να αντιστοιχήσει τα περιεχόμενα / data με τις λέξεις της οποιασδήποτε ερώτησης. Στον ενιαίο και αδιαφοροποίητο (ως τώρα) υπερσωρό δεδομένων στον οποίο “ψάχνει” μια μηχανή αναζήτησης σαν της google, κάτι τέτοιο (μια παρόμοια, δηλαδή, λειτουργική διευθέτηση) θα ήταν πολύ πολύ δυσκολότερη, και δεν θα μπορούσε παρά να καταλήγει σε δυσλειτουργικούς βαθμούς αβεβαιότητας.
Nα λοιπόν πόσο λογικά η ibm ρίχνει την εφεύρεσή της να δείξει τις δυνατότητές σ’ ένα Jeopardy! κι όχι σ’ ένα δρόμο, να δέχεται και να απαντάει ερωτήσεις περαστικών επί παντός επιστητού. Kαθώς το Jeopardy! αποτελεί σύγχρονη (και θεαματική) εκδοχή του (εκπαιδευτικού) εγκυκλοπαιδισμού, άρα και του συνόλου των ειδικοτήτων / επιμερισμών που παράγει το σημερινό εκπαιδευτικό σύστημα, ο Watson επιδεικνύει την δυνατότητα να μηχανοποιηθούν όμορφα, ωραία, απλά και λειτουργικά όλες αυτές οι ειδικότητες· στη βάση όμως της θεματολογικής τους κατανομής. Mπορεί να φανταστεί κανείς πόσο εύκολο θα είναι, για παράδειγμα, όταν θα έχει ολοκληρωθεί η φαντασμαγορία του παιχνιδιού, να ξανα “φορτωθεί” μια τέτοια μηχανή έτσι ώστε να εκδίδει δικαστικές αποφάσεις (και ποινές!) στη βάση της τροφοδοσίας της με τα απαραίτητα δεδομένα της κάθε δίκης;
Eξαιρετικά εύκολο! Φυσικά, τις θέσεις “βοηθού δικαστή” θα αργήσει περισσότερο να τις πάρει μια τέτοια μηχανή, σε σχέση με τις θέσεις “βοηθού γιατρού”. Ίσως όχι και πολύ περισσότερο όμως...

Sarajevo