Τι είναι το “12 Days of OpenAI”;
Αποτελεί μια πρωτοβουλία της OpenAI που ξεκίνησε για πρώτη φορά φέτος το 2024. Πρόκειται για ένα 12ήμερο πρόγραμμα ανακοινώσεων, εκδηλώσεων και κυκλοφοριών που πραγματοποιείται τον Δεκέμβριο, ακριβώς πριν από τις γιορτές των Χριστουγέννων.
Στόχος είναι να παρουσιάσει νέες τεχνολογίες, ενημερώσεις προϊόντων και ερευνητικές εξελίξεις της OpenAI.
Τι έκανε η OpenAI την τελευταία μέρα του «12 Days of OpenAI»;
Η OpenAI ανακοίνωσε το νέο της μοντέλο AGI, το o3, στις 20 Δεκεμβρίου 2024, κατά την τελευταία ημέρα της πρωτοβουλίας «12 Days of OpenAI».
Σύμφωνα με τον διευθύνοντα σύμβουλο, Σαμ Άλτμαν, η εταιρεία σχεδιάζει να διαθέσει το o3 mini μέχρι το τέλος Ιανουαρίου 2025, ενώ το πλήρες μοντέλο o3 αναμένεται να κυκλοφορήσει δημόσια έως τα τέλη Μαρτίου 2025.
Αυτές οι ημερομηνίες υποδηλώνουν ότι η OpenAI προγραμματίζει μια σταδιακή διάθεση του νέουν μοντέλου της, ξεκινώντας με το o3 mini και ακολουθώντας με το πλήρες o3, προκειμένου να διασφαλίσει την ομαλή ενσωμάτωσή τους και την αποτελεσματική αξιολόγηση της απόδοσής τους. Αυτές τις μέρες το ο3 περνά την αξιολόγηση απόδοσης και λογικό είναι περιμένουμε στις αρχές του Γενάρη του 2025 να δημοσιευτεί.
Τι είναι το AGI όπως το ο3 της OpenAI και τι διαφορές έχει με ένα ΑΙ σαν το Chat GPT 4 που οι περισσότεροι, λίγο ως πολύ, γνωρίζουμε;
Το o3 AGI της OpenAI διαφοροποιείται από το ChatGPT-4 και τα κλασικά AI σε αρκετές βασικές διαστάσεις, οι οποίες αφορούν τις δυνατότητές του, τον τρόπο λειτουργίας και την προσέγγισή του στη μάθηση και την επίλυση προβλημάτων. Ας δούμε λοιπόν μερικές λεπτομέρειες με παραδείγματα για να κατανοήσει και το ευρύ κοινό τις διαφορές.
Δυνατότητα Γενίκευσης (Generalization)
ChatGPT-4 όπως και άλλα «κλασικά» AI, εκπαιδεύονται σε τεράστιο όγκο δεδομένων και αποδίδουν καλά σε εργασίες που σχετίζονται με αυτά τα δεδομένα. Ωστόσο, δυσκολεύονται να αντιμετωπίσουν άγνωστες ή εντελώς νέες καταστάσεις.
Παράδειγμα: Ένα κλασικό AI μπορεί να αναγνωρίσει και να διακρίνει αντικείμενα ή έμβια όντα σε εικόνες (π.χ., ”Αυτός είναι ένας σκύλος”) επειδή έχει «δει» χιλιάδες εικόνες σκύλων κατά την εκπαίδευσή του.
Το o3 AGI: Σχεδιάστηκε για να επιλύει προβλήματα που δεν έχει δει ποτέ πριν, χρησιμοποιώντας γενική λογική και προσαρμοστικότητα.
Παράδειγμα: Εάν του δώσουμε έναν γρίφο με ασυνήθιστα σχήματα που δεν υπάρχουν στη βάση δεδομένων του, το o3 μπορεί να βρει τη λύση αναλύοντας τις σχέσεις μεταξύ των σχημάτων, ακόμα κι αν δεν έχει ξαναδεί κάτι παρόμοιο.
Αυτονομία και Προσαρμοστικότητα
ChatGPT-4 και Κλασικά AI: Χρειάζονται σαφείς εντολές και συνήθως εκτελούν μία εργασία τη φορά. Αν συναντήσουν κάτι εκτός της εξειδίκευσής τους, αποτυγχάνουν ή ζητούν περισσότερες πληροφορίες.
Παράδειγμα: Το ChatGPT-4 μπορεί να απαντήσει σε μια ερώτηση για τη φυσική, αλλά δεν μπορεί να σχεδιάσει μόνο του ένα νέο πείραμα αν δεν έχει τα απαραίτητα δεδομένα ή οδηγίες.
o3 AGI: Μπορεί να παίρνει αποφάσεις αυτόνομα και να προσαρμόζει τις ενέργειές του στις συνθήκες, ακόμα και αν αυτές αλλάξουν δραστικά.
Παράδειγμα: Εάν του ζητηθεί να σχεδιάσει έναν πύραυλο, αλλά στη μέση της διαδικασίας προκύψει ένας νέος περιορισμός (π.χ., χαμηλότερος προϋπολογισμός), το o3 θα προσαρμόσει το σχέδιό του χωρίς ανθρώπινη παρέμβαση.
Κατανόηση Συμφραζομένων και Αφαίρεση
ChatGPT-4 και Κλασικά AI: Χρειάζονται σαφή συμφραζόμενα για να λειτουργήσουν σωστά. Δεν έχουν την ικανότητα να κατανοούν αφηρημένες έννοιες χωρίς πρόσθετη καθοδήγηση.
Παράδειγμα: Εάν ρωτήσετε το ChatGPT-4, ”Ποιο είναι το νόημα της ζωής;”, πιθανότατα θα δώσει μια γενική απάντηση βασισμένη σε γνωστές ιδέες, αλλά δεν θα μπορεί να συνδυάσει εντελώς νέες πληροφορίες για να δημιουργήσει μια βαθύτερη κατανόηση.
o3 AGI: Μπορεί να εξάγει αφαίρεση και να κατανοήσει βαθύτερες έννοιες, ακόμα και αν τα δεδομένα είναι περιορισμένα.
Παράδειγμα: Εάν του ζητηθεί να δημιουργήσει μια νέα φιλοσοφική θεωρία βασισμένη σε ασυνήθιστα δεδομένα, το o3 μπορεί να παράγει μια λογική, συνεκτική απάντηση.
Εκμάθηση από Εμπειρία (Few-shot και Zero-shot Learning)
ChatGPT-4 και Κλασικά AI: Χρειάζονται εκτεταμένη εκπαίδευση για να μάθουν νέες δεξιότητες. Δεν είναι τόσο καλοί στο “zero-shot learning” (όταν τους δίνεται μια νέα εργασία χωρίς εκπαίδευση) ή “few-shot learning” (όταν τους δίνονται μόνο λίγα παραδείγματα).
Παράδειγμα: Ένα κλασικό AI που μαθαίνει να παίζει σκάκι χρειάζεται εκατομμύρια παρτίδες για να βελτιωθεί.
o3 AGI: Μπορεί να μαθαίνει σχεδόν αμέσως από λίγα δεδομένα ή και χωρίς καθόλου προηγούμενη εμπειρία.
Παράδειγμα: Αν του δείξετε μόνο δύο κινήσεις ενός παιχνιδιού που δεν έχει ξαναδεί, το o3 μπορεί να κατανοήσει τους κανόνες και να αρχίσει να παίζει ανταγωνιστικά.
Αυτοδιόρθωση και Στρατηγική Σκέψη
ChatGPT-4 και Κλασικά AI: Δεν έχουν την ικανότητα να αυτοδιορθώνονται συστηματικά ή να αλλάζουν στρατηγική χωρίς εξωτερική καθοδήγηση.
Παράδειγμα: Αν το ChatGPT-4 κάνει λάθος σε έναν υπολογισμό, δεν έχει κάποιο εσωτερικό μηχανισμό για να το εντοπίσει και να το διορθώσει από μόνο του.
o3 AGI: Εντοπίζει τα λάθη του, αξιολογεί τις πιθανές αιτίες και αλλάζει προσέγγιση για να τα διορθώσει.
Παράδειγμα: Αν γράφει ένα πρόγραμμα και βρει ένα σφάλμα, το o3 μπορεί να το εντοπίσει, να το διορθώσει, και να βελτιστοποιήσει τον κώδικα χωρίς εξωτερική παρέμβαση.
Και αφού παραθέσαμε κάποια πιο κατανοητά παραδείγματα ας περάσουμε στο γενικό πλαίσιο διαφορών ενός AI όπως το Chat GPT 4 και του νέου ο3 AGI
Βασικές διαφορές ΑΙ και AGI
Επίπεδο Νοημοσύνης
Ένα AI όπως το ChatGPT (GPT-4), είναι ένα σύστημα τεχνητής νοημοσύνης εξειδικευμένο σε συγκεκριμένες εργασίες, όπως η επεξεργασία κειμένων και η παραγωγή κειμένων. Αν και μπορεί να επιτελεί πολλές διαφορετικές εργασίες, βασίζεται σε δεδομένα εκπαίδευσης που έχουν περιορισμούς και δεν διαθέτει συνείδηση ή αυτονομία. Δεν μπορεί να αντιληφθεί ή να κατανοήσει το περιβάλλον με τον ίδιο τρόπο που το κάνει ο άνθρωπος.
AGI: Σκοπός του AGI είναι να δημιουργήσει μια γενική νοημοσύνη που θα είναι ικανή να κατανοεί και να εκτελεί οποιοδήποτε τύπο έργου, όπως κάνει ο άνθρωπος. Αυτό σημαίνει ότι το AGI θα έχει την ικανότητα να μαθαίνει και να προσαρμόζεται σε νέες καταστάσεις με τρόπο πιο ευέλικτο και αυτονομημένο από τα υπάρχοντα συστήματα AI.
Μάθηση και Προσαρμογή
Το ΑΙ χρησιμοποιεί εκπαίδευση σε δεδομένα και μπορεί να απαντά σε ερωτήσεις, να δημιουργεί κείμενα και να εκτελεί άλλες καθορισμένες εργασίες. Δεν έχει τη δυνατότητα να μάθει συνεχώς από το περιβάλλον ή να εξελιχθεί με τον ίδιο τρόπο που το κάνει ο άνθρωπος. Είναι ένα στατικό μοντέλο.
Το AGI αναμένεται να έχει δυνατότητες συνεχούς μάθησης και προσαρμογής. Θα μπορεί να εξελίσσεται από τις εμπειρίες του και να επεκτείνει τις ικανότητές του πέρα από τα προκαθορισμένα δεδομένα. Δηλαδή, το ARC AGI θα είναι πιο κοντά στην ανθρώπινη μάθηση.
Αυτονομία
Ένα ΑΙ λειτουργεί κυρίως βάσει των εισόδων που του δίνονται και παράγει εξόδους χωρίς να έχει πραγματική κατανόηση του κόσμου ή των καταστάσεων. Είναι ένα εργαλείο που εξαρτάται πλήρως από την ανθρώπινη καθοδήγηση.
Το AGI, αν εξελιχθεί σύμφωνα με της στόχους του έργου, θα είναι πιο αυτόνομο. Αυτό σημαίνει ότι θα μπορεί να αναλαμβάνει πρωτοβουλίες, να θέτει στόχους και να εκτελεί εργασίες χωρίς ανθρώπινη παρέμβαση, κάτι που το καθιστά πιο κοντά στην έννοια της γενικής νοημοσύνης.
Εφαρμογές και Πεδίο Χρήσης
Το ΑΙ χρησιμοποιείται για συγκεκριμένες εφαρμογές όπως η δημιουργία κειμένων, η εξυπηρέτηση πελατών, η ανάλυση δεδομένων και η βοήθεια με προγραμματισμό, αλλά πάντα με περιορισμούς σε ό,τι αφορά τις πιο περίπλοκες ή απρόβλεπτες καταστάσεις.
Το AGI αναμένεται να μπορεί να εφαρμοστεί σε πολύ ευρύτερο φάσμα εργασιών, όπως η έρευνα, η δημιουργία στρατηγικών, η λήψη αποφάσεων σε περίπλοκες καταστάσεις και άλλες εργασίες που απαιτούν ευφυΐα γενικού τύπου.
Σκοπός και Αντικείμενο
Ένα ΑΙ εστιάζει στην επεξεργασία γλώσσας και στην ικανότητα να παρέχει πληροφορίες, να συμμετέχει σε συζητήσεις και να εκτελεί καθορισμένα καθήκοντα.
Το AGI στοχεύει στη δημιουργία μιας τεχνητής νοημοσύνης που να μοιάζει περισσότερο με την ανθρώπινη νοημοσύνη και να μπορεί να εκτελεί οποιαδήποτε εργασία με την ίδια ευχέρεια που το κάνει ένα ανθρώπινο μυαλό.
Καταλαβαίνουμε λοιπόν πως ένα ΑΙ, όπως το GPT-4, αποτελεί ένα ισχυρό εργαλείο τεχνητής νοημοσύνης που εκτελεί συγκεκριμένες εργασίες πολύ καλά, από την άλλη όμως το AGI, όπως το ο3 που ανακοίνωσε η OpenAI πριν λίγες μέρες, προσπαθεί να φτάσει ένα επόμενο επίπεδο νοημοσύνης που δεν περιορίζεται σε συγκεκριμένα καθήκοντα, αλλά μπορεί να αντιλαμβάνεται και να εξελίσσεται σε μια ευρύτερη γκάμα περιβαλλόντων και καταστάσεων.
Τι έκανε λοιπόν το νέο ο3 AGI στα δοκιμαστικά τεστ;
Πρώτα απ’ όλα να εξηγήσουμε για να γίνουμε κατανοητοί τι σημαίνει ο όρος benchmark στην τεχνητή νοημοσύνη (AI) και συγκεκριμένα στο πλαίσιο του ARC της OpenAI. βασικά ο όρος αναφέρεται σε μια μέθοδο μέτρησης ή δοκιμασία απόδοσης που χρησιμοποιείται για να αξιολογηθεί η ικανότητα ενός μοντέλου AI να εκτελεί συγκεκριμένα καθήκοντα ή να επιτυγχάνει ορισμένους στόχους.
Τι είναι το ARC Benchmark;
Το ARC (Αutonomous Research Competency) είναι ένα σύνολο δοκιμασιών ή benchmarks που έχει δημιουργηθεί από την OpenAI για να μετρήσει την πρόοδο προς την ανάπτυξη μιας Τεχνητής Γενικής Νοημοσύνης (AGI). Συγκεκριμένα, το ARC αναφέρεται σε μια σειρά από προβλήματα και αποστολές που απαιτούν από τη μηχανή να κατανοήσει και να λύσει καταστάσεις που ενδέχεται να περιλαμβάνουν πολύπλοκες λογικές, στρατηγικές και συνδυασμούς γνώσης.
Το νέο σύστημα AGI της OpenAI, γνωστό ως o3, σημείωσε σημαντική πρόοδο στο ARC-AGI benchmark, το οποίο αξιολογεί την ικανότητα ενός AI να προσαρμόζεται σε νέες, άγνωστες εργασίες. Συγκεκριμένα πέτυχε σκορ 75,7% υπό κανονικές συνθήκες υπολογιστικής ισχύος και 87,5% με αυξημένη υπολογιστική ισχύ, ξεπερνώντας προηγούμενα AI μοντέλα και φτάνοντας σε επίπεδα απόδοσης συγκρίσιμα με τον μέσο άνθρωπο, ο οποίος επιτυγχάνει περίπου 85% σε αυτό το τεστ. Ανατριχιαστικά αποτελέσματα, έτσι δεν είναι; Μα φυσικά και είναι!
Ας προσπαθήσουμε να διερευνήσουμε τώρα τις νέες δυνατότητες που φέρνει το νέο μοντέλο AGI, ο3 της OpenAI αλλά να ιχνηλατήσουμε και τους περιορισμούς
Αρχιτεκτονική: Το o3 βασίζεται σε πιο εξελιγμένα μοντέλα υπολογιστικής λογικής, που του επιτρέπουν να μιμείται τις ανθρώπινες γνωστικές διαδικασίες.
Εκπαίδευση: Το o3 χρησιμοποιεί τεχνικές όπως meta-learning (εκμάθηση πώς να μαθαίνει) και reinforcement learning (μάθηση με ενίσχυση), προσανατολισμένες σε γενικές και όχι ειδικές εργασίες.
Διαχείριση Πόρων: Ενσωματώνει πιο προηγμένους αλγόριθμους που του επιτρέπουν να προσαρμόζει την κατανάλωση υπολογιστικών πόρων ανάλογα με τις ανάγκες της στιγμής.
Η απόδοσή του εξαρτάται ακόμα από τη διαθεσιμότητα ποιοτικών δεδομένων.
Η αυτονομία του μπορεί να προκαλέσει ανεπιθύμητα αποτελέσματα αν δεν ελέγχεται σωστά.
Η κατανόηση ορισμένων πολύπλοκων ή φιλοσοφικών εννοιών εξακολουθεί να περιορίζεται από την υπολογιστική λογική και όχι την ανθρώπινη εμπειρία.
Και με αυτά κι αυτά, κάπου εδώ πρέπει να βάλουμε τίτλους τέλους ή αυτό ήταν απλά η αρχή;
Κατέστη πλέον σαφές (ευχόμαστε) πως το o3 AGI αποτελεί κοσμογονία -σημείο καμπής- προς την κατεύθυνση της τεχνητής γενικής(γενικευμένης) νοημοσύνης (Artificial General Intelligence), διακρινόμενο από την ικανότητα γενίκευσης, την προσαρμοστικότητα και την αυτονομία του σε σχέση με τα «κλασικά»(sic) ΑΙ. Αντίθετα, μοντέλα όπως το ChatGPT-4 παραμένουν ισχυρά εργαλεία για συγκεκριμένες εφαρμογές, αλλά δεν έχουν την ίδια ευελιξία ή τη δυνατότητα να λειτουργούν σαν ένας γενικός, πολυδιάστατος νους.
Ο λόγος που γράφτηκαν όλα αυτά - κουραστικά για πολλούς- είναι πως πρέπει οι κοινωνίες να ενημερωθούν για όλη αυτή την επανάσταση στη τεχνολογία η οποία δεν αποτελεί μια απλή τεχνολογική εξέλιξη όπως πολλοί αντιλαμβάνονται ή βολεύονται να ισχυρίζονται -στηριζόμενοι στην άγνοια του μέσου ανθρώπου, αλλά μια νέα κοσμογονία που φτάνει (ή ξεπερνά) τον κόσμο που περιέγραψε ο Όργουελ στο 1984.
Ήδη από χθες -οι αργόσυρτες κρατικές δομές, κοινωνικοί φορείς, συντεταγμένες δομές αλλά και οι κοινωνίες- πρέπει να ανοίξουν μια δημόσια διαβούλευση, ένα διάλογο που θα θέτει τα όρια και το πλαίσιο λειτουργίας όλων αυτών των εργαλείων και να μην μένουν παρατηρητές απέναντι στην νέα εποχή της Τεχνητής Νοημοσύνης. Σήμερα 4 με 5 παγκόσμιοι τεχνολογικοί κολοσσοί εξελίσσουν, θέτουν τους κανόνες και τα όρια, κατά το δοκούν, στην Τεχνητή Νοημοσύνη, ανεξέλεγκτοι.
Η άγνοια των κοινωνιών απέναντι σε αυτό που συμβαίνει έχει δυο δρόμους: Είτε τη δαιμονοποίηση αυτών των επιτευγμάτων, είτε τη λατρευτική τους αποθέωση. Η γνώση από την άλλη οδηγεί στην «απομάγευσή» τους, στη σωστή κριτική και στη δημιουργία, εντέλει, του κανονιστικού πλαισίου και των ορίων λειτουργίας αυτής της -σε λίγο καιρό- υπεράνθρωπης Τεχνητής Νοημοσύνης.