Στα χρόνια από την κυκλοφορία του ChatGPT στα τέλη του 2022, ήταν δύσκολο να μην σαρωθεί σε συναισθήματα ευφορίας ή να φοβόμαστε για τις επικλινές επιπτώσεις του γενετικού AI. Αυτή η αντίδραση έχει τροφοδοτηθεί, εν μέρει, από τις σίγουρες δηλώσεις των τεχνολογικών διευθύνοντων συμβούλων, οι οποίοι έχουν περάσει προς την ολοένα και πιο βομβιστική ρητορική.
“Το AI αρχίζει να βελτιώνεται από τους ανθρώπους σχεδόν σε όλα τα πνευματικά καθήκοντα”, πρόσφατα ο ανθρωποπαθής CEO Dario Amodei Είπε στον Άντερσον Κούπερ. Πρόσθεσε ότι το ήμισυ των θέσεων εργασίας λευκού κολάρου εισόδου μπορεί να “εξαλειφθεί” το επόμενο έως πέντε χρόνια, δημιουργώντας επίπεδα ανεργίας έως και 20%-μια κορυφή που παρατηρήθηκε τελευταία κατά τη διάρκεια της Μεγάλης Ύφεσης.
Εν τω μεταξύ, ο Sam Altman του OpenAI δήλωσε ότι ο AI μπορεί τώρα να ανταγωνιστεί τις ικανότητες ενός αναζητητή εργασίας με διδακτορικό, οδηγώντας μία δημοσίευση για να ρωτήσει φαινομενικά, «Λοιπόν, τι μένει για βαθμούς;«
Να μην ξεπεράσει, ο Mark Zuckerberg ισχυριζόμενος Αυτή η εποπτεία είναι “τώρα στο βλέμμα”. (Οι μέτοχοί του ελπίζουν ότι έχει δίκιο, όπως είναι Σύμφωνα με πληροφορίες Πακέτα αποζημίωσης αξίας έως 300 εκατομμυρίων δολαρίων για να δελεάσουν το κορυφαίο ταλέντο AI σε Meta.)
Αλλά τότε, πριν από δύο εβδομάδες, ο Openai κυκλοφόρησε τελικά το πολυαναμενόμενο του GPT-5ένα μεγάλο γλωσσικό μοντέλο που πολλοί ήλπιζαν να προσφέρουν άλματα σε δυνατότητες, συγκρίσιμα με τις εξελίξεις που εισήχθησαν από τις προηγούμενες μεγάλες κυκλοφορίες, όπως οι GPT-3 και GPT-4. Αλλά το προκύπτον προϊόν φαινόταν να είναι εντάξει.
Το GPT-5 ήταν οριακά καλύτερο από τα προηγούμενα μοντέλα σε ορισμένες περιπτώσεις χρήσης, αλλά χειρότερα σε άλλους. Είχε κάποιες ωραίες ενημερώσεις χρηστικότητας, αλλά άλλοι που κάποιοι βρήκαν ενοχλητικές. (Μέσα σε λίγες μέρες, περισσότεροι από 4.000 χρήστες chatgpt υπέγραψαν ένα change.org Αναφορά ζητώντας από το OpenAI να κάνει το προηγούμενο μοντέλο τους, το GPT-4O, διαθέσιμο και πάλι, καθώς το προτιμούσαν στη νέα έκδοση.) Ένας πρώτος κριτικός του YouTube κατέληξε στο συμπέρασμα ότι το GPT-5 ήταν ένα προϊόν που “ήταν δύσκολο να διαμαρτυρηθεί”, το οποίο είναι το είδος που θα λέγατε για το iPhone 16, όχι μια τεχνολογία που καθορίζει την γενιά. Ο σχολιαστής του AI Gary Marcus, ο οποίος είχε προβλέψει αυτό το αποτέλεσμα εδώ και χρόνια, συνόψισε τις πρώτες του εντυπώσεις συνοπτικά όταν Κάλεσε GPT-5 “καθυστερημένη, υπερβολική και υποτονική.”
Όλα αυτά δείχνουν ένα κρίσιμο ερώτημα που, μέχρι πρόσφατα, λίγοι θα είχαν εξετάσει: Είναι πιθανό ότι το AI που χρησιμοποιούμε σήμερα είναι βασικά τόσο καλό όσο θα είναι για λίγο;
Στο πιο πρόσφατο άρθρο μου για το The New Yorkerπου βγήκε την περασμένη εβδομάδα, προσπάθησα να απαντήσω σε αυτήν την ερώτηση. Με αυτόν τον τρόπο, κατέληξα να αναφέρω μια τεχνική αφήγηση που δεν είναι ευρέως κατανοητή εκτός της κοινότητας AI. Η σημαντική απόδοση των μοντέλων γλωσσών GPT-3 και GPT-4 οφείλεται σε βελτιώσεις σε μια διαδικασία που ονομάζεται προ-και να γίνει ένα μοντέλο χωνεύει ένα εκπληκτικά μεγάλο κείμενο, διδάσκοντας αποτελεσματικά τον εαυτό του για να γίνει πιο έξυπνη. Και οι δύο επιτυχημένες βελτιώσεις των μοντέλων προκλήθηκαν από την αύξηση του μεγέθους τους καθώς και από το ποσό του κειμένου στο οποίο προαναφέρθηκαν.
Σε κάποιο σημείο μετά την απελευθέρωση της GPT-4, ωστόσο, οι εταιρείες AI άρχισαν να συνειδητοποιούν ότι αυτή η προσέγγιση δεν ήταν πλέον τόσο αποτελεσματική όσο ήταν κάποτε. Συνέχισαν να αυξάνουν το μέγεθος του μοντέλου και την ένταση εκπαίδευσης, αλλά είδαν μειωμένες αποδόσεις στα κέρδη ικανότητας.
Απαντώντας, ξεκινώντας από το περασμένο φθινόπωρο, αυτές οι εταιρείες στράφηκαν στην προσοχή τους στις τεχνικές μετά την κατάρτιση, μια μορφή εκπαίδευσης που παίρνει ένα μοντέλο που έχει ήδη προκαθοριστεί και στη συνέχεια το βελτιώνει για να κάνει καλύτερα σε συγκεκριμένους τύπους καθηκόντων. Αυτό επέτρεψε στις εταιρείες AI να συνεχίσουν να αναφέρουν την πρόοδο των δυνατοτήτων των προϊόντων τους, αλλά αυτές οι νέες βελτιώσεις ήταν τώρα πολύ πιο επικεντρωμένες από πριν.
Δείτε πώς εξήγησα αυτήν τη μετατόπιση στο άρθρο μου:
“Μια χρήσιμη μεταφορά εδώ είναι ένα αυτοκίνητο.
Το αποτέλεσμα ήταν μια συγκεχυμένη σειρά από ανυποχώρητα ονομασμένα μοντέλα-O1, O3-Mini, O3-Mini-High, -4-Mini-high-καθένα με εξειδικευμένες αναβαθμίσεις μετά την κατάρτιση. Αυτά τα μοντέλα κατείχαν ευρέως δημοσιευμένες αυξήσεις σε συγκεκριμένα σημεία αναφοράς, αλλά όχι πλέον τα μεγάλα άλματα στις πρακτικές δυνατότητες που κάποτε αναμενόταν. “Δεν ακούω πολλές εταιρείες που χρησιμοποιούν το AI λέγοντας ότι τα μοντέλα 2025 είναι πολύ πιο χρήσιμα για αυτά από 2024 μοντέλα, παρόλο που τα μοντέλα 2025 αποδίδουν καλύτερα σε σημεία αναφοράς”, μου είπε ο Gary Marcus.
Η προσέγγιση μετά την κατάρτιση, φαίνεται, μπορεί να οδηγήσει σε σταδιακά καλύτερα προϊόντα, αλλά όχι στα συνεχιζόμενα μεγάλα άλματα στην ικανότητα που θα ήταν απαραίτητο για την εκπλήρωση των πιο περίεργων προβλέψεων του CEO της τεχνολογίας.
Κανένα από αυτά, φυσικά, δεν σημαίνει ότι τα γενετικά εργαλεία AI είναι άχρηστα. Μπορούν να είναι πολύ δροσεροί, ειδικά όταν χρησιμοποιούνται για να βοηθήσουν στον προγραμματισμό υπολογιστών (αν και ίσως όχι τόσο πολύ όπως κάποιοι σκέπτονται) ή να διεξάγουν έξυπνες αναζητήσεις ή στην εξουσία προσαρμοσμένα εργαλεία για την κατανόηση μεγάλων ποσοτήτων κειμένου. Αλλά αυτό ζωγραφίζει μια πολύ διαφορετική εικόνα από αυτή στην οποία το AI είναι “καλύτερο από τους ανθρώπους σε σχεδόν όλα τα πνευματικά καθήκοντα”.
Για περισσότερες λεπτομέρειες σχετικά με αυτήν την αφήγηση, συμπεριλαμβανομένης μιας συγκεκριμένης πρόβλεψης για το τι να περιμένει πραγματικά από αυτήν την τεχνολογία στο εγγύς μέλλον, Διαβάστε το πλήρες άρθρο. Εν τω μεταξύ, νομίζω ότι είναι ασφαλές, τουλάχιστον προς το παρόν, να απομακρύνετε την προσοχή σας από τους ολοένα και πιο υπερβολικούς ισχυρισμούς των Tech Titans και να επικεντρωθείτε σε πράγματα που έχουν μεγαλύτερη σημασία στη ζωή σας.