Ένα βίντεο δημοσίευσε μια εταιρεία ρομποτικής που δείχνει ένα ανθρωποειδές ρομπότ να φτιάχνει ένα φλιτζάνι καφέ, έχοντας πρώτα δει ανθρώπους να το κάνουν. Μάλιστα, διορθώνει τα λάθη του σε πραγματικό χρόνο. Το μοντέλο της «Figure.ai», που ονομάζεται «Figure 01», παίρνει μια κάψουλα καφέ, την βάζει σε μια μηχανή καφέ, κλείνει το καπάκι και ανάβει τη μηχανή. Η Figure έχει υπογράψει μια εμπορική συμφωνία με τη BMW, στο πλαίσιο της οποίας θα παρέχει τα ανθρωποειδή ρομπότ της στην παραγωγή αυτοκινήτων.

Επί του παρόντος, η ρομποτική που τροφοδοτείται από τεχνητή νοημοσύνη (AI) είναι ειδικού σκοπού, κάτι που σημαίνει ότι αυτά τα μηχανήματα κάνουν ένα πράγμα καλά αντί να κάνουν τα πάντα επαρκώς. Ξεκινούν με μια προγραμματισμένη βασική γραμμή κανόνων και ένα σύνολο δεδομένων που χρησιμοποιείται για αυτοδιδασκαλία. Η «Figure.ai» ισχυρίζεται ότι το «Figure 01» έμαθε τη διαδικασία, παρακολουθώντας μόνο πλάνα διάρκειας δέκα ωρών.

Για να φτάσει ένα ρομπότ να φτιάχνει καφέ ή να κουρεύει το γκαζόν, θα σήμαινε ότι θα υπήρχε ενσωμάτωση της τεχνογνωσίας σε πολλούς τομείς. Όμως, είναι πολύ δύσκολο να προγραμματιστούν κατά αυτόν τον τρόπο. 

Θα πρέπει να προβλεφθούν και να κωδικοποιηθούν στο λογισμικό του κανόνες για κάθε ενδεχόμενο. Για παράδειγμα, συγκεκριμένες οδηγίες για το τι πρέπει να κάνει το ρομπότ όταν φτάσει στο τέλος του γκαζόν. Η απόκτηση τεχνογνωσίας σε πολλούς τομείς μόνο με την παρακολούθηση εικόνων θα σηματοδοτούσε ένα σημαντικό άλμα.

Το πρώτο κομμάτι του παζλ είναι ότι το Figure 01 πρέπει να δει αυτό που υποτίθεται ότι θα επαναλαμβάνει. «Η οπτική επεξεργασία πληροφοριών του επιτρέπει να αναγνωρίζει σημαντικά βήματα και λεπτομέρειες στη διαδικασία», δήλωσε στο Live Science ο Max Maybury, επιχειρηματίας AI και συνιδιοκτήτης του AI Product Reviews.

Το ρομπότ θα πρέπει να λάβει δεδομένα βίντεο και να αναπτύξει ένα εσωτερικό μοντέλο πρόβλεψης των φυσικών ενεργειών και της σειράς αυτών των ενεργειών, δήλωσε στο Live Science ο Christoph Cemper, Διευθύνων Σύμβουλος της AIPRM, ενός ιστότοπου που σχεδιάζει prompts για εισαγωγή σε συστήματα τεχνητής νοημοσύνης, όπως το ChatGPT.

Όπως εξήγησε, για να καταλάβει ένα ρομπότ πώς να εκτελέσει μια εργασία, πρέπει πρώτα να κατανοήσει τι συμβαίνει. Μόλις το καταλάβει, θα πρέπει να μεταφράσει αυτό που βλέπει,  και να σχεδιάσει έναν τρόπο για να εκτελέσει την εργασία, δηλαδή να δημιουργήσει ένα πρόγραμμα που θα καθορίζει πώς να κινεί τα άκρα και τις λαβές του για να κάνει τις ίδιες κινήσεις, πρόσθεσε.

Έπειτα, υπάρχει η αρχιτεκτονική των νευρωνικών δικτύων, είπε η Clare Walsh, εμπειρογνώμονας ανάλυσης δεδομένων και τεχνητής νοημοσύνης στο Ινστιτούτο Analytics στη Βρετανία. Πρόκειται για ένα είδος μοντέλου μηχανικής μάθησης εμπνευσμένο από τον τρόπο λειτουργίας του εγκεφάλου. Μεγάλος αριθμός διασυνδεδεμένων μεμονωμένων νευρώνων συνδέονται για να δημιουργήσουν ένα σήμα. Εάν επιτευχθεί το επιθυμητό αποτέλεσμα, όταν τα σήματα οδηγούν σε μια ενέργεια, η ανατροφοδότηση ενισχύει τις νευρικές συνδέσεις που το πέτυχαν, ενσωματώνοντάς το περαιτέρω σε γνωστές διαδικασίες.