Skip to content Skip to sidebar Skip to footer

Η τεχνητή νοημοσύνη (AI) κυκλοφορεί πολλά χρόνια σαν έννοια, αλλά μόλις τα τελευταία έχουν επιτευχθεί τεράστια βήματα στην ανάπτυξη και εξέλιξη, εργαλείων και λογισμικών. Αυτή η ανάπτυξη γίνεται και με ένα τρόπο που δίνει τη δυνατότητα σε πολλούς να τη χρησιμοποιήσουν για πειραματισμό, για παιχνίδι ή και για τις εργασίες που θέλουν να επιτελέσουν. Η πιο γνωστή υλοποίηση, επειδή είναι και ανοικτή η χρήση του είναι το ChatGPT, αλλά ένας πρόσθετος και ίσως και πιο σημαντικός λόγος, είναι η ευκολία χρήσης και η ποιότητα των αποτελεσμάτων που γυρίζει. Ήδη βασισμένο στο API του GPT μπορούν να χτιστούν εφαρμογές και να ανοίξει η χρήση του και να βελτιωθούν και στην πάροδο του χρόνου και τα αποτελέσματα που γυρίζει. Υπάρχουν παράλληλα και λιγότερο γνωστά στο ευρύτερο κοινό λογισμικά και τεχνολογίες οι οποίες παράγουν πέρα από κείμενο και ήχους, εικόνες και βίντεο, ή άλλες που μεταφράζουν πληροφορίες από μια μορφή σε μια άλλη. Για παράδειγμα από μια φωτογραφία μπορεί να παραχθεί η περιγραφή της, από ένα κείμενο, ήχος που θα αναπαριστά την προσφώνησή του κοκ.

Ένα τέτοιο μοντέλο το οποίο αυτό το διάστημα τυχαίνει ιδιαίτερης προσοχής, κυρίως για την ποιότητα των παραγόμενων εικόνων αλλά και επειδή είναι ανοικτού κώδικα είναι το SDXL 1.0. Οι εικόνες που παράγονται είναι πολύ ποιοτικές από την αρχή της χρησιμοποιησής του, αλλά με τον παράλληλο συνδιασμό της δυνατότητας εκπαίδευσης του, τότε αυτό γίνεται ακόμα πιο ισχυρό.

Το μοντέλο SDXL 1.0 για την παραγωγή εικόνων πραγματικών προσώπων

Το μοντέλο μπορεί να παράγει ένα πολύ μεγάλο φάσμα εικόνων, από τοπία, έργα τέχνης, ζώα, φυτά, πραγματικά και μη πρόσωπα κοκ. Στην ουσία μπορεί να παράγει οτιδήποτε για το οποίο έχει εκπαιδευτεί και το παράγει τόσο καλά όσο το επιτρέπει και η εκπαίδευσή του. Όσο καλύτερη είναι αυτή τόσο καλύτερα μπορεί δυνητικά να παράγει και τις εικόνες για τις οποίες το προτρέπουμε.

Εκπαίδευση του μοντέλου SDXL 1.0

Τα υπάρχοντα μοντέλα AI έχουν ήδη εκπαιδευτεί και μπορούν να παράγουν μετά από προτροπές των χρηστών εικόνες που θα βασίζονται στις προτροπές αυτές, αλλά υπάρχει και μια τυχαιότητα στα στοιχεία που θα συμπεριληφθούν στην εικόνα. Κατά αυτόν τον τρόπο, οι εικόνες που παράγονται θα διαφέρουν λίγο ή περισσότερο μετά από επαναλαμβανώμενη παραγωγή τους από προτροπή που έχει την ίδια έκφραση.Τα αποτελέσματα του μοντέλου SDXL 1.0 είναι εξαιρετικά συγκρινόμενα με την προηγούμενη έκδοση του, ειδικά σε θέματα και πρόσωπα για τα οποία έχει εκπαιδευτεί. Έτσι σε περιπτώσεις διάσημων προσώπων το αποτέλεσμα στην προτροπή να παράγει κάποια εικόνα είναι εξαιρετικά και έχει αρκετά μεγάλη ευελιξία ώστε να παράγει τη διασημότητα αυτή σε διάφορες στάσεις και με διάφορο ρουχισμό. Μια τέτοια διασημότητα είναι για παράδειγμα ο Elon Musk για τον οποίο οι εικόνες που παράγονται μοιάζουν αρκετά στον Musk και σε κάποιες περιπτώσεις η διάκριση μεταξύ μιας πραγματικής από μια παραγώμενη είναι δύσκολη. Το ίδιο δεν συμβαίνει βέβαια με όλα τα πρόσωπα. Για παράδειγμα για τον Κυριάκο Μητσοτάκη αν και επιφανές πρόσωπο, το μοντέλο δεν παράγει πολύ καλά αποτελέσματα. Μπορεί οι εικόνες να θυμίζουν λίγο τον Μητσοτάκη, αλλά σε καμία περίπτωση δεν του μοιάζουν τόσο ώστε να θεωρηθούν ποιοτικές και βλέποντας τις κάποιος δεν θα μάντευε ποτέ ότι πρόκειται εικόνες για το αναφερθέν πρόσωπο. Τέλος, στις περισσότερες περιπτώσεις όπου το μοντέλο δεν αναγνωρίζει το πρόσωπο, θα παράγει αυτό που είναι πιο κοντά στην προτροπή, δηλαδή αν καταλάβει ότι πρόκειται πέρι άντρα, θα παράγει έναν άντρα. Αν δεν μπορεί να εξάγει ούτε αυτό, θα κάνει κάτι που φαντάζει λίγο πολύ τυχαίο.

Για να παράγουμε εικόνες από τέτοια πρόσωπα, ή και να βελτιώσουμε τις ήδη παραγόμενες εικόνες, μπορούμε να εκπαιδεύσουμε το μοντέλο με διάφορους τρόπους και λογισμικά. Η εκπαίδευση μπορεί να γίνει με πραγματικές φωτογραφίες ή και από παραγόμενες από το μοντέλο τις οποίες τις θεωρούμε πολύ καλές και θέλουμε να αυξήσουμε την πιθανότητα να παράγονται τέτοιες εικόνες και σε μελλοντικές προτροπές. Οι εικόνες αυτές πρέπει να είναι σχετικά καλής ανάλυσης και ιδιαίτερα να είναι καθαρές και ξεκάθαρες για το θέμα / πρόσωπο για το οποίο θέλουμε να το εκπαιδεύσουμε.Επίσης οι φωτογραφίες / εικόνες πρέπει να έχουν αρκετή ποικιλία στο ρουχισμό, στάση σώματος κλπ ώστε η εκπαίδευση να δώσει στο μοντέλο την ευελιξία στην παραγωγή εικόνων με κάποια διαφοροποίηση αν αυτό χρειαστεί.

Παρακάτω παρατίθονται κάποια παραδείγματα εικόνων πραγματικών προσώπων, για τα οποία το μοντέλο είτε δεν γνώριζε την ύπαρξή τους, είτε οι εικόνες που παρήγαγε δεν ήταν καλές, όπως ήταν η περίπτωση του Κυριάκου Μητσοτάκη. Στην πρώτη περίπτωση που αποδείχθηκε και η πιο δύσκολη, αυτή του μεγάλου μας ηθοποιού Θανάση Βέγγου, οι εικόνες που χρησιμοποιήθηκαν ήταν κακής ποιότητας και λίγες.

Βέγγος

Στις φωτογραφίες που χρησιμοποιήθηκαν για την εκπαίδευση έγινε μεγένθυση, αποκατάσταση και χρωματισμός, αλλά πάλι από ότι αποδείχθηκε δεν ήταν αρκετό ώστε να δώσει σταθερά ικανοποιητικά αποτελέσματα κατά την παραγωγή των εικόνων.

Η παραγωγή των εικόνων μετά τις προτροπές του Βέγγου τις περισσότερες φορές δεν είναι καλή, αλλά κάποιες φορές είναι ικανοποιητική, γεγονός που οφείλεται ξεκάθαρα στην ελλειπή του εκπαίδευση από τις εικόνες που του δόθηκαν. Παρόλα αυτά, υπάρχει η δυνατότητα της μερικής αναπαραγωγής εικόνας που παρήγαγε σε προηγούμενη προτροπή με την επιλογή μέρους μόνο της εικόνας. Για παράδειγμα από μια εικόνα που ικανοποιεί μπορούν να επιλεχθούν μόνο τα μάτια και να επιχειρήσουμε την αναπαραγωγή μόνο αυτού του τμήματος της εικόνας. Σε αυτές τις περιπτώσεις οι εικόνες πολλές φορές βελτιώνονται αισθητά με αποτέλεσμα να μοιάζουν και πολύ περισότερο στο Βέγγο. Τέτοιες είναι και οι παρακάτω περιπτώσεις εικόνων. Υπάρχει η δυνατότητα, τέτοιες εικόνες να χρησιμοποιηθούν εκ νέου, μαζί με τις καλύτερες φωτογραφίες, ώστε να εκπαιδευτεί καλύτερα το μοντέλο και να δίνει σταθερά καλύτερα αποτελέσματα.

Σαφώς καλύτερα αποτελέσματα έδωσε στην περίπτωση του υποψήφιου για Δήμαρχος Ηρακλείου κ. Καραμαλάκη, προφανώς επειδή και οι φωτογραφίες που χρησιμοποιήθηκαν για την εκπαίδευση ήταν καλύτερες από αυτές του Βέγγου. Παρόλα αυτά, πάλι υπάρχει περιθώριο βελτίωσης μιας και αρκετές εικόνες που παράγονται δεν ειναι καλής ποιότητας. Αντίθετα στην περίπτωση του κ. Καλοκαιρινού, αντίπαλου για τη Δημαρχία στου κ. Καραμαλάκη, τα αποτελέσματα είναι καλύτερα. Βέβαια, όπως φαίνεται και παρακάτω, οι εικόνες του Καραμαλάκη είναι αρκετά καλές τις περισσότερες φορές.

Καραμαλάκης

Η παρακάτω φωτογραφία είναι πραγματική και είναι μια από αυτές που χρησιμοποιήθηκαν για την εκπαίδευση, ενώ αυτές που βρίσκονται παρακάτω είναι εικόνες που παράχθηκαν από το μοντέλο.

Ακολουθούν εικόνες που έχουν παραχθεί από το μοντέλο.

Μητσοτάκης

Η περίπτωση του Μητσοτάκη είναι διαφορετική από την άποψη ότι ενώ το μοντέλο αναγνώρισε το όνομα και επιχείρησε την παραγωγή εικόνων, αυτές δεν του έμοιαζαν και πολύ.

Παρακάτω παρατίθονται κάποιες ενδεικτικές μετά και την εκπαίδευση του μοντέλου. Επειδή οι διαθέσιμες φωτογραφίες είναι περισσότερες και καλύτερης ανάλυσης, τα αποτελέσματα είναι σταθερά καλύτερα στις εξαγωγές.Επίσης υπάρχει η ευελιξία για την παραγωγή ποικιλίας εικόνων, για παράδειγμα η πρώτη με την τρίτη έχουν διαφορές αλλά και στις 2 οι ομοιότητες με την πραγματική φυσιογνωμία του κ. Μητσοτάκη είναι τέτοια ώστε να μην αφήνει αμφιβολίες για το ποιος είναι αυτός που απεικονίζεται.

Καλοκαιρινός

Αντίστοιχη περίπτωση πολύ καλών αποτελεσμάτων είναι και η περίπτωση του Καλοκαιρινού με τη διαφορά ότι οι φωτογραφίες που χρησιμοποιήθηκαν για την εκπαίδευση ήταν λιγότερες.

Τοποθεσία
Ηράκλειο Κρήτης
info@panotours.gr

Panotours © 2024. All Rights Reserved.