Οι Ομιλητές Κυπριακής Ελληνικής Αποκτούν Αναγνώριση με Νέο Μοντέλο AI

4 Min Read
Disclosure: This website may contain affiliate links, which means I may earn a commission if you click on the link and make a purchase. I only recommend products or services that I personally use and believe will add value to my readers. Your support is appreciated!

Οι ομιλητές της Κυπριακής ελληνικής σύντομα ίσως γίνουν κατανοητοί από συστήματα ενεργοποιημένα με φωνή, χάρη σε ένα πρωτοποριακό μοντέλο τεχνητής νοημοσύνης μετατροπής ομιλίας σε κείμενο που ανέπτυξε μια μικρή ομάδα. Αυτή η καινοτομία στοχεύει στην αντιμετώπιση των προκλήσεων που αντιμετωπίζουν οι ομιλητές του μοναδικού διαλέκτου του νησιού, οι οποίοι εδώ και καιρό αγωνίζονται για αναγνώριση στην τεχνολογία.

Ο Ίγκορ Ακίμοφ, διαχειριστής προϊόντων τεχνητής νοημοσύνης, συνεργάστηκε με τους φοιτητές Χουσεΐν Χαντρά και Νικήτα Μάρκοφ από το Πανεπιστήμιο Λευκωσίας και το UCLan, αντίστοιχα, για να δημιουργήσουν ένα αυτόματο σύστημα αναγνώρισης ομιλίας ειδικά σχεδιασμένο για την Κυπριακή ελληνική. Το σύστημα μετατρέπει την προφορική γλώσσα σε γραπτό κείμενο, καθιστώντας το εφαρμόσιμο σε διάφορες χρήσεις, όπως φωνητικοί πράκτορες AI, υπηρεσίες μετάφρασης και αυτοματοποιημένη υποστήριξη πελατών.

Αυτή η τεχνολογία δεν είναι απλώς μια ευλογία για τους καθημερινούς χρήστες· έχει σημαντικές προοπτικές σε πολλούς τομείς. Στην υγειονομική περίθαλψη, για παράδειγμα, μπορεί να αποτυπώσει την ομιλία του ασθενούς απευθείας σε ιατρικά συστήματα, διευκολύνοντας ομαλότερη αλληλεπίδραση, ειδικά για τους ηλικιωμένους. Στις επιχειρήσεις, ανοίγει τον δρόμο για αυτοματοποιημένους φωνητικούς πράκτορες να επικοινωνούν φυσικά με Κυπριούς πελάτες. Επιπλέον, μπορεί να παίξει κρίσιμο ρόλο στην εκπαίδευση, βοηθώντας στη διατήρηση του Κυπριακού ιδιώματος και την ψηφιοποίηση των τοπικών ηχητικών αρχείων.

Ένας από τους βασικούς στόχους του έργου ήταν να αναπτυχθεί μια μεθοδολογία για την εργασία με γλώσσες και ιδιώματα που δεν διαθέτουν επαρκή δεδομένα. Ο Ακίμοφ σχολίασε την πολυπλοκότητα του έργου, λέγοντας: «Δεν ήταν εύκολο. Νομίζω ότι όλοι υποτιμήσαμε πόσο πολύπλοκο θα ήταν. Σίγουρα υπήρχαν ανόδους και καθόδους στην πορεία.»

Αρχικά, η ομάδα αντιμετώπισε σημαντικά εμπόδια στην εύρεση ποιοτικών δεδομένων. Παρά τις επαφές με διάφορους ερευνητές, συχνά αντιμετώπιζαν προκλήσεις όπως απώλεια δεδομένων, απαγορευτικά τέλη ή outright απορρίψεις για πρόσβαση. Με περιορισμένους πόρους, στράφηκαν σε διάφορα μέσα, συλλέγοντας κυπριακό ήχο από τηλεοπτικές εκπομπές, ραδιοφωνικούς σταθμούς, podcast και βιβλία. Αυτό οδήγησε στη δημιουργία της μεγαλύτερης συλλογής ομιλίας Κυπριακής ελληνικής που έχει συγκεντρωθεί ποτέ.

Η εκπαίδευση της τεχνητής νοημοσύνης ήταν μια διαδικασία πολλαπλών φάσεων. Το πρώτο στάδιο αφορούσε την έκθεση του συστήματος σε καθημερινή Κυπριακή ελληνική για να καταγράψει τους μοναδικούς ήχους και ρυθμούς της. Στη συνέχεια, εισήχθησαν πιο καθαρές επαγγελματικές ομιλίες από ειδησεογραφικές εκπομπές και ραδιοφωνικές εκπομπές για να βελτιωθεί η κατανόηση του AI και να μειωθούν τα λάθη. Ένα εργαλείο βοηθού ανάγνωσης, το KenLM, ενσωματώθηκε για να αυξήσει την ακρίβεια αναγνώρισης προτείνοντας τις πιο πιθανές λέξεις.

Καθώς το έργο προχωρούσε, η ομάδα εστίασε στη συνεχή βελτίωση. Ανέπτυξαν μια πλατφόρμα όπου οι γηγενείς ομιλητές μπορούσαν να διορθώνουν τις απομαγνητοφωνήσεις του AI, τροφοδοτώντας αυτές τις διορθώσεις πίσω στη διαδικασία εκπαίδευσης. Αυτή η επαναληπτική προσέγγιση στοχεύει στην αύξηση της ακρίβειας και της πιστότητας του συστήματος προς το Κυπριακό ιδίωμα με την πάροδο του χρόνου.

Εντυπωσιακά, ολόκληρο το έργο πραγματοποιήθηκε με προϋπολογισμό μόλις 150 δολαρίων, αξιοποιώντας καινοτόμες προσεγγίσεις και προσιτή τεχνολογία cloud. Ωστόσο, ο Ακίμοφ τόνισε ότι η δουλειά τους είναι ακόμη σε εξέλιξη: «Με μόλις λίγες ώρες υψηλής ποιότητας απομαγνητοφωνημένου ήχου, δεν μπορούσαμε να δημιουργήσουμε το καλύτερο μοντέλο στον κόσμο ακόμα – αλλά είναι απολύτως εφικτό.»

Προς το παρόν, η ομάδα έχει συγκεντρώσει περίπου 300 ώρες ομιλίας στην Κυπριακή και αναζητά ενεργά εθελοντές να συμβάλουν. Όσοι ενδιαφέρονται μπορούν να βοηθήσουν ξοδεύοντας μόλις 15 λεπτά για να επικυρώσουν απομαγνητοφωνήσεις στην ιστοσελίδα του έργου, voiceofcyprus.org. Αυτή η μικρή προσπάθεια θα μπορούσε να βελτιώσει σημαντικά την ποιότητα του μοντέλου AI για την αναγνώριση Κυπριακής ομιλίας και ενδεχομένως να οδηγήσει σε σύστημα κειμένου σε ομιλία που να αναπαριστά αυθεντικά το ιδίωμα.

Ο Ακίμοφ ανέφερε τη σημασία αυτής της πρωτοβουλίας για την κυπριακή κοινότητα, δηλώνοντας: «Αυτό θα μας βοηθήσει – και την Κύπρο – πάρα πολύ. Ακόμα και μόλις 10-15 λεπτά κάνουν τη διαφορά. Θέλουμε κάθε Κύπριος να μπορεί να μιλά στη δική του διάλεκτο και να γίνεται κατανοητός από την τεχνολογία.»

Share This Article
Leave a review