דוברי היוונית הקפריסאית מקבלים הכרה עם מודל AI חדש

4 דקות קריאה
Disclosure: This website may contain affiliate links, which means I may earn a commission if you click on the link and make a purchase. I only recommend products or services that I personally use and believe will add value to my readers. Your support is appreciated!

דוברי היוונית הקפריסאית עשויים בקרוב להיות מובנים על ידי מערכות מופעלות קול הודות לדגם בינה מלאכותית פורץ דרך לזיהוי דיבור לטקסט שפותח על ידי צוות קטן. החידוש הזה נועד להתמודד עם האתגרים של דוברי הניב הייחודי של האי, שנאבקו זמן רב לקבל הכרה בטכנולוגיה.

איגור אכימוב, מנהל מוצר הבינה המלאכותית, שיתף פעולה עם מתאמים חוסיין חדרא וניקיטה מרקוב מאוניברסיטת ניקוסיה ו-UCLan בהתאמה, כדי ליצור מערכת לזיהוי דיבור אוטומטית שמיועדת במיוחד ליוונית הקפריסאית. המערכת ממירה שפה מדוברת לטקסט כתוב, מה שהופך אותה לשימושית במגוון יישומים, כולל סוכני קול מבוססי בינה מלאכותית, שירותי תרגום ותמיכת לקוחות אוטומטית.

טכנולוגיה זו איננה רק יתרון למשתמשים יומיומיים; יש לה פוטנציאל משמעותי במגזרים רבים. בתחום הבריאות, למשל, היא יכולה לתמלל את דיבור המטופל ישירות למערכות רפואיות, ולהקל אינטראקציות, במיוחד עם קשישים. בעסקים, היא פותחת את הדרך לסוכני קול אוטומטיים שיתקשרו באופן טבעי עם לקוחות קפריסאים. בנוסף, היא יכולה למלא תפקיד חשוב בחינוך דרך סיוע בשימור הניב הקפריסאי ודיגיטציה של ארכיוני אודיו מקומיים.

אחד המטרות המרכזיות של הפרויקט היה לפתח שיטה לעבודה עם שפות וניבים שחסרים להם נתונים מספקים. אכימוב ציין את המורכבות של המשימה ואמר: "זה לא היה קל. אני חושב שכולנו עברנו תחת הערכה של כמה זה יהיה מורכב. היו בהחלט עליות וירידות לאורך הדרך."

בתחילה, הצוות התקלל במכשולים משמעותיים בהשגת נתונים איכותיים. למרות שפנו לחוקרים שונים, לעיתים הם נתקלו בנתונים אבודים, דמי גישה גבוהים או סירובים מוחלטים לגישה. עם משאבים מוגבלים, הם פנו למגוון מדיה, ואספו אודיו קפריסאי מתוכניות טלוויזיה, תחנות רדיו, פודקאסטים וספרים. זה הוביל ליצירת אוסף הדיבור הגדול ביותר ביוונית קפריסאית שיצר אי פעם.

אימון הבינה המלאכותית היה מאמץ רב-שלבי. השלב הראשון כלל חשיפת המערכת לדיבור יומיומי ביוונית הקפריסאית כדי ללכוד את הצלילים והקצבים הייחודיים. לאחר מכן הוכנס דיבור מקצועי ברור מתוכניות חדשות ותוכניות רדיו כדי לחדד את הבנת המערכת ולהפחית שגיאות. כלי סיוע לקריאה, KenLM, שולב לשיפור דיוק הזיהוי על ידי הצעת המילים הסבירות ביותר.

כשהפרויקט התקדם, הצוות התמקד בשיפור מתמיד. הם פיתחו פלטפורמה בה דוברי שפת אם יכולים לתקן את התמלולים של הבינה המלאכותית, להכניס תיקונים אלה חזרה לתהליך האימון. גישה מחזורית זו נועדה להגדיל את דיוק המערכת ונאמנותה לניב הקפריסאי עם הזמן.

מרשים שכל הפרויקט בוצע בתקציב צנוע של 150 דולר בלבד, תוך ניצול גישות חדשניות וטכנולוגיית ענן נגישה. עם זאת, אכימוב הדגיש שעבודתם עדיין בעיצומה: "עם רק כמה שעות של אודיו מתומלל איכותי, לא הצלחנו ליצור עדיין את הדגם הטוב בעולם – אבל זה בהחלט ניתן להשגה."

כעת, הצוות אסף כ-300 שעות של דיבור קפריסאי ומחפש באופן פעיל מתנדבים לתרום. המעוניינים יכולים לסייע על ידי הקדשת רק 15 דקות לאימות תמלולים באתר הפרויקט, voiceofcyprus.org. מאמץ קטן זה יכול לשפר משמעותית את איכות מודל הבינה המלאכותית לזיהוי דיבור קפריסאי ואולי להוביל למערכת טקסט לדיבור שמייצגת באותנטיות את הניב.

אכימוב הביע את חשיבות היוזמה לקהילה הקפריסאית: "זה יעזור לנו – ולקפריסין – בצורה משמעותית. אפילו 10-15 דקות זה עושה הבדל. אנחנו רוצים שכל קפריסאי יוכל לדבר בניב שלו ועדיין להיות מובן על ידי טכנולוגיה."

שמור מאמר זה
השאר תגובה