כתוביות במציאות מדומה: קווים מנחים לשילוב כתוביות בתוכן ב-360 מעלות
הקדמה
המאמר נפתח בתיאור הצמיחה של מדיה אימרסיבית, ובמיוחד מציאות מדומה (VR) ווידאו ב-360 מעלות, כאמצעי סיפור בעל פוטנציאל גדול בשדות כמו קולנוע, עיתונות ומשחקים. עם זאת, המדיה הזו עדיין אינה נגישה לכולם, בעיקר לאנשים עם לקויות שמיעה. לצורך כך נוסד פרויקט המחקר האירופי ImAc, שמטרתו לחקור כיצד ניתן להטמיע שירותי נגישות כגון כתוביות, תיאור קולי ושפת סימנים במדיה אימרסיבית. מחקר זה מתמקד בשילוב כתוביות בקטעי וידאו ב-360 מעלות ובוחן אילו אסטרטגיות הן היעילות ביותר.
מסגרת תיאורטית
הטמעת כתוביות במדיה אימרסיבית מציבה אתגרים ייחודיים, במיוחד משום שהשדה הוויזואלי (FoV) דינמי והצופה חופשי להביט לכל כיוון. לכן, יש לקבוע היכן ימוקמו הכתוביות כך שיהיו תמיד גלויות, לא יחתכו מהמסך, ולא יפריעו לחוויית הצפייה או יגרמו לבחילה הנפוצה בצפייה בתוכן VR. בנוסף, כאשר הדובר אינו נראה לעין, יש לספק מנגנון הכוונה ויזואלי שיכוון את הצופה למקור הקול.
סקירה של מחקרים קודמים
מחקרים קודמים הציעו פתרונות שונים, ביניהם כתוביות שמופיעות תמיד מול הצופה, כתוביות דינמיות ליד הדובר, וכתוביות קבועות במרחקים שווים במרחב (כל 120 מעלות). צוות מחקר של ה-BBC, למשל, הציע ארבעה סוגים של מיקום כתוביות ונמצא שהסוג המועדף היה זה שמלווה את תנועות ראשו של הצופה. עם זאת, נותר חוסר בהירות באשר לאפשרות הטובה ביותר.
מטרת המחקר
המחקר הנוכחי ביקש לבחון שני משתנים עיקריים: מיקום הכתוביות ומנגנוני הכוונה לזיהוי מיקום הדובר. נבחנו שתי אסטרטגיות מיקום: כתוביות תמידיות שמלוות את מבט הצופה וכתוביות קבועות בשלוש נקודות קבועות ב-360 מעלות. בנוסף נבחנו שני מנגנוני הכוונה: חצים שמופיעים לצד הכתובית ומכוונים למיקום הדובר, ורדאר המציג ייצוג סכמטי של מיקומו של הדובר בשדה הראייה.
שיטת המחקר
במחקר השתתפו 40 נבדקים, מחציתם עם לקות שמיעה. הם צפו בסרטונים שונים עם גרסאות שונות של כתוביות ומנגנוני הכוונה, תוך מעקב אחרי תנועות הראש שלהם ומענה על שאלוני העדפה ושאלוני חוויית נוכחות (IPQ). הכתוביות נכתבו לפי התקן הספרדי לכתוביות נגשות, ובוצעו פיילוטים מוקדמים לשיפור הממשק והתהליך.
חומרים טכנולוגיים וניסויים
המשתתפים צפו בתוכן באמצעות Samsung Gear VR, וכל הסרטונים הוצגו ללא קול כדי לאזן בין לקויות שמיעה וידע לשוני. נעשה שימוש בגופן Roboto ללא תיבת רקע, כפי שהומלץ במחקרים קודמים. נבחרו קליפים מסוגים שונים: דוקומנטריים עבור בחינת מיקום כתוביות, וסרט מדע בדיוני עם דוברים שונים לבחינת מנגנוני הכוונה.
המשתתפים
המדגם כלל טווח גילאים רחב, כאשר חצי מהמשתתפים היו עם לקות שמיעה. נבדקו גם העדפות תוכן, שימוש יומיומי בטכנולוגיה, והרגלי צריכת כתוביות. נמצא כי משתתפים צעירים יותר צפו ביותר תוכן עם כתוביות, וצרכו תוכן באמצעות לפטופ או סמארטפון יותר מהמשתתפים המבוגרים.
תוצאות: העדפות המשתמשים
נמצא כי 82.5% מהמשתתפים העדיפו כתוביות תמידיות שמלוות את מבטם, והן דורגו כקלות יותר לקריאה, פחות מסיחות ומגבירות את תחושת החופש בתנועה. הכתוביות הקבועות נחשבו אמנם לפחות מסיחות, אך גם פחות נגישות, במיוחד לקוראים עם לקות שמיעה. לגבי מנגנוני הכוונה, 82.5% העדיפו חצים על פני רדאר, כי הם היו אינטואיטיביים, ישירים ופחות מסיחים. הרדאר דרש מאמץ קוגניטיבי רב יותר והיה מבלבל למשתמשים רבים.
תוצאות: שאלון הנוכחות (IPQ)
מבחינת תחושת נוכחות, כתוביות תמידיות נתפסו כמשפרות את התחושה הכללית של המצאות בסצנה הווירטואלית. הכתוביות הקבועות פגעו בתחושת הנוכחות. כמו כן, הרדאר השפיע לרעה על מדד המעורבות, ככל הנראה בשל מורכבותו. החצים נתפסו כאמצעי הכוונה שאינו פוגע בתחושת המעורבות.
תוצאות: מעקב אחר תנועות ראש
ממצאי תוכנת CVR Analyzer הראו כי כאשר נעשה שימוש בכתוביות תמידיות, תנועות הראש היו מגוונות והעידו על חופש חקירה של הסביבה. לעומת זאת, כאשר נעשה שימוש בכתוביות קבועות, המשתתפים ריכזו את מבטם בעיקר בנקודה אחת.
דיון
המחקר מדגיש כי שילוב כתוביות במדיה אימרסיבית מחייב התאמות מיוחדות. כתוביות תמידיות עם מנגנון חצים מאפשרות שמירה על חוויית ההשתקעות מבלי להסיח את דעת הצופה או לגרום לו לתסכול. בעוד רדאר עשוי להיות מדויק יותר מבחינה מרחבית, הוא יוצר עומס קוגניטיבי שאינו רצוי בחוויית צפייה אימרסיבית. יש לשאוף לפשט את חוויית המשתמש ולמזער אלמנטים מורכבים ככל הניתן.
מסקנות
המחקר מסיק כי כתוביות תמידיות עם חצים הן הפתרון האופטימלי לשילוב כתוביות בתוכן VR, במיוחד בתכנים דוקומנטריים או אינטראקטיביים כמו משחקים. פתרון זה גם קל יותר להפקה ומדרגי לשימוש. יחד עם זאת, ייתכן שתוכן מסוגים שונים יפיק תועלת משילוב פתרונות נוספים כגון כתוביות קבועות או שילוב בין שני הסוגים. מחקרים עתידיים נדרשים לבחינת סוגים שונים של תוכן, השפעות מהירות קריאה, ושילוב טכנולוגיות כמו בינה מלאכותית להוספת תיבות רקע חכמות.
המאמר מצביע על כך ששילוב נכון של כתוביות במדיה אימרסיבית אינו רק אפשרי אלא גם נחוץ כדי להבטיח נגישות שוויונית לעידן החדש של התקשורת החזותית.
Agulló, B., & Matamala, A. (2020). Subtitles in virtual reality: guidelines for the integration of subtitles in 360º content. Íkala, revista de lenguaje y cultura, 25(3), 643-661.