עריכה בסיוע קורפוס לסטודנטים לתואר שלישי: יותר מאשר רק שימוש בקונקורדנציה
מבוא
כתיבת עבודת דוקטורט נחשבת לאחת מהמשימות המאתגרות ביותר עבור כותבים אקדמיים, במיוחד עבור סטודנטים שכותבים באנגלית כשפה נוספת. בשנים האחרונות נרשמה עלייה משמעותית בכמות הדוקטורטים המוענקים, מה שהוביל לגידול בהתעניינות ובמחקר על סוגת התזה. בעוד שקיים גוף מחקרי רחב בנושא ארגון מבנה התזה ותתי סוגות כמו סקירת ספרות ומבוא, רק מעט תשומת לב הוקדשה לשימוש בקורפוסים ככלי תומך בכתיבת התזה.
למידה מבוססת נתונים (DDL) וכתיבת תזה
DDL, או למידה מבוססת נתוני קורפוסים, היא גישה שבה הלומד פועל כחוקר, נחשף לנתונים לשוניים דרך קורפוס ומפיק ידע מתוך ההתבוננות בהם. מספר פרויקטים הציגו את השימוש ב־DDL בכתיבה אקדמית, אך רק מעטים עסקו בכתיבת תזה. חלק מהקורסים המוצלחים שילבו בין עיון בקורפוס לבין ניתוח סוגות או פונקציות דיסקורסיביות, תוך התמקדות בפיתוח מודעות לשונית ותפקודית. עם זאת, המאמר הנוכחי מציג קורס ייחודי הממוקד בסטודנטים הנמצאים בשלב המאוחר של כתיבת התזה ומתמקד בעריכה בסיוע קורפוס ככלי לשיפור הטקסט.
סוגיות בעריכה, כלים קורפורליים וסוגי חיפוש
המאמר מבחין בין שלושה סוגי עריכה: עריכת שפה (תיקוני תחביר ואיות), עריכת ארגון (מבנה הפרקים והטקסט), ועריכת תוכן (בחירת ופיתוח החומר). על פי המחברת, סטודנטים אינם עוסקים רק בשיפוצים לשוניים אלא מתמודדים עם מגוון רחב של שאלות עריכה. כלים קורפורליים שונים עשויים לתמוך ברמות שונות של עריכה, בין אם מדובר בזיהוי בעיות ידועות מראש או בגילוי בעיות נסתרות. המאמר מציג הבחנה חשובה בין כלים הדורשים קלט מהמשתמש (כגון Concordance) המתאימים לבעיות ידועות, לבין כלים שמפיקים תובנות אוטומטית (כגון Word List או Keyword List) המסייעים בזיהוי בעיות חדשות.
המאמר מבחין בין שלושה סוגי עריכה: עריכת שפה (תיקוני תחביר ואיות), עריכת ארגון (מבנה הפרקים והטקסט), ועריכת תוכן (בחירת ופיתוח החומר). על פי המחברת, סטודנטים אינם עוסקים רק בשיפוצים לשוניים אלא מתמודדים עם מגוון רחב של שאלות עריכה, כאשר עריכה לשונית של דוקטורט היא רק אחת מהן. כלים קורפורליים שונים עשויים לתמוך ברמות שונות של עריכה, בין אם מדובר בזיהוי בעיות ידועות מראש או בגילוי בעיות נסתרות. המאמר מציג הבחנה חשובה בין כלים הדורשים קלט מהמשתמש (כגון Concordance) המתאימים לבעיות ידועות, לבין כלים שמפיקים תובנות אוטומטית (כגון Word List או Keyword List) המסייעים בזיהוי בעיות חדשות.
רקע המחקר
הקשר הקורס
הקורס "Editing your Thesis with Corpora" הועבר במרכז לשפות באוניברסיטת מחקר בבריטניה והיה מיועד לדוקטורנטים בשלב כתיבת התזה. הקורס כלל שישה מפגשים שבועיים בני שעתיים, והתמקד בהקניית מיומנויות עריכה באמצעות שימוש בכלים קורפורליים. הסטודנטים התבקשו לבנות שני קורפוסים: האחד של טקסטים אקדמיים מומחים בתחום עיסוקם (בעיקר מאמרים), והשני של כתיבתם האישית (פרקי תזה).
הליך הקורס
המפגש הראשון עסק בהיכרות עם תוכנת AntConc וביישום כלי הקונקורדנס לשאלות עריכה. לאחר מכן, למדו הסטודנטים כיצד לבנות קורפוס אישי באמצעות המרת קבצי PDF לפורמט טקסט בעזרת AntFileConverter. המפגשים הבאים עסקו בהכרת כלים קורפורליים נוספים: Collocates, Clusters, N-Grams, Word List, Concordance Plot ו־Keyword List, כאשר כל מפגש כלל הדגמה, תרגול עצמאי, ושימוש בקורפוסים האישיים של המשתתפים.
נתונים
משתתפים
הקורס כלל 90 סטודנטים ממגוון דיסציפלינות, כשהרוב הגיעו ממדעי הטבע, מדעי החברה והרוח. כל המשתתפים היו דוברי אנגלית כשפה שנייה, ודוברים 26 שפות אם שונות, בהן הסינית, ספרדית וגרמנית. טווח גודל הקורפוסים שנבנו היה רחב: מקורפוסים בגודל של כ־77,000 מילים ועד מעל ל־8 מיליון, עם ממוצע של כ־874,000 מילים. גם הקורפוסים של כתיבת הסטודנטים נעו בין כמה אלפי מילים למעל 125,000.
מקורות נתונים
בנוסף לקורפוסים, נאספו נתונים דרך שאלונים ומשימות כיתה. הסטודנטים מילאו גליונות עבודה בהם תיעדו את השאלות שערכו באמצעות הכלים, את מהלך החיפוש והמסקנות שהפיקו מהקורפוס. מדובר במקור עשיר להבנת תהליך ההתמודדות שלהם עם כלים קורפורליים.
תרומת הכלים הקורפורליים לעריכה
כלים לבעיות ידועות
ה־Concordance אפשר לסטודנטים לבדוק שימוש בביטויים ולזהות העדפות תחביריות ותפקודיות בתחום שלהם. כלים כמו Clusters ו־Collocates סייעו בזיהוי צרופים ותבניות לשוניות חוזרות. Concordance Plot אפשר בחינה גרפית של התפלגות מונחים לאורך פרקי התזה וכך סייע באיזון תוכני ובביקורת על ארגון הטקסט. דוגמה בולטת היא סטודנטית שבחנה את השכיחות של התייחסויות לעיר פריז מול בואנוס איירס וגילתה צורך באיזון.
כלים לבעיות לא מזוהות
כלי ה־N-Grams עזר לחשוף הבדלים בין שימוש בביטויים נפוצים בין הקורפוס האישי לבין קורפוס המומחים, ובכך לחשוף פערים דיסציפלינריים. Word List סייעה לזהות אי־עקביות באיות ובסגנון (למשל בין optimized ל־optimised). Keyword List אפשרה השוואה בין פרק מסוים של תזה לבין כלל הטקסט, ובכך זיהתה נושאים מודגשים לא מכוונים שדורשים תשומת לב.
הערכת הכלים
בסיום הקורס הוערכה מידת התועלת של הכלים השונים. הכלי הפופולרי ביותר היה Concordance, שקיבל 93 אחוזי דירוג חיובי. הכלים הנוספים דורגו גם הם באופן חיובי, כשהפערים בין הדירוגים לא היו גדולים. ההבדלים נבעו בין היתר ממידת הרלוונטיות של הכלי לשלב שבו נמצא הכותב בתהליך כתיבת התזה. הכלים שתומכים בעריכה לשונית קיבלו ציונים גבוהים יותר בקרב כותבים בשלב מוקדם, בעוד שהכלים שמתמקדים בניתוח מבני ותוכני הפכו רלוונטיים יותר בשלב מתקדם יותר של התזה.
מסקנות והשלכות להמשך
המאמר מדגיש את הפוטנציאל החינוכי הגלום בשימוש בשני סוגי קורפוסים: קורפוס מומחים וקורפוס אישי. שילוב זה מאפשר לכותבים לבצע שלוש פעולות מרכזיות: חיפוש והסקת מסקנות מתוך קורפוס מומחים בלבד, השוואה בין הקורפוסים, וניתוח מעמיק של כתיבתם האישית. המאמר גם מצביע על כך שכלים קורפורליים יכולים לתמוך לא רק בעריכה לשונית אלא גם בשיפור מבנה ותוכן התזה. הדרכה מתודולוגית לשימוש בכלים מגוונים בתהליך העריכה עשויה לתרום רבות לעצמאות ולכשירות הכתיבה האקדמית של הדוקטורנטים. לבסוף, המחברת קוראת למחקר נוסף על שילוב קורפוסים בלמידה ועריכה אקדמית, במיוחד במוסדות שונים ועם אוכלוסיות מגוונות. שימוש נרחב ומתודולוגי בקורפוסים עשוי להפחית את התלות בעורכים חיצוניים ולהעצים את הכותבים האקדמיים לעתיד.
Charles, M. (2018). Corpus-assisted editing for doctoral students: More than just concordancing. Journal of English for Academic Purposes, 36, 15-25.
