Al-Jarf, R. (2025). AI translation of the Gaza-Israel war terminology. International Journal of Linguistics, Literature and Translation, 8(2), 139-152.
מבוא והקשר מחקרי
המאמר עוסק בתרגום מונחי מלחמת עזה־ישראל באמצעים מבוססי בינה מלאכותית, ומתמקד בשני כלים מרכזיים: Google Translate (GT) ו־Microsoft Copilot (MC). המחקר בא על רקע עניין מחקרי גובר בשיח התקשורתי והפוליטי על הסכסוך הפלסטיני־ישראלי, בעיקר מאז 2023. החוקרת סוקרת מחקרים קודמים שעסקו בניתוח שיח, תרגום עיתונאי ותקשורתי, אך מצביעה על חוסר במחקרים שמשווים ישירות בין תרגום מונחים פוליטיים וצבאיים עכשוויים על ידי מערכות בינה מלאכותית.
מטרת המחקר ומתודולוגיה
מטרת המחקר הייתה לבחון את דיוק התרגום של מונחים מתוך מלחמת עזה־ישראל על ידי GT ו־MC, תוך בדיקת איכותם הסמנטית, התחבירית, ההקשרית והאורתוגרפית. נאסף מדגם של 250 מונחים באנגלית ובערבית, כולל שמות מקומות, ארגונים, כלי נשק, שמות מבצעים, מטאפורות ונאולוגיזמים. נבדקו אסטרטגיות תרגום שונות כמו תרגום מילולי, פרשני, השמטה והעברה צורנית.
ניתוח תוצאות התרגום
המחקר מצא ש־48 אחוז מהמונחים תורגמו בצורה זהה בשתי הפלטפורמות. תרגום מערבית לאנגלית נמצא מדויק יותר מתרגום מאנגלית לערבית, כאשר MC תרגם בצורה מדויקת 29 אחוז מהמונחים, לעומת 23 אחוז ב־GT. יחדיו, נתנו תרגום זהה ל־58 אחוז מהמונחים בערבית ו־38 אחוז באנגלית.
אי דיוקים סמנטיים
GT נטה לטעויות חמורות בתרגום מונחים מרובי־משמעויות. למשל, תרגם את המונח "Sofa Bush" כ"שיח ספה", ואת "mortar" כ"מלט", המתאים להקשר בנייה ולא הקשר צבאי. MC תרגם "Breaking Dawn" כ"פנה היום" במקום "בזֹחַ הפַּגָר", ושניהם כשלו בתרגום המטפורה "Carpet Bombing", שהפכה ל"פיצוץ שטיחים". במקרים אחרים, שני הכלים בחרו תרגומים שאינם מקובלים בשיח התקשורתי בערבית, מה שמעיד על בעיה במקורות הנתונים מהם לומדים האלגוריתמים.
תרגום מטפורות
29 אחוז מהמונחים במדגם היו מטאפורות. שני הכלים תרגמו בהצלחה 60 אחוז מהן, כולל "חגורת אש", "עוקץ השטן", "חמאסטן" ו"מהלך הרוח". עם זאת, ניכרו שגיאות כגון תרגום "Samsung Media" כ"מדיה קוריאנית", ו"שיטפון אל־אקצא" כ"فيضان" ולא "طوفان". הטעויות מראות חוסר מודעות להקשר ההיסטורי־פוליטי של המטפורות.
תרגום נאולוגיזמים
31 אחוז מהמונחים היו נאולוגיזמים. MC ו־GT הצליחו לתרגם את רובם, בעיקר בזכות שכיחותם במדיה. מונחים כמו "חמאסטן", "שוואז", "כיפת ברזל" ו"מבצע חניבעל" תורגמו כראוי. אולם במונחים נדירים יותר, ניכרו טעויות בהעברה, השמטה או תרגום מילולי חסר משמעות.
תרגום חלקי והעברת מונחים
במקרים שבהם הכלים לא זיהו את המונח, הם לעיתים השאירו את המילה באנגלית, העבירו אותה באותיות ערביות (כמו "USS" ו־"Bush Sofa") או השמיטו רכיבים מהתרגום. דוגמה לכך היא תרגום חלקי של המונח "רקטות קצרות טווח מדגם רג'ום" תוך השמטת המילה רג'ום לחלוטין.
טעויות תחביריות
נמצאו טעויות בהצמדת ה"א הידיעה, בהטיית פעלים, בסדר המילים ובהתאם בין מין, מספר וגוף. למשל, GT נוטה להוסיף ה"א הידיעה לכל מונח, גם כאשר זה לא מתאים, בעוד MC נוטה להשמיטה. כמו כן, נעשו טעויות בהטיית מילות תואר לפי המין של שם העצם, למשל שימוש ב"مدعوم" במקום "مدعومة" בהתייחסות ל"ג'יהאד האסלאמי".
שגיאות כתיב ותרגום שמי
GT ו־MC נטו לאיותים שונים של אותם שמות. לדוגמה, "חגנה" נכתבה כ"האגנה" ו"כ־גרד" נכתב כ"غراد" או "جراد". שניהם כשלו בזיהוי שמות מושאלים שלא זכו לסטנדרטיזציה ברורה בערבית. השונות באיותים נובעת מהיעדר תקן מובהק באיות מילים לועזיות בשפה הערבית.
מסקנות והמלצות
MC ו־GT סובלים משגיאות תרגום מגוונות — סמנטיות, תחביריות, הקשריות ואורתוגרפיות. מאגרי הנתונים עליהם נשענים הכלים אינם מספקים, במיוחד בתחומים הפוליטיים והצבאיים. כדי לשפר את איכות התרגום, יש להרחיב את התוכן בערבית ברשת, לעדכן מילונים דו־לשוניים, לבנות קורפוסים מקבילים, ולהקים צוותים מקצועיים בתחום התקשורת, הבלשנות והמילונאות.
מבחינה חינוכית, על מוסדות לימוד להכשיר מתרגמים לעבודה עם כלים כמו Trados, MemoQ, OmegaT, וכן לאמן אותם בזיהוי ותיקון שגיאות תרגום שנעשו על ידי בינה מלאכותית. שימוש זהיר ומודע ב־GT ו־MC חיוני במיוחד עבור סטודנטים הלומדים תרגום בתחומים כמו תקשורת, פוליטיקה וצבא.
המחקר מדגיש את החשיבות בהבנה ביקורתית של תרגום בינה מלאכותית, את הפערים הקיימים בין היכולות הממוחשבות להבנה האנושית של שפה, הקשר ותרבות, ואת הצורך בשילובם של כלים טכנולוגיים לצד הבנה עמוקה של תחום הידע והתרבות הייחודיים של כל טקסט מתורגם.