הנחיות לשימוש בבינה מלאכותית גנרטיבית (GAI) בפרסום מדעי: מחקר חתך של כתבי עת רפואיים

Yin, S., Huang, S., Xue, P., Xu, Z., Lian, Z., Ye, C., … & Li, C. (2025). Generative artificial intelligence (GAI) usage guidelines for scholarly publishing: a cross-sectional study of medical journals. BMC medicine, 23(1), 77.

רקע כללי

השימוש בבינה מלאכותית גנרטיבית גבר במהירות מאז השקתה של ChatGPT בשנת 2022. כלי זה, המופעל על ידי מודלים גדולים של שפה, מאפשר לאנשים ללא ידע טכני להשתמש בטכנולוגיה מתקדמת למגוון משימות. גידול השימוש בכלים אלה במאמרים מדעיים ובתהליכי סקירה עמיתים יצר צורך דחוף בהנחיות ברורות לשימוש נכון ואתי. מחקר זה נועד לבחון את היקף ותכני ההנחיות שמספקים כתבי עת רפואיים, תוך השוואה בין כתבי עת מדורגים גבוה במדד SJR לבין מדגם אקראי של כתבי עת בדרוג נמוך יותר.

שיטות המחקר

החוקרים בחרו שני מדגמים של כתבי עת רפואיים: 200 כתבי עת מהמדורגים הגבוהים ביותר במדד SJR לשנת 2022, ו־140 כתבי עת שנבחרו באופן אקראי מתוך שאר הרשימה, תוך הקפדה על פיזור גאוגרפי ותחומי. כל כתב עת נבדק לגבי שלושה סוגים של הנחיות שימוש ב־GAI: הנחיות למחברים, הנחיות לסוקרים והפניות להנחיות חיצוניות (כגון COPE, ICMJE, WAME). הסיווג כלל ארבע קטגוריות: אין הנחיות כלל, הפניה להנחיות חיצוניות בלבד, הנחיות פנימיות בלבד, ושילוב של שתיהן.

לצורך ניתוח התוכן, פותחה רשימת בדיקה בת שמונה המלצות למחברים ושלוש לסוקרים, הכוללות היבטים כגון עריכה לשונית, כתיבת טקסטים, ניתוח נתונים, יצירת תמונות, בדיקת עובדות, תיעוד שימוש, ושאלת זכאות הבינה המלאכותית למחברוּת. תהליך הקידוד והבדיקה התבצע על ידי שני חוקרים שהציגו התאמה גבוהה בין הממצאים.

ממצאים עיקריים

נמצא כי 95 אחוזים מהכתבי עת המדורגים בצמרת סיפקו הנחיות למחברים, לעומת 86.7 אחוזים בלבד במדגם האקראי של כתבי עת שאינם מהצמרת. עבור סוקרים, שיעור כתבי העת שסיפקו הנחיות עמד על 92.5 אחוזים בקרב כתבי העת המדורגים גבוה ו־86.7 אחוזים בקרב המדורגים הנמוכים. בשני המקרים, פערים אלה היו בעלי מובהקות סטטיסטית. למרות זאת, שתי הקבוצות חלקו במדד דומה של עומק ואיכות המלצות: חציון של חמש מתוך שבע המלצות למחברים, וחציון של אחת מתוך שתיים לסוקרים.

מעניין לציין כי רק אחוזים נמוכים יחסית של כתבי עת התייחסו באופן מפורש לאפשרות השימוש ב־GAI לצורך ניתוח ופרשנות של נתונים. בקרב כתבי העת בדרוג הגבוה, כ־32.5 אחוזים הציעו הנחיה זו, ואילו בקרב הקבוצה השנייה רק 16.7 אחוזים התייחסו לכך. לעומת זאת, מרבית הכתבי עת אפשרו שימוש בעריכה לשונית וביקשו תיעוד של השימוש בכלים וכן שללו את האפשרות שהבינה המלאכותית תקבל מחברוּת על מאמרים.

מבחינת הנחיות לסוקרים, נמצא פער בין הקבוצות: כתבי העת הבכירים דרשו תיעוד שימוש בכלים אך לא התייחסו לעריכה לשונית, בעוד כתבי העת מהקבוצה הנמוכה יותר אפשרו עריכה לשונית אך לא תמיד דרשו תיעוד.

ניתוח סטטיסטי של משתנים

החוקרים ניתחו את הקשרים בין מאפיינים של כתבי עת לבין קיום ההנחיות או מספר ההמלצות הכלול בהן. נמצא כי במדגם של כתבי עת בדרוג נמוך, מדד SJR היה קשור באופן חיובי לסבירות לספק הנחיות גם למחברים וגם לסוקרים. במילים אחרות, ככל שהציון של כתב העת היה גבוה יותר, כך עלתה ההסתברות שיכלול הנחיות שימוש ברורות ומקיפות יותר. לעומת זאת, בקרב כתבי העת המדורגים גבוה לא נצפו קשרים מובהקים בין מאפיינים אלה לבין איכות או היקף ההנחיות.

מגמות וסוגיות מהותיות

נמצא קונצנזוס רחב על ארבע המלצות עיקריות: היתר לשימוש בעריכה לשונית, איסור על מתן מחברוּת ל־GAI, דרישה לבדיקת עובדות, ודרישה לתיעוד שימוש. אך בנוגע לשימוש בכלים לצורכי כתיבה, ניתוח נתונים ויצירת תמונות, הייתה אי אחידות ניכרת בין כתבי העת. חלקם אסרו זאת, אחרים אפשרו תחת תנאים מסוימים, ויש שלא התייחסו כלל.

ממצא נוסף נוגע לשונות הרבה בין כתבי העת באשר למיקום בו יש לדווח על השימוש ב־GAI. יש שדרשו זאת במכתב הלוואי, אחרים בסעיף נפרד, וחלקם כלל לא ציינו מיקום מדויק. חוסר האחידות הזו עשוי להקשות על שמירה על שקיפות ואחידות.

בנוגע להנחיות חיצוניות, נמצא כי רוב כתבי העת התייחסו אליהן, כאשר הנפוצות ביותר היו אלה של ICMJE. שלוש ההנחיות המרכזיות כללו איסור על מחברוּת ל־GAI, חובת תיעוד שימוש ודרישת בדיקת עובדות, אך לא כללו התייחסות מפורשת לשימוש בעריכה לשונית, מה שיצר פער בינן לבין חלק מההנחיות הפנימיות.

מסקנות והמלצות

המחקר מעלה שלושה תחומים הדורשים שיפור מיידי. ראשית, יש צורך בהרחבת ההנחיות הקיימות כך שיכסו את כל שלבי המחקר, במיוחד בנוגע לשימוש בתוכן שנוצר על ידי GAI. שנית, יש לגשר על הפערים והסתירות שנמצאו בין כתבי העת ובין ההנחיות החיצוניות. שלישית, מומלץ לאמץ גישה דינמית של הנחיות מתעדכנות, אשר יותאמו להתפתחויות הטכנולוגיות המהירות ולשינויים בסטנדרטים האתיים.

החוקרים ממליצים גם על מחקר עתידי שיכלול ענפי ידע נוספים מעבר לרפואה, ויבחן גם מידע שאינו ציבורי במערכות הגשת מאמרים, כדי לקבל תמונה מלאה יותר. כמו כן, יש לבחון שילוב מדדים נוספים כגון גורם השפעה, כדי להעמיק את ההבנה לגבי הגורמים המשפיעים על אימוץ ההנחיות.

סיכום

למרות שמרבית כתבי העת הרפואיים כוללים הנחיות כלשהן לשימוש בבינה מלאכותית גנרטיבית, קיימים עדיין פערים מהותיים באחידות, בהיקף ובהתמקדות ההנחיות. יש צורך במאמצים משותפים לפיתוח מסגרות אתיות ברורות ומעודכנות, שיכוונו חוקרים וסוקרים להשתמש בטכנולוגיה זו באופן אחראי, שקוף ומבוסס.

שיתוף המאמר:

פוסטים אחרונים

קטגוריות

קטגוריות
דילוג לתוכן