ניבוי חוות דעת עסק חי באמצעות כריית נתונים

מבוא: חוות דעת עסק חי וחשיבות הביקורת

תקן ביקורת מספר 59 של המכון האמריקאי לרואי חשבון מחייב את המבקר להעריך בכל ביקורת האם קיים ספק מהותי לגבי יכולת הישות הנבדקת להמשיך לפעול כעסק חי. על המבקר לבחון את מצב העסק לתקופה סבירה שאינה עולה על שנה אחת ממועד הדוחות הכספיים המבוקרים. מידע רלוונטי לעניין זה מתקבל מנהלים ומהליכי ביקורת שונים. בין האירועים המעוררים ספק בדבר יכולת ההמשך ניתן למנות: מגמות פיננסיות שליליות, הפרת התחייבויות הלוואה, עצירות עבודה ותלות מופרזת בהצלחת פרויקט מסוים. כאשר מגיע המבקר למסקנה שיש ספק מהותי, עליו לבחון את תוכניות ההנהלה לצמצום הסיכון, ואם אינן מספקות, עליו לשנות את דוח הביקורת בהוספת פסקה הסברית.

פשיטות רגל ללא דוח ביקורת מוקדם המזהיר על קשיים נתפסות בעיני הציבור ככישלון ביקורת. תדירות גבוהה של כישלונות שכאלה מלמדת על מורכבות ההחלטה ועל מידת שיקול הדעת הנדרשת. מורכבות זו הניעה פיתוח מודלים רבים לחיזוי חוות הדעת, אולם רובם התבססו על ניתוח רגרסיה לוגיסטית, שהיא כלי מחקרי מתאים אך אינו ידידותי למשתמש בפעילות הביקורת היומיומית. הפתרון המוצע במסגרת זו הוא פיתוח מודל סיווג מבוסס כללים, המאפשר לרואי חשבון לסקור לקוחות פוטנציאליים, לזהות לקוחות במצוקה חמורה, ולשמש כבקרת איכות בשלבים המתקדמים של הביקורת.

סקירת ספרות: מחקרים קודמים בחיזוי חוות דעת עסק חי

מחקרים קודמים רבים בחנו את השפעת גורמים כמותיים ולא כמותיים על הנפקת חוות דעת מסויגת. הם הבחינו בין חברות שקיבלו חוות דעת עסק חי לבין חברות שלא קיבלוה, כאשר הקבוצה השנייה מחולקת לחברות בריאות ולחברות במצוקה. חברה במצוקה מוגדרת ככזו המקיימת לפחות שתיים מתוך שש תנאים: עודף הפסד נצבר, הפסד תפעולי, הפסד נקי, הון חוזר שלילי, שווי נקי שלילי, או תזרים מזומנים שלילי.

שיטות הדגימה בספרות מסווגות לשלוש: דגימה מותאמת, שבה לכל חברה עם חוות דעת עסק חי מותאמת חברה אחת ממאגר החברות במצוקה תוך התאמה לסקטור, שנה וגודל; דגימה מאוזנת, שבה מספר החברות משתי הקבוצות שווה אך הבחירה אקראית; ושיטות אחרות הכוללות שימוש בחברות פושטות רגל בלבד, שימוש בדגימה מלאה של כל החברות הזמינות, או דגימה דומה לדגימה המאוזנת אך ללא שוויון מלא בין הקבוצות.

מבחינה מתודולוגית, המחקרים הראשונים השתמשו בניתוח דיסקרימיננטי מרובה משתנים, ואחריהם עברו רוב החוקרים לרגרסיה לוגיסטית. ממחקרים מוקדמים ועד סוף שנות השמונים כללו הדגימות חברות בריאות וחברות במצוקה כאחד, ואילו מתחילת שנות התשעים ואילך הוגבלו הדגימות ברוב המחקרים לחברות במצוקה בלבד, בעקבות הטענה שהחלטת המבקר שונה מהותית בין שתי הקבוצות. שאלת הדגימה המותאמת עלתה כסוגיה שנויה במחלוקת, שכן שיטה זו עלולה להחדיר הטיה שיטתית לאומדנים, אם כי שימוש ברגרסיה לוגיסטית עשוי לנטרל חלק מבעיה זו.

כריית נתונים וטכניקות סיווג

עקרונות כריית הנתונים

כריית נתונים היא תהליך חילוץ ידע מתוך מסות גדולות של נתונים גולמיים. אחד מסוגי המשימות הנפוצים ביותר הוא סיווג, שבו מטרת המודל היא להצמיד נקודת נתונים חדשה לקבוצה מוגדרת מראש על בסיס מאפייניה. המודל שנוצר מאפשר סיווג אוטומטי של נקודות עתידיות. קיימות שיטות סיווג רבות, בהן C4.5, רגרסיה לוגיסטית, ניתוח דיסקרימיננטי, k-שכנים הקרובים ביותר, רשתות נוירונים ומכונות וקטור תמך (SVM). מודל סיווג טוב חייב לעמוד בדרישות של דיוק, קריאות ואינטואיטיביות ביחס לידע הדומיין.

שיטת AntMiner+

השיטה AntMiner+ מבוססת על מערכות נמלים מלאכותיות, שהן ענף של תחום הבינה הנחיל. הרעיון הביולוגי שעומד בבסיסה: נמלים מתקשרות ביניהן בעקיפין באמצעות חומר כימי הנקרא פרומון. כל נמלה מפרישה פרומון על הנתיב בו היא צועדת; נתיבים קצרים יותר מצטברים בהם יותר פרומון ביחס לזמן, מה שמגדיל את ההסתברות שנמלים נוספות יבחרו בהם, וכך מתגבש הנתיב האופטימלי. עיקרון זה יושם בפתרון בעיות אופטימיזציה קומבינטורית קשות כגון בעיית הסוכן הנוסע, ניתוב מנות ברשת ובקרת אורות תנועה.

ב-AntMiner+ מוגדרת סביבה שבה כל נמלה צועדת מנקודת מוצא לנקודת יעד ובכך בונה כלל סיווג. לכל משתנה מוגדרת קבוצת קודקודים, ולמשתנים סדרתיים (כגון יחס שוטף) מוגדרות שתי קבוצות כדי לאפשר בחירת תחומים. רק הנמלה שבנתה את הכלל הטוב ביותר מעדכנת את ה-פרומון. התהליך מתכנס כאשר נתיב אחד מקבל את רמת הפרומון המרבית. הכלל המתאים נשלף ומוסף לסט הכללים, הנתונים המכוסים על ידו מוסרים, והאלגוריתם ממשיך לאתר כללים נוספים עד לקריטריון עצירה. יתרון בולט של השיטה הוא האפשרות לשלב ידע מוקדם של הדומיין, כך שהמודל המופק יהיה אינטואיטיבי ומתיישב עם הציפיות המקצועיות.

טבלאות החלטה

סט הכללים שנוצר על ידי AntMiner+ מומר לטבלת החלטה, שהיא ייצוג טבלאי המחלק את מרחב ההחלטה לארבעה רבעים: תנאים ופעולות, נושאים ורשומות. כל שורה מייצגת כלל סיווג. טבלאות החלטה ניתנות לכיווץ על ידי איחוד שורות סמוכות לוגית המובילות לאותה פעולה, כדי לקבל ייצוג תמציתי ויעיל יותר של הידע הגלום בנתונים. השימוש בטבלאות חד-פגישה, שבהן השורות בלעדיות זו מזו, מאפשר אימות ווידוא של המודל.

הגדרת הניסוי

נתונים ודגימה

אותרו כל החברות הרשומות בבורסות AMEX, NASDAQ ו-NYSE בין השנים 2002 ל-2004 בבסיס הנתונים Worldscope. לאחר סינון לפי דרישות נתונים מינימליות, התקבל מדגם של 10,318 תצפיות חברה-שנה, מתוכן 271 חוות דעת מסויגות ו-10,047 חוות דעת נקיות. בוצעו ניסויים על שלושה סוגי מדגמים: מדגם מותאם (271 חברות לכל קבוצה, עם התאמה לפי שנה, גודל וסיווג תעשייתי), מדגם מאוזן (271 חברות לכל קבוצה, בחירה אקראית), ומדגם מלא הכולל את כל התצפיות.

משתנים

המשתנה התלוי הוא דמי REPORT, שמקבל ערך 1 אם הונפקה חוות דעת עסק חי ו-0 אחרת. המשתנים הבלתי תלויים כוללים מדדי נזילות (יחס שוטף, תזרים מזומנים לחלק בהתחייבויות, שינוי בהון חוזר לסך נכסים), מדדי פירעון (התחייבויות לסך נכסים, שווי נקי לחלק בהתחייבויות), מדדי רווחיות (רווח נקי לסך נכסים, רווחים נצברים לסך נכסים, משתנה דמי להפסד נקי ולהפסד תפעולי), ומשתנה גודל (לוגריתם טבעי של סך הנכסים). כמו כן נכלל משתנה דמי המצביע אם המבקר הוא אחת מארבע משרדי הביקורת הגדולים.

טכניקות ההשוואה

כבסיס להשוואה נכללו: רגרסיה לוגיסטית, עץ החלטות C4.5, חיזוי לפי רוב (תמיד מנבא את הקבוצה הגדולה), ומכונות וקטור תמך עם גרעין RBF שפרמטריו נקבעו בחיפוש רשת. כדי לצמצם השפעה של חלוקה מקרית של הנתונים, בוצעו 10 ריצות עם אקראיות בחלוקה לסטים.

תוצאות ודיון

ad

ביצועי מכונות וקטור התמך לא היו טובים באופן מובהק מאלה של הרגרסיה הלוגיסטית, דבר המרמז שהנתונים הם ליניאריים ברובם. AntMiner+ הניב דיוק נמוך מעט מ-C4.5, אולם ההפרש לא היה מובהק ברמת 1%. יתרון מרכזי של AntMiner+ הוא שהוא מייצר מספר כללים מוגבל ואינטואיטיבי, לעומת C4.5 שיצר בממוצע כמעט פי שניים יותר כללים.

סט הכללים שנוצר על ידי AntMiner+ כולל ארבעה כללים עיקריים לחיזוי חוות דעת עסק חי:

  1. אם קיים הפסד נקי ורווחים נצברים לסך נכסים קטן מ-0.05, אזי יש לצפות לחוות דעת עסק חי.
  2. אם לוגריתם סך הנכסים קטן מ-10.813 ויחס ההתחייבויות לנכסים גדול מ-1 או שווה לו, אזי יש לצפות לחוות דעת עסק חי.
  3. אם היחס השוטף קטן מ-1 וגם לוגריתם סך הנכסים קטן מ-10.81 וגם רווחים נצברים לסך נכסים קטן מ-0.05, אזי יש לצפות לחוות דעת עסק חי.
  4. אם שינוי ביחס התחייבויות לנכסים גדול מ-0.094 וגם שינוי בהון חוזר לנכסים קטן מ-0.241, אזי יש לצפות לחוות דעת עסק חי.

כאשר סט הכללים הומר לטבלת החלטה, התקבלו שבעה משתנים מנבאים מרכזיים: מדד אחד לגודל החברה, שני מדדי רווחיות, שני מדדי נזילות ושני מדדי פירעון. המשתנים הדומיננטיים ביותר (ברמות העליונות של הטבלה) היו שני מדדי הרווחיות, בהתאם לממצאי מחקרים קודמים. בנוסף, מהמודל עולה שסבירות גבוהה יותר לחוות דעת עסק חי קשורה בסך נכסים נמוך יותר, יחס שוטף נמוך יותר, ירידה בהון חוזר לסך נכסים ועלייה ביחס התחייבויות לנכסים. כיווני ההשפעה של המשתנים תואמים את הממצאים בספרות, מה שמוסיף לאמינות המודל ולשימושיותו.

שיעור הסיווג הנכון הכולל היה 68.2% במדגם המותאם, 76.2% במדגם המאוזן ו-97.2% במדגם המלא. אימות המודל על ידי שותף בכיר במשרד ביקורת גדול אישר שהיבט האינטואיטיביות הוא הקריטי ביותר לקבלת המודל בפועל. הביצועים הכוללים של המודל דומים לאלה של הרגרסיה הלוגיסטית, אך טבלת ההחלטה מספקת לרואי החשבון כלי ידידותי ואינטואיטיבי שניתן לשלב בנהלי העבודה השוטפים.

מסקנות

ההצלחה של כריית נתונים בתחום חוות דעת עסק חי נובעת משלושה גורמים: ראשית, קיים מאגר נתונים גדול של חברות מבוקרות. שנית, ההחלטה בדבר עסק חי היא מורכבת ובעלת השלכות נרחבות הן על החברה הנבדקת הן על המבקר, ולכן כלי תמיכה בהחלטה הם בעלי ערך רב. שלישית, פרשיות חשבונאיות שהתגלו בשנים האחרונות מדגישות את חשיבות הביקורת הנאותה ומגבירות את הרלוונטיות של מודלים חיזויים כאלה.

בעוד שבספרות הקיימת השתמשו בעיקר ברגרסיה לוגיסטית, הוכחה כאן יכולת יישום של טכניקות כריית נתונים מתקדמות יותר בתחום הביקורת. טבלת ההחלטה האינטואיטיבית שנוצרה ניתנת לשילוב קל בנהלי הביקורת ותסייע לאחידות רבה יותר בהנפקת חוות דעת עסק חי. ממצאי ההשוואה בין שיטות הדגימה מראים שהדיוק משתנה בין השיטות, אך דירוג הטכניקות זו ביחס לזו נשמר ללא תלות בשיטת הדגימה. לבסוף, ניתן לשפר עוד יותר את המודל על ידי שילוב מידע פרטי שנמצא ברשות משרד הביקורת ואינו זמין לציבור.

מקור

Martens, D., Bruynseels, L., Baesens, B., Willekens, M., & Vanthienen, J. (2008). Predicting going concern opinion with data mining. Decision Support Systems, 45(4), 765–777.

שיתוף המאמר:

פוסטים אחרונים

קטגוריות

קטגוריות
דילוג לתוכן