לפני מספר שנים עשיתי עבודות של ניתוח נתונים (באקסל כמובן …) אצל מישהו, שהנתונים לא תמיד התאימו למגמות שהוא רצה להראות. הוא לא רצה לעוות את הנתונים,  אז מה הוא עשה, הוא דאג שהגרפים יתאימו את למגמות שהוא רצה להשיג. אז איך בדיוק הוא עשה זאת ? בכל מיני טריקים קטנים ומשחקים עם המראה של הגרף.

על מי אתה עובד ?

מכירים את זה שהמורה בבית הספר אומרת “מי שמרמה - מרמה רק את עצמו” , אז במציאות זה לא תמיד כך. בדוגמא שהבאתי, היה מדובר בארגון גדול, ואותו אדם, הציג את הגרפים האלו שוב ושוב בישיבות שונות, והצליח לשנות החלטות משמעותיות רק בזכותן.

אנחנו רואים הרבה מאוד גרפים ביום יום, אז איך מתגוננים מפני דברים כאלו ?

סליחה - מה הנוסחא של קו המגמה הזה ?
סליחה - מה הנוסחא של קו המגמה הזה ?
סליחה - מה הנוסחא של קו המגמה הזה ?

הפתרון טמון בידע

הפתרון נעוץ בידע - אם נכיר את השיטות בהן אפשר לרמות בגרפים, נוכל תמיד לשאול את השאלות הנכונות, להסתמך על מידע נכון, ולקבל החלטות נכונות יותר.

אני מציג פה מספר נקודות עיקריות , חלקן ויזואליות, וחלקן סטטיסטיות/טכניות (כמובן שיש עוד שיטות, אבל הנקודות האלו חוזרות על עצמן הרבה) :

  1. ציר Y קטוע בגרף עמודות  - אם תראו ציר Y שמתחיל מנקודה שאיננה אפס, יש סיכוי שיוצר הגרף רצה להדגיש  את הגובה של העמודות, ובכך להעביר מסר שרמת השינוי קטנה/גדולה יותר .בדוגמא הבאה - מוצג אותו גרף בדיוק כאשר בצד שמאל, התחלתי את ציר ה-Y מ-8 במקום מ-0, כך הדגשתי את המכירות של מעיין מאוד. (ברור שמעיין באמת מכרה יותר, אבל בגרף השמאלי, נראה כאילו דני בקושי מכר משהו…).

    דוגמא לרמאות בגרף Excel - 1
    דוגמא לרמאות בגרף Excel - 1
    דוגמא לרמאות בגרף Excel - 1

  2. עמודות חסרות בציר ה-X  - כשרוצים להדגיש משהו, מחסירים את מה שלא מתאים למגמה, זו יכולה להיות תקופה עם מכירות חלשות, מחלקה “בעייתית”, מוצר לא רווחי וכדומה. תמיד בדקו אם הכל מוצג.

  3. קו מגמה

    1. קו מגמה שמוצג על גרף עמודות תלת מימדי - אין חיה כזו! אקסל, גם ב-2013 לא מסוגל להציג קו מגמה על גרף תלת מימדי, מה שאומר בוודאות > שמישהו שרטט אותו בעצמו.
    2. קו מגמה ללא הצגה של ערך ה-R בריבוע - החישוב המקובל ברוב הדברים “הפשוטים” (מכירות, הוצאות וכדומה) הוא חישוב לינארי, אם מישהו מזהה מגמה חלשה, ורוצה להציג קו מגמה חזק, הוא יכול בקלות לבחור בקו מגמה אקספוננציאלי, זה נראה נהדר, העניין הוא שבמציאות…. זו לא בדיוק המגמה.בעיקרון, מראיה בלבד, קשה לדעת האם הקו הוא ליניארי או אחר, ולכן חובה לבקש מיוצר הגרף להציג את ערך ה-R בריבוע, ככל שה-R קרוב ל-1 , זה מעיד על מהימנות גדולה יותר של קו המגמה, כלומר שקו המגמה המשורטט מציג באמת מגמה שקיימת. (צירפתי קישור למאמר טוב בנושא בסוף הפוסט).
    3. שימוש בממוצע נע כדי ליצור קו מגמה חלק במיוחד - ממוצע נע היא טכניקה סטטיסטית פשוטה מאוד, שאומרת שאנו קובעים כמות מסוימת של תקופות , נניח 3 חודשים, וכל נקודה על הגרף מציינת ממוצע של 3 התקופות הקודמות, נניח בנקודה של אפריל - נציג ממוצע של ינואר+פברואר+מרץ. זה מאפשר ליוצר הגרף “להחליק” את הגרף בצורה מדהימה, ואם עושים על זה קו מגמה , זה יוצא מדהים. במקרה זה, אי אפשר לזהות את זה מהגרף , וצריך פשוט לשאול האם זה מבוסס הגרף מבוסס על הנתונים עצמם, או על ממוצע נע.
  4. צבעוניות שמגישה אספקט מסוים  - גרף צבעוני, נראה משובב עין, ויוצר רושם ראשוני שקשה מאוד להמיר. אבל כולנו יודעים שאקסל מאפשר לצבוע כל אלמנט בגרף בנפרד , אז אם הדגישו את פרוסת העוגה בצבע זועק, או אחד מהעמודות מודגש במיוחד, יש לראות אם הנתונים תומכים בהדגשה (צירפתי קישור למאמר על פסיכולוגיה של הצבעים בסוף הפוסט).

  5. גודל מדגם קטן, או מדגם לא מייצג  - כאשר אנחנו בוחנים האם משהו מסוים מוצלח או לא רק על סמך מדגם, ולא על סמך כלל הנתונים, חובה לבדוק שהמדגם מייצג. מקובל שמדגם מייצג הוא לפחות 30 יחידות לפחות. פחות מזה, - לא מייצג. בנוסף לכך, יש כמובן נוסחאות לבדיקת מהימנות המדגם (צירפתי קישור בסוף המאמר).

יש עוד הרבה מאוד שיטות לעוות  נתונים או גרפים, אבל העיקר הוא לשמור את הראש על הכתפיים, ולזכור שלא תמיד כל מה שמוצג, באמת משקף נכונה את הנתונים.

קישורים להרחבה :

איך לבחור את קו המגמה המתאים ביותר  - מתוך אתר מיקרוסופט ישראל

נוסחא לגודל מדגם - מתוך וויקיפדיה

פוסט של קולגה על נושא קרוב - הדגמה על גרף של כיפת ברזל מתוך Ynet.

מאמר על פסיכולוגיה של צבעים בשיווק (אנגלית)