xcvbxc
BERLIN, GERMANY - SEPTEMBER 25:  Patrick Makau of Kenia celebrates victory and a new world record during the BMW Berlin Marathon on September 25, 2011 in Berlin, Germany.  (Photo by Martin Rose/Bongarts/Getty Images)

“משחרב בית במקדש, ניתנה הנבואה לשוטים” (בבא בתרא, יב/ב)

רקע

בשנת 2011 חזינו בשיא עולם במרתון, שיאי מסלול בכל המרתונים הגדולים וריבוי תוצאות של 2:03- 2:05.  עם ההתלהבות התעוררה גם הסקרנות, האם אנו חווים שינוי מהותי וייחודי בריצת המרתון? האם קרב היום שבו יישבר מחסום השעתיים? מהו גבול היכולת האנושית? במאמר להלן, טענות אלו נחקרות באופן מעמיק ושיטתי. תוך שימוש במתודולוגיה ברורה ומוקפדת, נבחן ומאומץ מחדש מודל מתמטי לבדיקת השאלות שהוצג בעבר בפורום זה. עיקר המאמר מפרט את תהליך הבדיקה ואת התוצאות, שהבולטות בהן:

  1. ריצת המרתון לא עברה שינוי מהותי ב- 30 השנה האחרונות. שיא העולם תואם את התחזיות הסבירות (בהתאם למודל) מאז שנת 1980.
  2. ריצת השעתיים למרתון עדיין רחוקה – על פי התפתחות הענף עד ימינו, מחסום זה ישבר עוד כשלושים עד ארבעים שנה.

מבוא

במאמר זה מוצג מודל התפתחותי של שיאי ריצת המרתון. המודל המתקבל מאפשר לאמוד את השלב בו נמצא הענף, לחזות את שיאי מרתון העתידיים ולתת הערכה, מסויגת מאד, של גבול היכולת האנושית בתחום.

הגישה המחקרית על פיה מפותח המודל מבוססת על פיתוח מודלים דומים המקובלים בספרות המדעית לתיאור תהליכי התפתחות של מאפיינים שונים באוכלוסיה. בניתוח, אנו מניחים קיום של תהליכים התפתחותיים כגון: ניסיון שנצבר באוכלוסיה, התפתחות פיזית של כלל האוכלוסייה, שיפורים טכנולוגיים, שיפור בהבנת הפיזיולוגיה האנושית, ידע בנושאי תזונה ובריאות ומודעות לענף.

המודל הוצג לראשונה לפני כשנתיים בפורום זה במאמר הנושא את השם: על גבול היכולת האנושית – פרק ב’. כבר אז הוצג הדיוק הגבוה שבו המודל מסוגל, באמצעות שלושה פרמטרים מחושבים, לחזות את השיא שהושג בשנת  2008 על פי תוצאות שיאי המרתון שהיו ידועות בשנת 1980.

התמריץ לחזרה והעמקה במודל, הוא, בבחינת חוכמה שלפני מעשה. המודל שהוצג לפני שנתיים וכאמור חזה בדיוק של שניות בודדות את השיא מ- 2008, חוזה בדיוק דומה את שיאו האחרון של מקאו שנקבע במרתון ברלין 2011.

הטענה השאפתנית מאוד שעולה מהמאמר היא שכל הידע הקיים בתחום ריצת המרתון, ניתן לרדוקציה לשלושה מספרים בלבד. כל המאמנים, כל הספרים, כל טכניקות האימון ושיטות התזונה,  הכניסה של הקנייתים והיציאה של האתיופים, עליית הפופולאריות של ריצות המרתון והשיפור בתחום הביגוד וההנעלה, כל האפקט המצטבר של אינסוף הגורמים הקטנים שמשפיעים על ריצת המרתון מתכנס לכדי שלושה מספרים ותו לא.  שלושה מספרים, אשר במידה ומודל כזה אכן קיים, יאפשרו לנו להעריך את התפתחות השיא בעתיד.

מאמר זה מהווה הצרה והרחבה של המאמר הקודם, ההצרה מתבטאת בהסרת ניתוח ריצת ה – 100 מ’ שהוצגה במאמר הקודם. עיקר ההרחבה מתבטא בבדיקה מעמיקה של האיכות התיאורטית של המודל. בדיקה הנדרשת דווקא מכיוון שאיכות החיזוי עדיין גבוהה באופן מפתיע. במילים אחרות, עיקר המאמר הוא בהתמודדות עם השאלה: האם המודל הוא בבחינת ניחוש מוצלח או מודל העונה על קריטריונים מחמירים של מחקר מדעי?

שתי הערות חשובות ואזהרה

הערה ארוכה: נער הייתי גם זקנתי. שנים של עיסוק בתורת הכאוס אינן יכולות שלא לטעת בי חשדנות עמוקה בכל הקשור לתחזיות. מצד שני, ניסיון לחיזוי של העתיד הוא אינסטינקט אנושי בסיסי. הפסקנות והנחרצות שמבטא מאמר זה אינה מעידה על הלך הרוח הסקפטי בו נכתב והאפשרות שהדיוק המתקבל הוא תוצאה מקרית אינה בלתי סבירה. למה אם כך להעלות אותו על הכתב? מאותה סיבה שבקטעי ההיילייט בכדורסל מראים סל מחצי מגרש, אף פעם לא תדע אם זה יכולת או מקריות, אך עדיין זה שווה צפייה.

הערה קצרה: מגבלה אינהרנטית של ניתוחים אבולוציוניים היא שהם נכונים עד לקפיצה האבולוציונית הבאה, להסבר נוסף, פנה לדינוזאור הראשון שתפגוש.

אזהרה: למרות הסיפא של ההערה, המאמר מתיימר להיות כתוב בלשון מדעית מבוססת ומדויקת ככל הניתן. הגבול בין הביסוס והדיוק לטרחנות הוא דק, ולצערי כנראה גם נחצה יותר מפעם במאמר.

מהו מודל טוב?

מטרתו של סעיף זה היא לבסס, ככל הניתן, את איכותו של המודל. בניסוח בוטה יותר, המטרה היא להראות  שהמודל אכן קולע לתופעה אותה אנו חוקרים ואינו בבחינת ציור עיגול המטרה סביב נקודת הפגיעה של החץ. כפי שיוסבר בהמשך, לכל אוסף נתונים ניתן לבנות יותר ממודל אחד. לכן, על מנת לוודא כי המודל המוצע איכותי (וכאמור, לאו דווקא יחיד), יש לנתח בפירוט ולהצדיק במידת הניתן את כל הנחות המודל על סמך קריטריונים אפיסטמולוגיים של מחקר מדעי.

בסעיף זה מוצגים ארבעה קריטריונים לאיכותו של מודל. קריטריונים אשר, כפי שיוצג בהמשך המאמר, מתאימים לאמידת איכותו של המודל ההתפתחותי של שיאי ריצת מרתון.

1. פשטות

ה-”תער של אוקם”, עיקרון פילוסופי בן מאות שנים, משמש אבן בוחן להשוואת מודלים. נניח שברשותנו שני מודלים המתארים תופעה מסוימת בצורה שווה, כלומר מסבירים את כל התצפיות וכמובן שאינם נסתרים על ידי אף תצפית. העיקרון קובע כי המודל הטוב יותר מבין השניים הוא הפשוט יותר. בניסוח של אוקם – זה המניח פחות ישים (=ישויות).

להסבר אנושי יותר, מומלצות השורות הבאות של מאיר אריאל:

הידעתם מה מתרחש בכל הבוסתנים
בלילה בו שותקים הצרצרים והתנים?
מופיע לו פתאום מאי משם או אי מזה
אפס איזה מן גמד ענק, אני חושב כזה
השד יודע איזה שד אותו כל כך מריץ
לכל המשמשים ניגש הוא ועושה חריץ
בכל התפוזים הוא מנקב נקבוביות
ובפירות הנגועים הוא שם רקבוביות
 

על פי העיקרון היבשושי של התער של אוקם, מודל המסביר את הופעת הנקבוביות של התפוזים כחלק מתהליך הצמיחה של פרי התפוז, יהא עדיף על מודל המניח יש נוסף: גמד ענק המנקב את הנקבוביות. (יבשושי אמרנו) .

מעבר לחוסן האפיסטמולוגי, כוחה של הפשטות הוא בהימנעות מסכנה ידועה בבניית מודלים: “התאמת יתר לנתונים”: בניית מודל מורכב מאוד (קרי בעל הרבה פרמטרים) אשר מתאים להסבר התוצאות. מודל שכזה בד”כ מותאם בצורה טובה לתוצאות הניסויים, אולם נוטה להביא לאיכות חיזוי נמוכה עבור ניסויים עתידיים. נספח א’ מדגים את תופעת התאמת היתר ומגבלותיה.

קריטריון הפשטות קובע אם כן שהמודל המוצע חייב להיות פשוט ככל הניתן. דרישה הנדונה בהרחבה בסעיף הנחות המודל להלן.

2. יכולת חיזוי לנתונים עתידיים

המתודולוגיה המדעית מבדילה בין רמות חוזק של תיאוריות, נתבונן בשתיים מהן:

רמה 1: תיאוריה המסבירה את כל התצפיות הקיימות. פרשנות (אמנם מעט חופשית, אך מקובלת בפילוסופיה של המדע)  של משפט סקולם לבנהיים, טוענת שלכל קבוצה של תצפיות ניתן להתאים יותר מתיאוריה אחת. ולכן, מדענים דקדקנים נוטים לחשוד בתיאוריה אשר כל מה שיש לה להציע הוא התאמה לכל התצפיות הנתונות.

רמה 2: תיאוריה חזקה יותר, תיאוריה אשר לאחר הצגתה, מסבירה תופעות אשר לא נמדדו או לא היו ידועות בזמן הצגתה.

המסקנה העיקרית העולה מסעיף זה היא כי מעבר מרמה 1 לרמה 2, מחייב פרק זמן בו תיאספנה תצפיות נוספות, אמינותו של המודל המוצע תגדל אם התצפיות הן של תופעות אשר לא היו מוכרות או לא היו ניתנות להימדד לפני כן.

בין השנים 1905-1919 התייחס עולם המדע בחשדנות לתורת היחסות אשר לא רק שהייתה שינוי מחשבתי ותפיסתי עמוק, אלא אף פותחה על ידי יהודי, רחמנא לצלן. ב – 1919 נשלח אסטרונום אנגלי, סר ארתור סטנלי אדינגטון,  לבצע ניסוי שמטרתו להוכיח את תורת היחסות (יש הטוענים כי אדינגטון נשלח על ידי האנגלים, חסידי ניוטון, על מנת להפריך את תורת היחסות). הניסוי מדד בזמן ליקוי חמה את אחד מהניבויים המהפכניים של  התיאוריה: התעקמות האור במעברו ליד מסה גדולה. הניסוי, שהעלה את תורת היחסות מרמה 1 לרמה 2, נחשב לנקודת המפנה בה אומצה תורתו של איינשטיין בלא עוררין על ידי הממסד המדעי והמדענים עצמם.

3. פיזיקאליות

הקריטריון הנדון בסעיף זה הוא מקרה פרטי של הקריטריון הראשון, הפשטות. עם זאת, זהו קריטריון חשוב ומובחן לכשעצמו. ובמאמר זה נשתמש בו לבחינת המודל המתקבל.

בהגדרה, ניתן לקרוא למודל פיזיקאלי, כאשר ניתן להצמיד לערכים שלו משמעות פיזיקאלית ולא רק מתמטית.  הדוגמה הפשוטה להלן (מבוססת על מקרה אמיתי …), תמחיש את ההגדרה.

איור 1 מביא מדידות של רמת הורמון בגופו של תינוק, המדידות , המסומנות בצלבים, נלקחות החל מהשבוע הראשון לחייו של התינוק ובמשך 20 שבועות.

איור 1 – מודל פיזיקאלי מול מודל מתמטי

הקו הירוק המלא הוא קו הרגרסיה, כלומר הקו הישר אשר מתאר במינימום שגיאה ריבועית את הערכים הנמדדים (ראה נספח א’ להגדרה מתמטית של מינימום שגיאה ריבועית). נוסחת הקו המחושב בדוגמה הספציפית שלפנינו, נתונה על ידי הפונקציה:

y=at+b;       a=0.0966;b=-0.0914

כאשר t הוא גיל התינוק בשבועות.

ניתן להתייחס לנוסחת הקו הישר המובאת לעיל כמודל המתאר את רמת ההורמון ומאפשר שיערוך של רמת ההורמון בגיל מסוים בדיוק רב.  על מנת להתייחס למודל זה כמודל פיזיקאלי יש להצמיד משמעות פיזיקאלית לכל אחד מהפרמטרים. במקרה זה הייחוס אינו נתון לפרשנות: הפרמטרaמציין את קצב עליית ההורמון, והפרמטר b מתאר את הרמה בזמן הלידה  (t=0® y=b) .

הצמדת המשמעות אכן ברורה, אך הנתון הפוסל את אפיון המודל כמודל פיזיקאלי הוא העובדה שהערך של b שלילי, מה שגוזר כי על פי פרשנות זאת רמת ההורמון בזמן הלידה שלילית. כפועל יוצא, המודל המחושב אינו פיזיקאלי.

4. שיחזוריות

נושא השיחזוריות של המחקר המדעי, הכרוך גם בנושא האובייקטיביות המדעית הוא נושא מורכב ורחב כים. מבלי להיכנס לעומק, דרישה בסיסית מניסוי מדעי היא שניתן לחזור עליו באותם תנאים ולקבל תוצאות זהות. ניסוי קונטינגנטי – חד פעמי, אשר אינו ניתן לשחזור, יאלץ תמיד להתמודד עם החשד בהטיה כלפי התיאוריה בה הוא תומך, ובמקרה חריף יותר, אך לא מופרך – זיוף.

הניסוי החזק ביותר מבחינת שיחזוריות הוא ניסוי שבו החומר הניסויי ודרך השגתו נגישים לכל חוקר. בצורה דומה, מודל חזק מבחינת השיחזוריות הוא מודל אשר כל חוקר אשר ירצה לשחזרו יוכל לעשות זאת באופן מלא ולקבל את אותן תוצאות בדיוק.

הנחות המודל

מטרתו הלא טרוויאלית של סעיף זה היא להוכיח מדוע המודל המוצע עונה על קריטריון התער של אוקם, כלומר להוכיח מדוע זהו המודל הפשוט ביותר, או בניסוח יותר קונקרטי, מדוע זהו המודל אשר מחייב מספר מינימאלי של פרמטרים.

המתודה הננקטת היא על ידי בחינת המספר המינימאלי של הנחות אותם צריך להניח בבואנו לבנות מודל מהסוג הזה, והתאמה של פרמטר יחיד לכל הנחה. גרפית נתאר זאת באיור הבא:

איור 2: מתודת עמידה בקריטריון הפשטות

הטיפולוגיה של התפתחות ערך של תכונה מסוימת באוכלוסיה (למשל גובה ממוצע, שיא לריצת מרתון וכו’) משתנה מעט כאשר מדובר בערך עולה או יורד עם ציר הזמן. המקרה הפשוט יותר הוא המקרה שלפנינו בו ערך התכונה יורד עם ההתפתחות שלה וחסום מלמטה. במקרה שכזה, יש מספר שמתחת אליו בוודאות הערך לא יגיע: לדוגמא: גובה שלילי או זמן ריצה של אפס שניות. תחת קביעה זאת ניתן להסתפק בשתי הנחות טריוויאליות והנחה מעט יותר מורכבת אחת:

הנחה טריוויאלית 1: ערך הפרמטר מונוטוני יורד אך חסום מלמטה (למי שלא נוח עם הנחה זאת שייקח את 10 שניות כזמן שיא לריצת מרתון כחסם תחתון). נסמן את הפרמטר הזה באות a.

הנחה  טריוויאלית 2: הפרמטר חסום מלמעלה (לשאינם מתמטיקאים הנחה טריוויאלית זאת עשויה להיות מיותרת, אך היא פוסלת משפחות שלמות של פונקציות). זמן ריצת המרתון הראשונה הוא הוכחה שיש ערך סופי שכזה. מסיבות של נוחות מתמטית שיתבהרו בהמשך נסמן את ההפרש בין החסם התחתון a שהוגדר בהנחה הראשונה לבין הערך הסופי באות b.

הנחה 3: כעת נותר להניח מהו תהליך הדעיכה, קרי מהו התהליך שמתאר את ירידת הפונקציה מהערך המקסימאלי. מבלי להיכנס לפירוט יתר ניתן להניח כי התהליך הפשוט ביותר – פשוט במובן שהוא דורש פרמטר אחד נוסף בלבד, המקיים את התנאי הזה הוא תהליך של דעיכה מעריכית בקצב השיפור.  כלומר קצב השיפור בפרמטר יורד מונוטונית עד לחסם תחתון. נסמן את הפרמטר הזה באות c.

המודל המוצע

פונקציה העונה לשלוש ההנחות לעיל תוך שימוש בשלושת הפרמטרים בלבד היא הפונקציה הבאה:

y(t)=a+b*exp(-(t—t0)c)    t≥t0

y הוא זמן הריצה בשניות, t הוא ציר הזמן, t0 הזמן ממנו נתונות התוצאות,  ו – a,b,c הם הפרמטרים אשר תוארו בסעיף הקודם ומתייחסים להתנהגות הספציפית של התופעה באוכלוסיה.

לקריאה נוספת בנושא מומלץ ספרו של סטיבן ג’יי גולד: “יד מלאה”1. קריאה נוספת, מעמיקה יותר, נמצאת בספרות העוסקת בתורת הכאוס2,3.

מעת לעת עשוי להתרחש שינוי מהותי באוכלוסיה\ענף (לדוגמה: מעבר למוטות פיברגלס בקפיצה במוט, סגנון פוסברי בקפיצה לגובה, שימוש בסמים),  שינוי זה יתבטא בשינוי של ערכי הפרמטרים  a,b,c משתנים. על פי גולד, עדיף במקרה זה להתייחס לכך כאל ענף חדש ולחשב עבורו את המקדמים החל מנקודת השינוי.

הערה: ניתן להשתמש בזיהוי ודאי של שינוי חד בערכי הפרמטרים כאינדיקציה להשתנות מאפיין בסיסי של הענף.

חישוב פרמטרי המודל

ליישום המודל נאספו נתוני שיאים במרתון. ערכי הפרמטרים חושבו באמצעות פונקצית האופטימיזציה  fminsearch   בספריית MATLAB.

הפרמטרים המתקבלים מובאים בטבלה 1 (כאמור a,b נתונים בשניות, c ביחידות של קצב לשנה).

פרמטר ערך מחושב
A 7079.27
B 3809.96
C 0.02078036

ברישום פרטני הפונקציה המתארת בצורה המיטבית (במובן של מינימום שגיאה ריבועית) את תוצאות המרתון היא בהתאם:

y = 7079.27+3809.96exp(-0.02078036(t-1896.33))

הערה: מטרתו של הפירוט בסעיף זה היא לספק את כל האינפורמציה הנדרשת על מנת לשחזר את דרכי חישוב המודל ובכך לענות בצורה מיטבית על הקריטריון הרביעי לאיכותו של מודל: שיחזוריות

באיור 3 מתוארים שיאי העולם במרתון (המעוינים השחורים שבאיור) החל מ- 1896 ועקומה המבוססת על הפונקציה לעיל המקרבת אותם.

איור 3 – שיאי עולם למרתון

בדיקת יכולות החיזוי של המודל

הערה: על מנת לשמור על הקשר עם המאמר הקודם בו הוצג המודל, הושארו במאמר זה הדוגמאות שעוסקות בשערוך השיא לשנת  2008.

תהליך החיזוי

כוחו של תהליך החיזוי נובע מהיכולת שלנו לבדוק אותו על ידי “נסיעה לאחור בזמן”, במילים אחרות, המודל מאפשר חיזוי של תוצאות עתידיות עבור שנת חישוב נתונה Y בשני שלבים:

1)      שלב חישוב הפרמטרים: ע”ס השיאים הידועים עד לשנה Y,  נחשב את הפרמטרים (a,b,c) של עקומה המקרבת אותם מיטבית (במובן של מינימום שגיאה ריבועית).

2)      שלב חישוב החיזוי: כאשר הפרמטרים ידועים, נציב את t – השנה העתידית אשר עבורה אנו מנסים לשערך את תוצאת שיא המרתון (t>Y). תוצאת החישוב היא הערך החזוי של שיא המרתון בשנה זאת.

לדוגמא, נניח שאנחנו בשנת 1950 (Y=1950) כל מה שידוע לנו היא היסטוריית שיאי המרתון עד שנה זו. (השיא בשנת 1950 היה 2:25:39) . נבצע את השלב הראשון, שלב חישוב הפרמטרים, תוך שימוש בהיסטוריה זו.

בשלב השני, שלב החיזוי, נציב את הערך של השנה עבורה אנו רוצים לחזות את השיא, לדוגמא, 2008.  איור 4 ממחיש את התהליך. בשלב הראשון אנו משתמשים בשיאים הידועים עד 1950 (המעוינים השחורים שמשמאל לקו המקווקו האנכי), מנתונים אלו אנו מחשבים את שלושת הפרמטריםa,b,c של העקומה המתוארת בקו כחול. נמשיך את העקומה עד 2008 ונקבל כי על סמך תוצאות שיאי המרתון ב- 1950 הערך החזוי לשיא ריצת המרתון בשנת 2008 הוא 2:19:35.  זהו שערוך מאוד לא מדיוק וניתן ללמוד ממנו כי:

1. עד לשנת 1950 הענף לא התייצב

או

2. המודל לא מתאים למציאות אותה הוא מתאר.

על מנת לקבוע מי הטענה הנכונה מבין השתיים, יש לבצע שערוכים עבור שנת חישוב מאוחרת יותר כפי שיודגם בהמשך.

איור 4 – הדגמה: חיזוי השיא ב – 2008 על סמך התוצאות הידועות ב – 1950

טבלה 2 מביאה את שיערוך תוצאות שערוך שיא המרתון בשנים 2002-2011 עבור שערוך המבוצע ב- בשנים  1950,1965,1980 ו -1995.  העמודה Record מביאה את השיאים. השורות המודגשות מייצגות שנים שבהם הושג שיא בריצת המרתון.

Estimated Record Based on Data known by: MarathonRecord Year
1995 1980 1965 1950
2:04:43 2:04:58 2:12:55 2:19:44 2:05:38 2002
2:04:34 2:04:49 2:12:52 2:19:43 2:04:55 2003
2:04:25 2:04:40 2:12:48 2:19:42 2004
2:04:17 2:04:32 2:12:45 2:19:41 2005
2:04:08 2:04:23 2:12:42 2:19:40 2006
2:04:00 2:04:15 2:12:39 2:19:39 2:04:26 2007
2:03:51 2:04:07 2:12:37 2:19:38 2:03:59 2008
2:03:43 2:03:59 2:12:34 2:19:38 2009
2:03:36 2:03:52 2:12:31 2:19:37 2010
2:03:28 2:03:44 2:12:29 2:19:36 2:03:38 2011

טבלה 2 – חיזוי תוצאות המרתון על פי תוצאות הידועות בעבר

מהטבלה עולה כי החיזויים בשנת – 1950 ובשנת- 1965 פסימיים , בעוד שבשנת 1980 וכמובן 1995, החיזויים מדויקים בצורה מפתיעה.

סטיית התקן של שגיאת החיזוי בין השנים 2002 ל -2011 היא בקרוב 20 שניות!

יציבות חיזויי המודל

בסעיף הקודם בדקנו את איכות החיזוי בארבע נקודות בדידות בזמן. על מנת שהחיזוי היא אינפורמטיבי, אנו חייבים להראות שהחל משנה מסוימת החיזוי מתייצב. וכמובן מתייצב סביב הערך הנכון.

שלב זה קריטי לאישוש איכות המודל. נחזור על תהליך החיזוי כאשר שנת החיזוי נעה בין 1950 ל – 2005. עבור כל שנה (הציר האופקי) חושבו ערכי הפרמטרים ע”ס נתוני השיאים עד אותה שנה, ואח”כ חושב השיא לשנת  2008 ולשנת 2011. סיכום התוצאות מובא באיור 5.

איור 5 – חיזוי תוצאת השיא לריצת מרתון לשנים 2008,2011

מהגרף עולה בבירור כי עד 1975 רמת השיא החזויה לתקופתנו ירדה בהתאמה. זוהי תוצאה אופיינית לענף אשר נמצא בתחילת דרכו. החל משנת 1975 בקירוב החיזוי התייצב וניתן היה לחזות כי השיא ב – 2008 ינוע סביב 2:04:10, והשיא ב – 2011 מתייצב סביב 2:03:45.

התייצבות הברורה של החיזוי החל משנת 1980 בקירוב, המודגמת באיור 5, מלמדת אותנו כי ריצת המרתון בתצורתה הנוכחית התייצבה בשנת 1980, ומאז נעה על מסלול אבולוציוני מוגדר היטב. מוגדר עד כדי כך שמאפשר לנו לשערך בטווח של שלושים שנה את תוצאות הריצה בדיוק גבוה.

תוצאות חזויות לעשור הקרוב

טבלה 3 מביאה את שיאי המרתון החזויים לעשור הקרוב. השערוך בוצע עבור שתי שנות חיזוי: 1980 ו -2011.

כפי שכבר ראינו התוצאות לא משתנות משמעותית בין השנים. קיים הפרש קבוע של כ- 7-8 שניות, הפרש זניח ולחלוטין לא משמעותי בהתחשב בסטיית התקן של השערוך (20 שניות) בשנים 2002-2011.

Estimated Record  2011 Data Estimated Record  1980 Data Year
2:03:43 2:03:36 2012
2:03:37 2:03:29 2013
2:03:29 2:03:22 2014
2:03:22 2:03:15 2015
2:03:16 2:03:08 2016
2:03:09 2:03:02 2017
2:03:03 2:02:55 2018
2:02:57 2:02:49 2019
2:02:50 2:02:42 2020

טבלה 3: חיזוי שיאי המרתון לעשור הקרוב

בפרשנות של התוצאות לעיל יש לזכור כי המודל ערך סטיית התקן של שגיאת שערוך הוא 20 שניות בקירוב. סטייה של 40 שניות מהשיא החזוי עדיין בתחום הסביר.

הערה: חדי העין יבחינו שהשיא החזוי ב- 2012, על פי נתונים שנאספו עד 2011 גבוה ב -5 שניות מהשיא הנוכחי. זאת תוצאה סבירה בהתחשב בעובדה שהחישוב ב -2011 מבוסס על שקלול של יותר מ-100 שנות מרתון ואינו כולל עדיפות לתוצאות השנים האחרונות.

מחסום השעתיים למרתון

בשינוי נושא נוסחה נקבל את השנה בה נגיע לזמן ריצה מסוים  Y:

Y=a+bexp(-(t-t0)c)

(Y-a)/b=exp(-(t-t0)c)

ln((Y-a)/b)=-(t-t0)c

t=t0– ln((Y-a)/b)/c

איור 6 מתאר את השנה החזויה בה ישבר מחסום השעתיים. כמצופה מתחזית לעתיד הרחוק, התוצאות הן בגדר של הערכת סדר גודל בלבד שנועד לתת אינדיקציה האם השיא צפוי להישבר בעשור הקרוב או לעולם לא (והקורא מופנה שוב לנספח א’ על מנת להפנים את המגבלות המהותיות של חיוץ).

מהגרף עולה, כי על פי המודל, ובהנחה שלא יהיה שינוי מהותי בענף, מחסום השעתיים אמור להישבר בעשור השישי של המאה הנוכחית (קרי בין השנים  2050 ל – 2060).

אם נכניס לחשוב התחשבות בסטיית התקן של שגיאת השערוך, עולה כי על פי המודל, קיימת אפשרות סבירה שמחסום השעתיים ישבר כבר בתחילת העשור החמישי (2042 ואילך).

איור 6 – השנה המשוערכת לפריצת מחסום השעתיים

חיזוי גבולות היכולת האנושית בריצת מרתון

ברוח כותרת המשנה של מאמר זה, חיזוי אמין לטווח ארוך הוא מקסם שווא. לאחר ההצהרה הזאת, עדיין קיימים שני טעמים, ישיר וחוזר, על מנת לבדוק את חיזוי היכולת האנושית בריצת מרתון.

הטעם הראשון, הישיר, נובע מעצם ההתייצבות של תוצאות החיזוי של המודל החל מ – 1980 והדיוק הרב של החיזוי. כפי שצוין קודם, ההתייצבות מצביעה בברור כי ענף ריצות המרתון נע מסלול אבולוציוני מוגדר היטב. באופן טבעי, מעניין לבדוק את גבולות היכולת האנושית בריצת מרתון החזויות על פי המודל.

הטעם השני, הטעם החוזר, מעט יותר מורכב. הקריטריון השלישי לאיכות של מודל, קריטריון הפיזיקאליות, שהוצג קודם, מחייב שתוצאות המודל תהיינה בעלות משמעות פיזיקאלית.  תוצאות המודל הן שלושת הפרמטרים a,b,c , משלושתם המעניין הוא הפרמטר a אשר כפי שנראה להלן מהווה את גבול היכולת האנושית. על מנת שהמודל יהא פיזיקאלי, תוצאת הפרמטר חייבת להיות פיזיקאלית. זמן שמחייב ריצה במהירות של 50 קמ”ש, קל וחומר זמן שלילי לא ייתפסו ככאלה וכפועל יוצא המודל לא יענה על הקריטריון.

כפי שהוצג קודם, המודל המחושב זה בנוי על נוסחת הדעיכה המעריכית:

y(t)=a+b*exp(-(t—t0)c)    t≥t0

כפי שניתן לצפות מנוסחה המתארת התפתחות שיא ריצה, כאשר הזמן מתקדם, ערך השיא החזוי יורד. הירידה עצמה (כמפורט בסעיף הנחות המודל) חסומה מלמטה, קרי אינה יורדת מתחת לערך מסוים. באם המודל נכון, הערך הזה הוא גבול היכולת האנושית.

חישוב הערך מתוך המודל מתקבל כאשר מציבים את הזמן t לאינסוף. במקרה זה, האקספוננט שואף לאפס, מכפלתו ב-b גם היא שואפת לאפס ומתקבל כי ערך הפונקציה מתכנס לערך של a.

מתקבל כי , גבול היכולת האנושית או הזמן המינימאלי האפשרי לריצת מרתון הוא ערך הפרמטר a המחושב במודל.

איור 7 מביא את התפתחות הערכת החיזוי של גבול היכולת האנושית עבור ריצת מרתון. עבור כל שנה החל משנת 1950 וכלה ב- 2010, חושב הפרמטר a על סמך נתוני השיאים שהושגו עד לאותה שנה.

איור 7 – חיזוי גבול היכולת האנושית בריצת מרתון

המסקנה שעולה מהגרף קוהרנטית לתוצאות קודמות שהוצגו במאמר. ערך הפרמטר a של הפונקציה, המתאר את גבול היכולת האנושית החזוי לריצת מרתון, יורד בין השנים 1950 ל -1980 ואח”כ מתייצב ללא שינוי משמעותי בשלושים השנה העוקבות על תוצאה של 1:58 בקירוב.

תוצאת הפרמטר המחושב עונה על קריטריון הפיזיקאליות. הערך המספרי של הפרמטר 1:58, ניתן לפרשנות פיזיקאלית של זמן ריצה מינימאלי.

סיכום:

מאמר זה מציג מודל התפתחותי של שיאי המרתון. על פי התוצאות המוצגות, המודל מאפשר חיזוי אמין של שיאי המרתון בימינו אלה על סמך התוצאות שהיו ידועות בשנת – 1980. במילים אחרות, בשלושים השנה האחרונות שיאי ריצת המרתון מתפתחים באופן שלא מצביע על כל שינוי דרמטי בענף.

בנוסף , המודל מאפשר הערכה של גבול היכולת האנושית בריצת המרתון: 1:58.

על מנת לאשש את איכותו של המודל הוא נבדק, ונמצא עומד, בארבעה קריטריונים מובחנים לאיכות: המודל פשוט, פיזיקאלי, חזה בצורה מדויקת בשנת 2008 את תוצאות 2011 ובנייתו ניתן לשחזור בצורה מלאה בידי כל המעוניין בכך.  אם זאת, בעתיד עסקינן, וכבר בעבר ייחדו את העיסוק בעתיד לשוטים.

נספח א’:

המדידות

נניח שברשותנו 10 מדידות של ערך מסוים: הערך יכול לתאר את עשרת השיאים האחרונים בריצת מרתון, ערך מניה בורסה במשך 10 ימים, או את כמות הגשם הכוללת במדינה ב-10 השנים האחרונות.

על מנת להשוות בין מורכבות במודל ליכולת החיזוי שלו, נפצל את הנתונים שלנו לשתי קבוצות: נניח ששבע המדידות הראשונות ידועות (measurements), נבנה מודל על פיהן וננסה לחזות את שלושת המדידות הבאות (prediction).

איור א1 מתאר את הערכים הנמדדים (מעוינים) . הקו האנכי הכפול מתאר את החלוקה למדידות ידועות (measurements) משמאל לקן, וקבוצת הבקרה (prediction) מימין לו.

איור א1 – המדידות והערכים החזויים

שיטת המידול והמודלים

שיטת המידול מבוסס על התאמת פולינום אשר יתאר בצורה המיטבית את 7 המדידות. קריטריון למיטביות הוא מינימום שגיאה ריבועית. ככל שדרגת הפולינום עולה, לפולינום יש יותר פרמטרים ובהתאם המורכבות שלו עולה. הטבלה הבאה מתארת את הפולינומים הנבדקים: (העמודה הרביעית RMS Error, תוסבר בהמשך):

Error RMS Number of parameters Algebraic Expression
1.31 2 a0+a1x Linear
1.19 3 a0+a1x+a2x2 Square
0.57 5 a0+a1x+a2x2+a3x3+a4x4 Quad

טבלה א1

התאמת המודל מבוצעת על ידי חישוב מתמטי אשר מוצא את אותם ערכי המקדמים (פרמטרים) השונים המביאים לשורש ממוצע השגיאה הריבועית (Root Mean Square – RMS) מינימאלית.

לדוגמא, עבור המקרה הריבועי (Square), ההתאמה תהא חישוב הפרמטרים a0,a1,a2 אשר יביאו למינימום את הביטוי:

כאשר  במקרה הזה:

xi=[1,2,3…7]

בצורה גרפית, ומעט פשטנית,  אנו מחשבים את ערכי מקדמים אשר אם נציב אותם בנוסחות המפורטות בעמודה השנייה של טבלה א1, יעברו קרוב ככל שניתן ל – 7 הנקודות שנמדדו.

איור א’2 מביא את תוצאות התאמת המודלים ל – 7 הערכים הראשונים. ניתן לראות מהאיור כי ככל שעולה רמת המורכבות של המודל, כן יש לו “גמישות” גדולה יותר אשר מאפשרת לו לעבור קרוב יותר למדידות ובכך להקטין את השגיאה הממוצעת.

לדוגמא, נשוה בין המודל הליניארי (הקו הישר) – למודל ה – Quad בעל חמשת הפרמטרים אשר מאפשר לעקומה לעלות ולרדת על פי המדידה.

הערכים המדויקים של ה – RMS מובאים בעמודה הרביעית של טבלה א1. ניתן לראות כי המעבר משני פרמטרים לחמישה הקטין את השגיאה לפחות מחצי (מ- 1.31 ל- 0.57)

איור א2 – התאמת המודלים למדידות

תוצאות החיזוי:

הגענו לשלב המעניין, כאמור, המקדמים השונים חושבו (כלומר נקבעו כך שיביאו למינימום שגיאה ריבועית) עבור שבעת הערכים הראשונים.  כעת נשתמש במקדמים הללו על מנת לחזות את קבוצת הבקרה: שלושת הערכים הנותרים . פעולת חישוב זאת נקראת חיוץ (אקסטרפולציה).

לא בלתי סביר לצפות שככל שהמקדמים מביאים לשגיאה נמוכה יותר בהתאמה לנתונים (קרי מינימום שגיאה ריבועית לשבע המדידות הראשונות)  כן יביאו לשגיאה נמוכה יותר בשלושת המדידות הבאות. בפועל, כאשר מספר הפרמטרים גדול מדי (והגדרת כמותית של “גדול מדי” גולשת מחוץ לתחום הדיון להלן), נקבל התאמה טובה מאוד לתוצאות הנמדדות והתאמה גרועה מאוד לתוצאות החזויות.

איור א3 להלן, מתאר תוצאות החיוץ עבור האיור וההתאמה שבוצעו לעיל. ניתן לראות כי המודל הלינארי מביא לתוצאות הטובות ביותר, בעוד המודל Quad בעל חמשת הפרמטרים חוזה ערכים מחוץ לתחום.

ביבליוגרפיה:

1. גולד, ס. ג’. (2003)  – “יד מלאה – התפשטותה של מצוינות, מאפלטון ועד דרווין”, דביר הוצאה לאור

2. Gersick C. J. G. (1991). “Revolutionary change theories: A multilevel exploration of the punctuated equilibrium paradigm”, Academy of Management Review, Vol. 16, No. 1, pp. 10-36.

3. Prigogine I. and I. Stengers (1984). “Order out of chaos”, Bantam Books Inc. USA.

כתיבת תגובה

האימייל לא יוצג באתר. (*) שדות חובה מסומנים

תגי HTML מותרים: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>