למצוא, לא לחפש
"מכל סוגי השירותים באינטרנט, זהו סוג השירות שבו אנו משתמשים בתכיפות הגדולה ביותר, למרות שאינו עונה לצורך האמיתי שעבורו אנו מפעילים אותו". אם הייתם צריכים לנחש מה הייתה השאלה לתשובה זו, הייתם ודאי עונים "מהו מנוע חיפוש?"
זהו המענה הנכון, מכיוון שאף שאנו מפעילים מנוע חיפוש כדי למצוא מידע, השירות אינו עושה זאת בעבורנו: הוא מציג לנו תוצאות של חיפוש, ומותיר לנו את האתגר לבחור מתוכן את דפי האינטרנט שמתאימים לכוונתנו ולאתר בהם את הדפים שאנו זקוקים להם.
מכיוון שרובנו רגילים כל כך לתהליך זה, אנו שוכחים שלא היינו מסכימים לקבל סוג כזה של שירות מבני אדם. נסו לדמיין לקוח הפונה למוכר בחנות גדולה בבקשה למצוא נעל ריצה לילד בן 12, ומקבל בתשובה הפניה לכמה מחלקות − למחלקת בגדי ילדים, למחלקת מכשירי כושר, ולכל מחלקות הנעליים.
המצב בשטח גרוע יותר: חיפוש בגוגל של "נעל ריצה לילד בן 12" העלה את התוצאות הבאות: שאלה על כאב בזמן ריצה בפורום אורתופדיה כללית, דיון בפורום לספורט פנאי, ביקורת על תעשיית נעלי הריצה, והמלצות על תוכניות טלוויזיה. אכן, רובנו יודעים כי יש דרכים טובות יותר לבצע חיפוש כזה, אך מדוע עלינו ללמוד שיטות כאלה, במקום לצפות מהמחשב שייתן לנו תשובה מדויקת כפי שאנו דורשים מהמוכר בחנות?
בשנים האחרונות הופיעו כמה אתרי אינטרנט שכוונתם לענות של שאלות בצורה אמינה ורלוונטית. לרוב פיתוחים אלה מצליחים רק בעבור סוג מוגבל של שאלות. לדוגמה, כאשר האתר ask.com נשאל "מי כתב את 'התפסן בשדה השיפון'?" הוא מוצא מיד את התשובה.
לעומת זאת, כאשר הוא נשאל "מתי נכתב 'התפסן בשדה השיפון'?" הוא לא מוצא תשובה ומציג תוצאות רגילות של חיפוש, בהן המשפטים "'התפסן בשדה השיפון' הוא ספר משנת 1951" ו"'התפסן בשדה השיפון' נכתב בשנות הארבעים".
שני המשפטים נכונים - הראשון מתייחס לשנת הפרסום והשני לתקופת הכתיבה - אך הם מראים כי גם באתגר פשוט זה, יש להתמודד עם משמעויות שונות אפשריות של השאלה.
התמודדות עם שפה טבעית (להבדיל משפות מחשב) דורשת הבנה של משמעויות ועמידה באתגרים רבים - הכרת כמות גדולה של מידע על העולם האנושי, שיפוטים ערכיים, הבנת מטאפורות ומשחקי מילים ועוד.
"ווטסון", על שם מייסד חברת IBM, תומס ווטסון [אילוסטרציה: photos to go]
ווטסון, בלי הולמס
הבעיות בהבנת שפה טבעית ידועות ולעתים נדרשת הגדרת מטרה שאפתנית עם מבחן הצלחה ברור כדי ליצור התקדמות משמעותית. חברת IBM עשתה זאת כאשר בנתה מחשב מיוחד ופיתחה עבורו תוכנה כדי להתמודד עם אלוף העולם בשחמט. בשאפתנות דומה, הכריזה לאחרונה IBM על כוונתה לפתח מערכת ממוחשבת שתוכל להתחרות מול שחקנים אנושיים מצטיינים במשחק "מלך הטריוויה".
מכיוון שרובנו רגילים כל כך לתהליך החיפוש, אנו שוכחים שלא היינו מסכימים לקבל סוג כזה של שירות מבני אדם
הפרויקט נקרא "ווטסון", על שם מייסד חברת IBM, תומס ווטסון. כדי למנוע מהמחשב יתרון לא הוגן הוא לא יהיה מחובר לאינטרנט בזמן התחרות. באופן זה המערכת נדרשת לאכסן בתוכה כמויות גדולות של המידע הזמין ברשת האינטרנט, ולארגן את המידע כך שיהיה זמין לניתוחים ולחיפושים מהירים.
לחם ושעשועים
IBM עדיין לא הכריזה על מועד הופעתה של ווטסון בתוכנית הטלוויזיה, אך מנהלי הפרויקט כבר החלו בתכנון האירוע עם מפיקי התוכנית. כדי ליצור עניין, שוקלים המתכננים לבחור מתחרים אנושיים מבין המנצחים הגדולים ביותר בעבר.
שאלות חשובות יותר בעבור ההצלחה בתחרות נוגעות לצורת התקשורת עם מנחה התוכנית. הוחלט כי השאלות יועברו לתוכנה בצורת טקסט: המתחרים האנושיים קולטים את השאלה בשמיעת המילים ובקריאתן על מסכי התוכנית. בעבור מתחרים אנושיים אלה "הישגים" מובנים מאליהם, אבל בעבור בינה מלאכותית הפיכת קלט חזותי וקוֹלי לטקסט היא עדיין דרישה גבוהה.
אך בסופו של דבר, השעשועים הבידוריים אמורים לשרת מטרות נוספות, ולתרום להתקדמות לקראת האפשרות למצוא תשובות במקום לחפש אותן.
דוגמה אחת לקושי של מענה על שאלות בעולם האמיתי היא השאלה "איפה יש X קרוב למקום שבו אני נמצא כרגע?" כאשר X הוא סיווג כלשהו, למשל בית מרקחת. אפשר להניח כי מיקומו של השואל ידוע, וכי בידינו רשימה של אתרים עם סיווגם ומקומם, ואכן, כמעט כל מכשיר ניווט יכול להציג תשובות לשאלות כאלה, אך כמו במקרה של מנועי חיפוש, גם כאן התרגלנו להמעיט בדרישותינו.
אם היינו שואלים עובר אורח, היינו מצפים לתשובות הרבה יותר מועילות. לדוגמה, התשובה האנושית תתחשב בזמן השאלה. אחרי חצות מדריך אנושי ינסה לכוון אותנו למקום שנראה לו שעדיין יהיה פתוח, מכיוון שהשתמש בהשערה כי השואל מעוניין לקנות משהו בבית המרקחת, וכי לשם כך על בית המרקחת להיות פתוח. המדריך האנושי יתחשב גם במצבו של השואל - למשל, האם הוא הולך רגל או נוסע ברכב, ויחליט בהתאם מה משמעות המילה "קרוב".
התמודדות עם שפה טבעית דורשת הבנה של משמעויות [אילוסטרציה: photos to go]
סינון חכם
למרות המאמצים, קשה למצוא הצלחות משמעותיות כאשר נושאי החיפוש אינם מוגבלים לתחומים ספציפיים שהתוכנה הותאמה אליהם במיוחד. עם זאת, קיימות גישות אחרות שמציעות שיפורים ועזרה בסינון התוצאות.
אחת הגישות היא ניסיון לאגד את תוצאות החיפוש במקבצים העוסקים בנושאים שונים. כך למשל תכונת "גלגל הפלאים" (Wonder Wheel) של חברת גוגל מציגה בעבור חיפוש שמו האנגלי של "התפסן בשדה השיפון", לצד תוצאות החיפוש הרגילות, את הנושאים: סלינג'ר, דמויות, עבודות להגשה, הסרט, ציטוטים, ועוד.
קיימים כלים רבים הנוקטים שיטות דומות או צורות אחרות של שיפור המהירות והדיוק של חיפוש באינטרנט, וכי קצב ההתקדמות בתחום זה גובר כתוצאה. אולי יום אחד נוכל לצפות ממחשבים למצוא תשובה לשאלותינו במקום לחפש אלפי דפים שבהם אולי מתחבאת התשובה.
ישראל בנימיני עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות.
מתוך: מגזין גליליאו
לעשיית מנוי, לקבלת גיליון מתנה
גולשים שקראו כתבה זו התעניינו גם ב: