הבלוג שלנו

כל מה שצריך לדעת על האלגוריתם RankBrain של גוגל

'Gilad Sasson'
29 באוקטובר 2015
זמן קריאה: 6 דקות

RankBrain

מאתמול נודע שגוגל משתמשים במערכת בינה מלאכותית הנקראת RankBrain ונעזרים בה בדירוג תוצאות החיפוש. באתר Search Engine Land פרסמו את כל המידע שידוע עד כה על האלגוריתם RankBrain של גוגל, כולל איך הוא ישפיע על קידום אתרים בגוגל.

מהו האלגוריתם RankBrain של גוגל?

כפי שנחשף באתר החדשות Bloomberg ואושר בידי נציגי גוגל, RankBrain היא מערכת בינה מלאכותית שמסייעת בעיבוד תוצאות החיפוש.

Rank Brain בינה מלאכותית

 

לא מדובר במערכת בינה מלאכותית טהורה, מהסוג שאפשר למצוא בספרי מדע בדיוני, המסוגלת להשתוות לאינטליגנציה של בני אדם מבחינת יכולת הלמידה והסקת המסקנות העצמאית. אבל המערכת משתמשת בלמידה חישובית (Machine Learning), כלומר מלמדת את עצמה לעבוד, במקום לקבל הנחיות מבני אדם או לפעול לפי הגדרות התוכנה. במקרה של RankBrain שני המושגים למידה חישובית ובינה מלאכותית משמשים כמילים נרדפות ואפשר להחליף ביניהם.

 

מה הקשר בין RankBrain ואלגוריתם הדירוג של גוגל?

יש להדגיש ש-RankBrain אינו אלגוריתם דירוג חדש, והוא חלק מאלגוריתם החיפוש הכללי של גוגל, אותה מערכת שמשמשת למיון מיליארדי הדפים הרשומים באינדקס של גוגל ולקבוע אילו מהם רלוונטיים ביותר לשאילתות חיפוש ספציפיות. אותו אלגוריתם קיבל ב-2013 את השם Hummingbird (קוליברי).

אלגוריתם החיפוש hummingbird (קוליברי)

Hummingbird או קוליברי הוא אלגוריתם החיפוש הכללי, הוא מטפל בכל שאילתות החיפוש ומורכב מכמה חלקים בהם אלגוריתם פנדה, פינגווין, המתמקדים במלחמה בספאם, אלגוריתם ההתאמה למובייל שנועד לתגמל אתרים ידידותיים למשתמש במובייל ועוד. אם כן, RankBrain הוא כנראה הרכיב האחרון באלגוריתם החיפוש הכללי של גוגל.

 

מה הקשר בין RankBrain וגורמי הדירוג של גוגל?

כידוע, גוגל משתמשים בהרבה גורמים והם עוזרים לקבוע איך לדרג את דפי האתר. המילים שמופיעות באתר הן דוגמה לגורם כזה, המיקום והעיצוב שלהן (למשל, האם הן מופיעות בכותרת, האם הן מודגשות?), ההתאמה לגלישה במובייל הוא גם איתות שנרשם בחישוב הכללי של ציון האתר (PageRank). את כל האיתותים האלה מעבדים רכיבים שונים באלגוריתם Hummingbird במטרה לקבוע אילו דפים יופיעו בתוצאות החיפוש בתגובה לחיפושים שונים.

 

גוגל טוענים בהתמדה שיש להם כ-200 גורמי דירוג עיקריים ועוד כ-10,000 תת-גורמים או וריאציות שלהם, או מסתפקים בלציין שיש כמה מאות גורמים משפיעים.

·         לפירוט הגורמים המשפיעים על הדירוג ב-2015

 

לפי הצהרות גוגל בימים האחרונים, RankBrain הוא הגורם השלישי בחשיבותו בדירוג אתרים מתוך מאות הגורמים האחרים שקובעים אילו דפים יופיעו בתוצאות החיפוש ובאיזה מקום הם יופיעו.

 

גוגל מסרבים לחשוף מהם הגורמים הראשון והשני בחשיבותם בדירוג אתרים במנוע החיפוש. אבל נהוג להעריך שהגורם החשוב ביותר הוא עדיין קישורים נכנסים, ואחריו מילות מפתח, כולל המילים שמופיעות בטקסט של דף האתר ועד הפרשנות של גוגל למילים שהמשתמשים מזינים בשורת החיפוש.

מה RankBrain עושה בדיוק?

לפי גוגל, RankBrain משמש בעיקר כדרך לפרש את החיפושים שנעשים בגוגל ולמצוא דפים רלוונטיים שאולי אינם מכילים את מילות החיפוש המדויקות.

היכולת הזאת של גוגל כבר אינה חדשה. בעבר אם הייתם מחפשים בגוגל את המילה "נעל", כנראה שלא הייתם מקבלים בתוצאות דפים שמכילים את המילה "נעליים", אבל גוגל התפתחו במובן הזה ומנוע החיפוש כבר יודע לזהות וריאציות של אותה מילה, מילים נרדפות ולהבחין בין מילים המייצגות גם מותגים וגם דברים אחרים (כמו apple לדוגמה). בהמשך יכולת ההבנה של גוגל התפתחה עוד יותר והיא באה לידי ביטוי ב-Knowledge Graph, המציג תשובות לשאלות ומידע על אנשים ומושגים  גם בלי לציין את השם המדויק בחיפוש.

גרף הידע של גוגל - דוגמה

 

 

איך RankBrain יעזור להבין שאילתות?

גם בלי RankBrain, כל השיטות להבנה וחידוד של שאילתות מובילות בסופו של דבר לעובד אנושי כלשהו, והוא או מכין רשימות של שורשים ושל מילים נרדפות או מייצר מאגר נתונים של קשרים בין דברים. כמובן שכל זה עובר איזשהו תהליך אוטומציה, אבל בסופו של דבר זו עבודת כפיים.

הבעיה היא שגוגל מעבדים יותר מ-3 מיליארד חיפושים ביום, ולטענתם כ-15% מהחיפושים היומיים הם חדשים, כלומר כ-450 מיליון מהחיפושים ביום לא נראו קודם לכן.

החיפושים האלה יכולים לכלול שאילתות ארוכות ומרובות מילים (מה שמכונה זנב ארוך), ו-RankBrain נועד להבין טוב יותר את השאילתות האלה ולתרגם אותן ביעילות כדי שיעלו את הדפים הטובים ביותר עבור המחפש.

לפי גוגל, המערכת של RankBrain יכולה לזהות דפוסים בין חיפושים מורכבים ולא קשורים על פניו ולהבין את הדמיון ביניהם. יכולת הלימוד שלה מאפשרת לה להבין טוב יותר חיפושים מורכבים עתידיים ולדעת אם הם קשורים לנושאים ספציפיים. יותר מכך, המערכת יכולה לקשור בין קבוצות חיפושים ובין תוצאות שלדעתה יתאימו לשאילתת החיפוש של המחפשים.

גוגל לא סיפקו דוגמאות לקבוצות שאילתות ולתוצאות לא קשורות שיכולות להתאים להן, אבל יש להניח שמדובר בשאילתות מעורפלות שמתורגמות לשאלה ספציפית יותר, וכך אפשר לספק מענה מדויק יותר לשאלה.

מה שכן, גוגל סיפקה דוגמה לשאילתת חיפוש ש-RankBrain אמור לעזור בדירוג התוצאות שלה.

לפי הדוגמה: חיפוש של השאילתה הארוכה:

What’s the title of the consumer at the highest level of a food chain?

בתרגום חופשי: איך קוראים לצרכן בדרגה הגבוהה ביותר של שרשרת המזון, תוביל לתוצאות חיפוש דומות לאלו שהיו מוצגות לו המחפשים היו משתמשים בשאילתה פשוטה יותר כמו "top level of the food chain". כלומר המערכת תדע לצמצם את המשמעות הכפולה של המונח consumer (גם לקוח, צרכן), ולהבין טוב יותר את כוונת המחפש.

rankbrain אלגוריתם - דוגמה

(באופן אירוני, אם מחפשים היום את שאילתת החיפוש המורכבת מקבלים בעיקר תוצאות הדנות באלגוריתם RankBrain של גוגל ומעט מאוד תוצאות רלוונטיות).

עוד עובדות על RankBrain:

  1. –          לפי גוגל המערכת התחילה לרוץ בהדרגתיות מתחילת 2015 והיא תעבוד במלואה ובכל השפות בחודשים הקרובים.
  2. –          גוגל מוסרים שהאלגוריתם ישפיע על חלק גדול משאילתות חיפוש, אבל מסרבים למסור מידע מפורט יותר.
  3. –          ב-2005 מיקרוסופט הציגו את RankNet מערכת למידה חישובית במנוע החיפוש המתחרה בינג. הרעיון אמנם נשכח ונזנח, אבל חיפוש בבינג של השאילתה לדוגמה מעלה תוצאות רלוונטיות למדי.
  • תוצאות החיפוש בבינג

מה המשמעות של RankBrain לקידום אתרים בגוגל?

עד כה לא ראו בתהליך ה"זיקוק" של שאילתת החיפוש איתות או גורם משפיע על דירוג האתר בגוגל (בין שמדובר במילים נרדפות, שורשים או עכשיו – RankBrain).

הגורמים המשפיעים לרוב קשורים לתוכן: למילים שמופיעות בדף האתר, לקישורים שמצביעים על הדף וכדומה. הגורמים יכולים להיות קשורים גם למשתמש: מיקומו הפיזי, היסטוריית הגלישה והחיפושים שלו ועוד.

לכן, אם גוגל אומרים ש-RankBrain הוא האיתות השלישי בחשיבותו, המשמעות היא שהוא גורם המשפיע ישירות על דירוג הדף בתוצאות החיפוש. כרגע לא ידוע איך תהליך הדירוג הזה עובד, ייתכן שיש מעין ציון RankBrain הניתן לכל אתר ומעריך את האיכות שלו, אבל סביר להניח שהמערכת מתמקדת בלעזור לגוגל לסווג דפים לפי התוכן שלהם ולסכם אותם בדרך טובה יותר מהמערכות הקיימות. גוגל לא מסרו פרטים נוספים לגבי זה, מלבד לציין שמדובר ברכיב המשפיע על הדירוג.

 

מחפשים חברה מקצועית לקידום אתרים בגוגל? צרו קשר ונשמח לעזור לכם.