עבודתם של מנועי החיפוש

מנהלי אתרים רבים טירון רק אוהדים של גלישה באינטרנט עוסקים בשאלה: איך מנועי החיפוש עובדים? עקרונות בסיסיים של מנועי החיפוש היום ישקול את ארץ המועצות.




מנוע החיפוש המודרני הוא קומפלקס שלם המורכב של תוכניות מסובכות ביותר ואלגוריתמים עובד עם מהירות מדהימה. תארו לעצמכם, החדש אלגוריתם החיפוש קפאין מ- Google מסוגל עיבוד מידע שווה 3 ק"מ של גיליונות A4 רק 1 שנייה!



בכל מנועי החיפוש, רכיבי התוכנה ניתן לחלק לחמש קבוצות עיקריות:



  • "עכבישים"

  • "עכבישים נוסעים"

  • - אינדקסים

  • מאגרי מידע

  • מערכות תוצאות



עכבישים - עכבישים (עכבישים) - על ידי האלגוריתם של עבודתם דומה הדפדפנים, אבל אין להם רכיבים חזותיים. העכביש טוען את קוד ה- HTML של הדף באמצעות פרוטוקולי HTTP.



בקשת רובוט לשרת כוללת פקודה"קבל / נתיב / מסמך" ועוד כמה פקודות בקשת http. לבקשה זו, עכביש מקבל תגובה מהשרת כזרם טקסט המכיל את פרטי השירות על המסמך ועל המסמך עצמו. העכביש הוא חלק מודול האינדקס עבור מנועי החיפוש.



"העכביש הנוסע" - סורק - הוא מרכיב נוסףמודול אינדקס. סורק נווט באופן אוטומטי דרך כל הקישורים שנמצאו על ידי עכביש על הדף ובכך לחפש מסמכים שאינם ידועים עדיין את מנוע החיפוש.



רובוט- Indexer (אינדקס) עובד ישירות עם התוכן של הדפים טעון על ידי רובוטים עכביש. המדד מבצע ניתוח מורפולוגי, לקסיקלי של הדפים, ושובר אותם לחלקים נפרדים.



מאגרי מידע (מסד נתונים) הם תוכנה מיוחדת המיועדת לאחסן את המסמכים באינדקס שנאספו ואינדקס על ידי רכיבים.



מנוע חיפוש תוצאות מנוע - המערכת להנפקת התוצאות היא אחת החשובות ביותררכיבים של מנוע החיפוש. זה עם מערכת הפלט כי משתמש הקצה הוא עסק, אשר מזין את השאילתה לתוך מחרוזת החיפוש. מערכת הפלט של התוצאות על בסיס של יותר מ 200 קריטריונים שונים מבצע את הבחירה של התוצאות המספקים ביותר את יעדי החיפוש.



האלגוריתם של בחירה כזו נקרא בדרך כלל אלגוריתם או - מנגנון הדירוג. כדי למנוע הונאה מצד מנהלי אתרים על מנת להשפיע על תוצאות ההנפקה, הדירוג המדויק של מנועי החיפוש אלגוריתם נשמרים בסודיות מוחלטת.



עם זאת, ישנם מספר קריטריונים ידועים אשר נלקחים בחשבון בעבודת מנועי החיפוש, אופטימיזציה אשר מנהל האתר יכול "משפטית" להשפיע על תוצאות החיפוש. לדוגמה, מנוע החיפוש בעת ניתוח הדף לוקח בחשבוןYou




  • אם יש מילת מפתח בכותרת הדף (כותרת)

  • האם מילת המפתח מופיעה בכתובת האתר של הדף?

  • אם יש מילת מפתח בכותרות H1-H6, תגים STRONG, B, EM, I

  • מהי הצפיפות של מילות המפתח בדף (צפיפות)

  • האם מילת המפתח קיימת במטא תגים: מילות מפתח, תיאור

  • האם קיימים קישורים פנימיים וחיצוניים בדף?



המשתמש מקיים אינטראקציה עם מנוע החיפוש דרך שרת החיפוש. התקבלה שאילתת חיפוש ממשתמשהשרת מעבד ומעביר את מודול הדירוג כקלט לפרמטר. בתורו, המודול מבצעת עיבוד של מסמכים, מידע על אשר מאוחסן במסד הנתונים של מערכת החיפוש, ועושה דירוג של דפים המתאימים לבקשת המשתמש.



לאחר מכן, המערכת מייצרת קטע טקסט - מידע המוצג למשתמש בצורה של SERP (מנוע חיפוש תוצאות דף) - דפי תוצאות חיפוש.



לכן, אפילו תיאור קצר של הראשיעקרונות העבודה של מערכות החיפוש מראה עד כמה כל רכיבי התוכנה של המערכת מחוברים זה לזה, וכמה טוב מנוע החיפוש צריך לפעול בבירור על מנת לספק למשתמש את המידע המהיר והאמין ביותר על שאילתת החיפוש שלו.



עבודתם של מנועי החיפוש
הערות 0