Пошукова система Яндекс
Обзор: Пошукова система Яндекс. В даний час займає лідируюче положення в пошуковому трафіку Рунета, будучи фаворитом майже всіх користувачів, які потребують пошуку інформації в країнах СНД.
Рейтинг: 17 - количество голосов за статью Рейтинг: 4,5
Публикация: 14.08.2012, в категории "Интернет и программирование"
Просмотр: эта статья прочитана 12257 раз

Яндекс  Пошукова система Яндекс. В даний час займає лідируюче положення в пошуковому трафіку Рунета, будучи фаворитом майже всіх користувачів, які потребують пошуку інформації в країнах СНД. Щоденна відвідуваність цієї пошукової системи - більше 12 мільйонів чоловік на добу. У пошуковій системі представлено більше 5,4 мільйона сайтів з кількістю сторінок понад 2,5 мільярда, що складає більше 62 терабайта інформації. А починалося все з 1997 року, коли цей пошуковик вперше був представлений на суд публіки. "Яндекс" постійно удосконалює свої пошукові алгоритми, що дозволяє йому відповідати сучасним критеріям пошуку і ставати на рівень Google хоча б в Росії.

 А поки так і є, якщо судити за рівнем освоєння обох пошукових систем аудиторією СНД. "Яндекс", як і Google, працює на кластерної системі організації комп'ютерних обчислювальних мереж. Кожен кластер відповідає за певний сегмент збереженої інформації. Скануючі роботи пошукової системи бувають 2 видів:
1) основний скануючий робот
2) швидкий робот, який регулярно сканує сайти, на яких інформація оновлюється дуже часто, і вносить інформацію з цих сайтів в пошукову систему, що забезпечує швидке оновлення індексу пошукової системи.

 З червня 2010 року швидкий робот був замінений на нову технологію пошуку документів в режимі реального часу під назвою Orange. Продукт, розроблений спільно каліфорнійським і московським підрозділами "Яндекса", працює в режимі тестування, проте вже зараз показує свою ефективність. Пошукова система "Яндекс" робить курс на актуальність пошукової бази для подій, які відбуваються "тут і зараз" і значимість яких важлива в даний момент. Планується, що цей інструмент буде використовувати безліч сторонніх джерел для визначення значущості того чи іншого контенту, а також швидко обробляти великі масиви даних на сторінках, ранжувати і розміщувати їх в індексі. Ця особливість "Яндекса" буде корисна новинним сайтам і інформаційним агентствам.

Оновлення (апдейти) пошукової системи бувають 2 видів:

1) Оновлення пошукової бази. Відбуваються кілька разів на місяць. У пошуку починають видаватися оновлені сторінки сайтів, зібрані основним скануючим
роботом. Веб-майстри визначають ці оновлення самостійно, вивчаючи позиції сайтів у видачі. Як тільки з'являються руху у видачі того чи іншого сайту по певному запиту, веб-майстер розуміє, що оновлюється пошукова база. Визначити її оновлення можна через спеціальні сервіси і інформери, а також на спеціальних форумах сеошників.

2) Оновлення програмної частини (движка) пошукової системи. Суттю даних
оновлень є зміна алгоритмів ранжування документів в пошуковій
системі. Зазвичай вони анонсуються і їм даються певні
назви ("Снежинськ", "Полтава", "Магадан").

Давайте тепер подивимося на принципи роботи цього пошукового гіганта Рунета.

Що особливого?

"Яндекс" враховує морфологію російської мови (потужна система визначення словоформ), має можливість звузити запит до максимально точного за допомогою спеціальних пошукових формул і геотаргетинга, має якісно розроблений алгоритм оцінки релевантності документів (точність відносини тексту документа до пошукового запиту), володіє високою швидкістю реакції на запити і практичною відсутністю перевантажень серверів.

Зовсім недавно (з 2009 року) з введенням нового алгоритму "Снежинськ" Пошукова система "Яндекс" навчилася визначати регіональну приналежність сайтів і формувати результати пошуку по географічному розташуванню користувача (на основі IP-адреси або ж з урахуванням користувальницьких переваг). Сьогодні це найбільш точний географічний пошуковик Рунета. Пошукова система вміє розрізняти геозалежних і геонезалежні запити і формувати видачу таким чином, щоб вона максимально відповідала вимогам людини, яка шукає потрібну для нього інформацію.

В "Яндекс" можна подати заявку на індексацію сайту і написати лист розробникам про проблеми з індексацією, також є форум пошукової системи http://forum.yandex.ru і блог http://webmaster.ya.ru, що вже відповідає мінімальним правилам юзабіліті.

До того ж функціонує панель управління власним сайтом в пошуковій системі "Яндекс" - http://webmaster.yandex.ru, на якій можна налаштовувати особливості індексації власного сайту, відстежувати небажані зміни коду, виявляти і виправляти можливі помилки індексації сайту, у тому числі і орфографічні.

Індексація нових сайтів йде довше, якщо це відбувається природним шляхом без впливу зовнішніх пошукових факторів (розстановка посилань, які посилаються на ваш сайт). Зазвичай не раніше місяця. З досвіду скажу, що домени в зоні. Ru індексуються швидше, ніж аналогічні домени в інших зонах (. Info,. Net,. Com,
QArea) і безкоштовних pp.ru net.ru і т. д.

Для цієї пошукової системи є критичними такі параметри, як динамічні посилання. Через них сайт може бути погано проіндексований. Намагайтеся виключати велику кількість параметрів в рядку адреси сайту.
"Яндекс" вміє індексувати текст всередині документів Shockwave Flash (тільки якщо текст не намальований на самому зображенні), якщо ці елементи передаються окремою сторінкою, що має MIME-тип application / x-shockwave-flash, і файли з розширенням. Swf. Крім цього, індексуються документи PDF, RTF, DOC, XLS (документи Excel), PPT (презентації PowerPoint) і документи Open Office.
Пошукова система враховує дані файлу robots.txt (до того ж підтримує атрибут Allow) і деякі метатеги. Роботом "Яндекса" ігнорується метатег Revisit-After.

Опис документа у видачі (сніппет) формується на основі цитат знайденого документа, тому тег Description не дуже ефективний для цієї пошукової системи (хоча іноді може використовуватися). З недавнього часу (з 2009 року) Пошукова система підтримує технологію Sitemaps.

Не критичний для цієї пошукової системи метатег кодування. Розробники стверджують, що пошукова система вміє визначати кодування документів автоматично.

Важливо відзначити, що "Яндекс" не індексує документи величиною більше, ніж 10 мегабайт, так що оптимізуйте ваші файли.

Для "Яндекса" важливий HTTP-показник Last-Modified при відповіді сервера. Якщо сервер не видає таку інформацію, то інформація на цьому сайті може індексуватися рідше. Також важливо, щоб сервер був правильно сконфіругірован і видавав у разі помилок віддавав серверний редирект 302 (тимчасовий редирект), а не 301 (постійний редирект), т. к. в останньому випадку сторінка буде виключена з індексу. Аналогічне відбудеться при помилку сервера 404 (документ не знайдено).

До сих пір є проблеми з документами на фреймової основі (<frame>, <frameset>, <iframe>), тому доводиться використовувати спеціальні скрипти, які переводять користувача, що прийшов з пошукової системи, на потрібну сторінку.

Наявність дзеркал одного сайту мати не рекомендується. Доведеться вживати заходів для того, щоб виключити індексацію дзеркал або ж провести їх склейку, якщо індексація обох сталася, наприклад, через файл robots.txt.

Чи не формуйте посилання за допомогою скриптів javascript - "Яндекс" не індексує подібні посилання!

Оскільки "Яндекс" орієнтується на гео-таргетинг, і якщо ваш сайт належить до якогось регіону, то було б необхідно вказати на сторінках або телефонний код міста, поштовий індекс або ж адресу, щоб пошукова система могла більш точно ідентифікувати регіон вашого сайту.

Яндекс.Каталог - основний помічник цієї пошукової системи. Якщо сайт знаходиться в ньому, то цей знак показує, що сайт заслуговує особливої уваги. До того ж стає простіше визначити тематичну спрямованість сайту і отримати значущу зовнішнє посилання на свій ресурс.

Якщо ваш сайт є віртуальним представництвом якої-небудь компанії, що надає ті чи інші послуги як в Інтернеті, так і поза Інтернету, то рекомендуємо зареєструвати організацію в каталозі організацій "Яндекса" через зручний для веб-майстрів інтерфейс управління сайтів "Я.Вебмастер" ( про який йшлося трохи вище) і вказати там такі дані, як: адреса, контактні дані, режим роботи та інші специфічні параметри (ціни на квитки, число залів). Це посприяє швидкому знаходженню вашої організації на картах "Яндекса". Крім цього інформація про вашу організацію може бути представлена в сніппет (номер телефону, адресу з посиланням на "Яндекс.Карти", час роботи та інше). З 10 жовтня 2010 для сайтів готелів, готелів, ресторанів, різних типів кафе, кінотеатрів, музеїв, аеропортів, фітнес-центрів, автошкіл, салонів краси, туристичних фірм, автосалонів та клінік формуються свої, особливі сніппети. У них може відображатися додаткова інформація на кшталт суми рахунків або зірковості готелю та інше.

Якщо на сайті надається інформація про вакансії, то ви можете стати партнером сервісу "Яндекс. Робота" і передавати свої дані в їх базу даних (сервіс представлений "Яндексом" 25 жовтня 2010).

Я