Что такое поисковый робот и как он работает. Базовые знания поисковых алгоритмов. Ранжирование
Здравствуйте уважаемые читатели блога. Такое название своему блогу я придумал не просто так. Я хочу, чтобы Вы стали настоящими хозяевами своей жизни и хозяйничали не только в реальности, но и в интернете. Осваивайте эти безграничные просторы и становитесь его полноправным хозяином. Это было небольшое отступление.
Ну а сегодня я хочу сделать небольшой экскурс по базовым знаниям поисковых алгоритмов, по принципам работы поискового робота. Как происходят основные процессы в поисковых системах? Что такое поисковый робот и сколько существуют их разновидностей? Что такое ранжирование? После сегодняшнего урока вы будете знать тот минимум, который необходимо знать новичку блогинга. Итак, начнём…
Кто же это такой, – этот поисковый робот или что это такое? И что представляют из себя поисковые алгоритмы?
Существует много догадок по этому поводу. Кто-то думает, что это какой-то полуживой организм, кто-то решил что это искусственно созданный интеллект, кто-то думает что это просто какая-то программа…
На самом же деле, поисковый робот – это набор определённых программ, которые осуществляют сканирование всех материалов, которые выложены на страницах интернета (грубо выражаясь). Роботов в поисковой системе несколько разновидностей.
1) Краулер (паук)
Этот робот схож с обычным браузером, который выкачивает из интернета страницы, которые лежат на серверах. Также он переходит по ссылкам, которые например находятся у вас в статьях…
2) Дятел
Это робот, который проверяет работает сайт или нет, есть страница или она отсутствует.
3) Индексатор
Этот робот анализирует тот материал, который закачал робот-краулер. И именно индексатор выполняет ту работу, результатом которой некачественный контент и некачественный сайт не продвинутся высоко в выдаче…
Как происходит генерация выдачи? Что такое ранжирование?
Вот эти три основных робота, которые работают и несут информацию в базу данных поисковой системы. И там эта информация систематизируется. Нужно понимать что не все сайты войдут в эту базу данных поисковика. Кто-то по незнанию не сможет его туда добавить, а кто-то из-за нарушений вылетит оттуда. А вообще, если сайт и контент на нём уникальный и качественный и + к этому идёт большой положительный отклик об этом сайте, то вам не нужно даже искусственно добавляться. Поисковик сам с удовольствием добавит этот сайт в свою базу и естественно будет выдавать его на первые места.
А генерация выдачи происходит по такому принципу :
- Во первых ваш материал должен быть проиндексирован и находиться в базе данных поисковика. У вас должен быть сформирован файл robots.txt и лежать на хостинге. Как ускорить этот процесс я буду говорить в следующей статье, так что подпишитесь на обновление блога.
- Если это соблюдено, то в поисковой выдаче этот материал полюбому должен присутствовать. Хотите узнать как узнать проиндексирована ваша статья или нет? Расскажу. Просто введите заголовок вашей свежей статьи в окно поиска через пару дней после её публикации и посмотрите что выдаст поиск. Если она не появилась в выдаче, значит с индексацией вашего контента какая-то проблема. Нужно её срочно вам решать, так как — это наиважнейший критерий…
Ну а порядок выдачи в поиске по ключевым запросам – это и есть ранжирование (от слова ранг, а не жир). Это уже посложнее будет, так как на этот результат влияет масса факторов, например: уникальность, ссылочная масса на этот материал, тиц и пиар сайта и т.д. Этих факторов например как заявляет поисковая система Гугл у неё 1000, а сейчас может уже и больше.
Естественно ни один поисковик не выдаст нам секретов как попасть в топ,
но методом проб и ошибок сео-специалисты и вебмастера постепенно разгадывают некоторые секреты и стараются этими искусственными способами оказаться на верхних позициях.
Необходимо отметить, что поиск и выдача материала происходит только лишь в пределах той базы данных, которая есть у поисковика. Если ваш сайт не находится в той или иной базе различных поисковых систем, то его невозможно будет найти там и естественно он не будет показываться в выдаче.
Для новичков необходимо знать, что нормальная индексация материала для их молодых сайтов по времени будет в пределах 1-2 недель. И чем старше и авторитетнее становиться сайт, тем быстрее происходит его индексация. Возможно в будущем индексация будет происходить за считанные часы.
Подведём итог: так пройдя через все эти поисковые жернова ваш сайт (блог) попадает в поисковую выдачу. Но самое главное для вебмастера и его сайта то, чтобы появиться по нужным ему запросам в топ 10 как минимум, потому что 2, 3 и тем более дальние страницы поисковой выдачи очень редко когда открывают. Ведь люди всегда спешат и каждая их минута стоит дорого…
Ещё добавлю, что у каждого поисковика свои поисковые роботы и они разные, и разные поисковые алгоритмы, которые постоянно меняются. И сегодня вы можете быть наверху, а завтра запросто оттуда слететь.
Важно понимать, что поисковые системы – это место входа 90% всех пользователей интернета и естественно трафик оттуда всегда будет бешеным и за него будет постоянно вестись жёсткая конкурентная борьба.
В следующей статье будем регистрироваться свой сайт в службах Яндекса и Гугла и заявлять права на них. Поэтому, чтобы не пропустить свежие статьи — подпишитесь на обновления блога.
Нуа на сегодня всё… Пока-пока.
С уважением, Алекс Fomik…
Статьи по теме:
- Сколько времени понадобилось Google, чтобы выкинуть дублированный контент с моего блога
- Как влияет сниппет на продвижение сайта в Яндекс и Google
- Как увеличить комментирование блога
- Как привлекать целевых посетителей на блог с помощью популярных социальных сетей
- Аудит — эффективный способ продвижения сайта
Не совсем согласен «что поисковые системы – это место входа 90% всех пользователей » — на мой блог, например, приличная доля трафика идет из социалок. И они же могут помочь ускорить индексацию статьи. Поэтому после опубликования я сразу добавляю ее адрес в адурилки Гугла и Яндекса и кликаю кнопки социальных сетей под статьей.
—
Встречал такое мнение, что роботы Google очень «любят» Fb и Twitter.
[Ответить]
Алекс Fomik Reply:
Октябрь 18th, 2012 at 8:39 пп
О, какие люди у меня… Давно не заходил Саша… Решил вопрос с тем плагином «Лучшие статьи»? Я всё никак не напишу пост про него…
Ну в принципе да, немного переборщил с %. Ну точной статистики кто даст то?
[Ответить]
Проверить индексацию статьи все же лучше
И оценить источники трафика можно различными способами. Например, с помощью Google Analytics или Яндекс.Метрика
[Ответить]
Алекс Fomik Reply:
Октябрь 18th, 2012 at 8:43 пп
И это тоже всё правильно Саша… Спасибо тебе за дополнение…
[Ответить]
С интересом прочитал статью о поисковых роботах.Я знал, что они есть, но в этой статье мне просто и понятно показали их суть. Для проверки своей статьи /их у меня пока всего 3 / набрал её название в браузере и был очень удивлён увидев её второй в списке./первая встреча с алкоголем/. Большое спасибо Хозяину.
[Ответить]
Алекс Fomik Reply:
Октябрь 18th, 2012 at 9:23 пп
Значит всё нормально, её уже проиндексировали…
/первая встреча с алкоголем/ — может вы опечатались Виктор?)))
С алгоритмами наверное хотели написать, или вы под шафе сейчас???)))
[Ответить]
Наверное я что-то не понимаю / опечатались , с алгоритмами /. Если можно объясните доходчиво.
[Ответить]
Алекс Fomik Reply:
Октябрь 20th, 2012 at 11:46 пп
Ааааа, ваша статья наверное так называется? Я думал вы с поисковыми алгоритмами впервые встретились)))
[Ответить]
Забавное преподнесение информации и тема нетривиальная, спасибо за интересное чтение.
[Ответить]
Алекс Fomik Reply:
Октябрь 22nd, 2012 at 1:08 дп
Не за что Веб-дизайнерша))) Спасибки за хорошую оценку…
[Ответить]
Интересная статья. О роботах еще нигде не видел информации. Спасибо!!! Очень познавательно!
[Ответить]
Алекс Fomik Reply:
Октябрь 23rd, 2012 at 10:13 пп
Не за что Сергей)))
[Ответить]