Elvi Digital

Некоторые размышления на тему технологии Яндекса Спектр

15 декабря 2010 Яндекс запустил новый алгоритм ранжирования поисковой выдачи Краснодар. Изюминкой данного алгоритма стала новая технология Спектр, призванная улучшить, а точнее разнообразить, выдачу по неоднозначным запросам. Другими словами, если запрос формулируется так, что не совсем понятно, чего же именно хотел пользователь, то Спектр пытается предсказать недосказанный мотив поиска и предоставить в выдаче ответы по разным направлениям. К примеру, если будет задан запрос «билеты», то поскольку не ясно, какие именно билеты интересуют пользователя и что именно он хочет с ними сделать (купить, узнать цену, наличие) – то Яндекс покажет выдачу такой, чтобы пользователь с высокой вероятностью хотя бы в какой-то ее части увидел ресурс, отвечающий его неявными и неуказанным в запросе целям. Так по тому же запросу «билеты» мы видим в топ10 Яндекса 4 сайта на тему театрально-концертных билетов, 4 железнодорожных агентства, 2 ресурса, занимающиеся распространением авиабилетов. Есть там и ответы на неявные запросы «купить», «заказать» и т.п.

Как это работает? Во всех неявных запросах Спектр ищет так называемые «объекты». Каждый объект при этом привязывается Спектром к одной или нескольким «категориям». А каждая категория при этом имеет некий список предопределенных «потребностей». В нашем примере «билет» – это и есть объект, который Яндекс относит к категории, которая так скорее всего и называется – «билеты» (к примеру, запрос «БМВ» может оноситься к категории «автомобили», а вторая категория для данного запроса – «компания» и т.п.). А у категории «билеты» актуальный список потребностей может быть: «купить», «заказать», «цена», «наличие» и т.п. Вот как бы неявно Яндекс теперь пытается «подмешать» выявленные потребности к неявно заданному запросу и результаты таких уже нескольких запросов показать в одной выдаче в строго определенной пропорции.

Список категорий на данный момент насчитывает 60 наименований, их количество будет постоянно расти. Также как и будет расти и изменяться количество потребностей в каждой категории. Откуда все это берется? Яндекс анализирует еженедельно огромный пласт однозначных запросов, чтобы по их статистике понимать, что могут скрывать в себе их неоднозначные варианты. Кроме этого анализируются данные энциклопедий и справочников, в том числе Wikipedia.

А теперь самое интересное. Что же поменяется в плане продвижения сайтов? Думаем, что очень многое. Задумаемся, если до Спектра поисковая выдача по некому запросу могла быть полностью занята однотипными коммерческими ресурсами (естественно, что с точки зрения пользователя поисковой системы это не есть хорошо, и тут не будем ни с кем спорить в этом вопросе), так как, несмотря на то, что разнообразием выдачи и до Краснодара Яндекс занимался вплотную, но в конечном результате поиска из топ10 могли быть «выдавлены» все некоммерческие ресурсы, потому что в итоге, хотя ранжирование в каждой типовой группе сайтов происходит по-разной формуле, все равно все окончательно ранжировались по финальному параметру релевантности. Теперь же если по всей статистике Спектр решит, что по некому неявному запросу 20%25 сайтов должны быть в топе информационные – никакие манипуляции с коммерческими ресурсами ничего с этими 20%25 поделать не смогут.

Вывод. Теперь топ10 стал еще реально УЖЕ. Если вы двигаете сайт по неявному запросу, то в вашей поисковой выдаче может оказаться только 5 ресурсов того же типа, что и вам (не важно, что это – интернет-магазин или корпоративный сайт). И конкурировать вы уже будите не с 10, а с 5 сайтами. И тут вам уже решать, что делать – продолжать конкурентную борьбу, довольствоваться второй страницей выдачи (ее посещаемость кстати видимо существенно должна увеличиться), уходить в другую «весовую» категорию (к примеру выходить в том уже не с продажей товара, а с его обзором, или с отзывами на него) или же вообще отказываться от неявных запросов в принципе.

Удачи всем в принятии правильного решения!!!

P.S. А впереди нас еще всех ожидает персонализация выдачи 🙂