Алгоритм Яндекса «Палех»: поиск по смыслу на основе нейросетей
Яндекс запустил нейросетевой алгоритм «Палех», направленный на улучшение выдачи по низкочастотным запросам. Семантический поиск тестировался 2 месяца и сейчас способен устанавливать смысловые соответствия между заголовками страниц и необычными, уникальными запросами.
Жар-птица Яндекса из палехской росписи, символ длинного хвоста поисковых запросов – это аналог Колибри от Google
Редко задаваемые ключевые фразы составляют внушительную долю обращений к поиску. Их 100 млн. из каждодневно задаваемых Яндексу 280 млн. запросов.
Google насчитывает 20% лишь единожды задаваемых поисковых запросов, по статистике Яндекса количество самых редких супермикроНЧ достигает 55%
Для сопоставления тайтлов страниц long tail запросам, применяется метод семантических векторов из трёхсотмерного пространства с поиском по смыслу слов, а не их вхождениям. Обрабатываются низкочастотники по которым мало стат. данных или нет ни единого общего слова. НЧ-алгоритм «Палех» походит на Гугловский Hummingbird (Колибри), запущенный в 2013 году. В первую очередь искусственный интеллект поможет получать желаемый ответ пользователям, не знающим как правильно сформулировать длинный запрос. Яндекс будет пополнять базу данных накопленного опыта как положительными, так и отрицательными результатами.
Очевидно, что :
- Тематичная информационность статьи будет плюсом в ранжировании по НЧ
- Нишевым веб-проектам проще избежать неправильной классификации
- Затронута сфера Е-коммерческого продвижения, где целевых посетителей получают по ключевым словосочетаниям (длинный запрос — хорошая конверсия)
- Благодаря «Палеху» с его направленностью на ультраНЧ, соответственно, кто-то сделает упор на СЧ/ВЧ. И появляется необходимость новых тактик оптимизации заголовков под микрочастотные ключевые фразы. Возможно они станут длиннее
- При всей продвинутости семантических векторов, базовые принципы ранжирования Яндекс не отменял
Уже применяемая в поиске по картинкам технология, обладает достаточным потенциалом для обработки не только заголовков страниц, но и текстового контента. В Яндексе обещают продолжить «знакомить» потребителей информации, товаров и услуг с новыми возможностями обучаемого алгоритма.
Спасибо за интересную статью.
Далёкая, но чрезвычайно интересная цель состоит в том, чтобы получить на основе нейронных сетей модели, способные laquo;понимать raquo; семантическое соответствие запросов и документов на уровне, сравнимом с уровнем человека. Благодаря «Палеху» поиск лучше находит веб-страницы, которые соответствуют запросам не только по ключевым словам, но и по смыслу.