Алгоритм BERT. Заблуждения и факты

Мар 3, 2020 | Продвижение сайта | Нет комментариев

4
(3)

В октябре прошлого года корпорация Google приступила к серьезным обновлениям своей поисковой системы. Ожидается, что в конечном итоге апдейт окажет существенное влияние на принципы создания контента, заставив многих оптимизаторов и владельцев сайтов отказаться от привычных методик. Ведь отныне Google, среди прочих, использует и алгоритм BERT, основанный на нейросетях, который, как утверждается, может понимать естественный язык и его особенности. При этом за столь недолгое время новшество Google уже обзавелось немалым количеством различных домыслов на свой счет. Рассмотрим некоторые из них детальнее.

BERT и анализ текстового контента

Первое и самое значительное расхождение мнений наблюдается относительно того, использует ли Google новый алгоритм для анализа текста на ресурсах. Если посмотреть официальную информацию, предоставляемую компанией, то вроде как и нет. В ней делается упор на то, что главная задача BERT – обрабатывать поисковые запросы, а не текстовый контент на сайтах из выдачи.

Так ли это на самом деле? Во-первых, исходя из некоторых комментариев представителей Google, это лишь вершина айсберга. Да, в компании не утверждали, что будут применять новый алгоритм для обработки текстов, но не говорили и обратного. Этот момент по факту был вынесен за скобки и на нем попросту не акцентировалось внимание. Получается, нельзя с уверенностью заявлять, что роль BERT сводится к банальному улучшению работы с запросами, в том числе и с голосовыми. Вполне логично, что Google задействует его и для более глобальных целей, тем более что технологически это вполне реализуемо.

BERT и поисковая выдача

Предположим, алгоритм и правда нацелен на анализ текстового контента. Следовательно, стоит ожидать каких-то существенных изменений в поисковой выдаче. Наблюдались ли они? Пока что нет. Как тогда это можно объяснить?

BERT – новый подход к текстовым алгоритмам. Ранее их задача сводилась к поиску ключевых фраз и т.д. Теперь «правила игры» изменились – алгоритм BERT научился понимать контекст. С последним у поисковых роботов длительное время все было плохо, поэтому в топе выдачи нередко можно было встретить ресурсы, бесполезные для пользователя с точки зрения размещенной информации, однако удовлетворяющие текущие требования Google или Яндекс.

Что должно было измениться? В первую очередь под ударом оказались бы сайты, которые продвигались по низкочастотным запросам. Однако свои позиции они не потеряли. Следовательно, что-то этому препятствует, возможно, пока что. Причин отсутствия значимых изменений в поисковой выдаче можно выделить две:

  • ресурсозатратность технологии;
  • алгоритм пока что ориентирован на англоязычные тексты.

С первым все достаточно прозаично: Google даже потребовались тензорные процессоры, ориентированные на задачи машинного обучения и т.д. Впрочем, компания применяла их и ранее, например, для обработки фотографий, в системе RankBrain, прочее. Новый алгоритм в этом плане тоже достаточно «прожорлив», поэтому без TPU не обойтись, а это весьма затратно.

Что касается второго, то очевидно, что изначально BERT будет использоваться в англоязычном сегменте Сети. Существует универсальная модель, которая может работать со 102-мя языками, но ее возможности оставляют желать лучшего. Из этого следует, что в ближайшее время вряд ли стоит ожидать глобальных изменений поисковой выдачи на других языках, за исключением английского. Если они и будут, то минимальны. Однако эффективность англоязычной модели практически наверняка сподвигнет Google к распространению данной практики и на другие языки.

BERT и Яндекс

Да, Яндекс тоже успешно использует этот алгоритм, но немного с иными целями. Анализ текстового контента как таковой не проводится и на ранжирование сайтов BERT не влияет. Нацелен он преимущественно на новостные ресурсы, в частности, помогает искать опечатки в заголовках. Такие новости исключаются из топа выдачи.

Что было и чего ожидать

На равных бороться за лидерство в поисковой выдаче по высокочастотным запросам можно было лишь при наличии немалых средств. Однако существовал и более «бюджетный» вариант – низкочастотные запросы. Такие сайты требовали значительно меньших объемов инвестиций и демонстрировали отличные результаты при условии грамотной технической и поисковой оптимизации.

В перспективе подобный способ продвижения пусть и не канет в лету, но ресурсы, ориентированные под НЧ, однозначно потеряют часть трафика. Причина – алгоритм BERT, который проанализирует текстовый контент сайта и придет к мнению, что его явно недостаточно и резоннее направить пользователя на более крупные и авторитетные ресурсы.

Конечно, не стоит ожидать, что отток трафика от небольших сайтов начнется вот прямо сейчас. Как говорилось ранее, универсальная модель алгоритма пока что работает недостаточно хорошо, однако в перспективе все может измениться. Следовательно, необходимо уже сейчас готовиться к грядущим изменениям. К примеру, принять меры по расширению семантического ядра страниц, привлекать трафик из других источников, в частности, трафик из YouTube, прочее.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 4 / 5. Количество оценок: 3

Оценок пока нет. Поставьте оценку первым.

Наш телефон:

+7 (499) 70-30-435

Книга в подарок

Вопросы пишите в саппорт: https://wpkurs.ru/cms/system/contact
Контакты службы работы с клиентами: +7 (499)-70-30-435
Адрес: г. Уфа, ул. Ленина, дом 28, а/я 25

© ТЦ «Интернет-Прорыв» 2012-2020 | ИП Гадельшин Адель Раисович. ОГРН: 314028000006317. ИНН: 026824242756