Google разработал новый алгоритм SMITH, который способен лучше понимать длинные запросы и документы, чем BERT. Информация о нем была опубликована Google в научной статье.
Новая модель SMITH разработана для семантического сопоставления длинных текстов. Если BERT обучен понимать слова в контексте предложений, то SMITH пытается понять документы целиком. Т.е. модель ориентирована на понимание фрагментов в контексте всего документа.
В отличие от BERT, который обучается на наборах данных для предсказания случайным образом скрытых слов из контекста в предложениях, – SMITH обучается предсказывать следующий блок предложений.
Такое обучение поможет новому алгоритму лучше понимать объемные документы.
Используется ли SMITH в полной мере в работе Google пока не известно. Официальных заявлений на этот счет компания не давала.
Ознакомиться с описанием алгоритма SMITH можно здесь.
Источник: Search Engine Journal
VK объявляет о приобретении 40% компании Intickets.ru (Интикетс). Это облачный сервис для контроля и управления продажей билетов на мероприятия. Сумма…
OpenAI готовится запустить собственную поисковую систему на базе ChatGPT. Информацию об этом публикуют западные издания. Ожидается, что новый поисковик может…
Центр управления связью общего пользования (ЦМУ ССОП) Роскомнадзора рекомендовал компаниям из реестра провайдеров ограничить доступ поисковых ботов к информации на российских сайтах.…
Apple возобновила переговоры с OpenAI о возможности внедрения ИИ-технологий в iOS 18, на основе данной операционной системы будут работать новые…
Конкурсный управляющий российской «дочки» Google подготовил 23 иска к участникам рекламного рынка. Общая сумма исков составляет 16 млрд рублей –…
Google завершил обновление основного алгоритма March 2024 Core Update. Раскатка обновлений была завершена 19 апреля, но сообщил об этом поисковик…