Можно ли улучшить поиск сложных товаров в интернет-магазинах (или Яндекс Маркете)?

Возможно, те кто постарше, еще помнят price.ru. Вот и я еще помню те времена, когда Яндекс Маркета не было вообще. И даже был период, когда я пытался делать аналог price.ru для американского заказчика, и при этом amazon.com был у нас всего-лишь одним из многих сайтов – источников сведений о товарах (книгах, CD-ROM и т.п.), при том не самым крупным, и еще был живой yahoo… В общем, с тех пор многое изменилось.

Потом появился Яндекс Маркет, сильно вырос Амазон, и скажу прямо – много лет я использовал их как основной инструмент для поиска нужных мне товаров. А теперь вот подумываю, не уйти ли куда-то, на e-katalog скажем (шутка, там свои проблемы)? Или найти другое решение, получше?

Почему, спросите вы? Ну, в первую очередь потому, что поиск. Поиск категорически перестал меня устраивать.

Попробуем описать для начала, с какими проблемами я сталкивался при поиске. Яндекс Маркет тут будет как пример, но многое из описанного касается и других похожих сайтов (Амазон – первый же кто приходит на ум, и там все почти так же плохо).

Как выглядит поиск здорового человека? Ну, как-то вот так наверное 🙂

Если что, это реальный скришнот с мобильного приложения Маркета, сделанный с год назад. Сочетание страницы про IPhone и фото циркулярки от DeWalt сделало тогда мой день. Ну ок, это был баг, его исправили, так что забудем про это и вернемся к реальному поиску и его результатам.

Я буду использовать в качестве примеров поиск инструмента, как ту область, которая мне близка и понятна. В области компьютерного железа, да и пожалуй, в любой другой области, где есть технически сложные товары, мы будем видеть плюс-минус тоже самое.

Начнем с того, какие на мой взгляд, бывают интернет-магазины?

  • Узко специализированные. В нашем случае это например магазин Рубанков, инструменты и прочие товары для столярки. Его отличает от прочих то, что там знают о существовании компаний-производителей японского ручного инструмента Silky, или известнейшей канадской инструментальной компании Veritas. И продукция этих производителей не просто есть на сайте, но и, как правило, в наличии. Специализация не значит, что тут вы найдете все – скажем, инструмент элитного уровня от производителя Bridge City вы вообще в РФ скорее всего не купите. Но тем не менее, тут есть многое.

  • Просто специализированные. Это например Все Инструменты. Тут вы тоже сможете найти товары от той же Silky – но в наличии только одна пилка (из обширного ассортимента в десятки моделей).

  • Не специализированные. Ну это просто Яндекс Маркет, и большинство тех, кто продает на нем. Магазины из двух предыдущих пунктов тут тоже представлены, но структура каталога – от Маркета. Так вот, в нашем конкретном случае Маркет вообще не знает о существовании таких производителей, как Silky или Veritas, и даже если товар (скажем пилу) вы сможете найти – то не через каталог и выбор производителя. А поиск по Veritas приведет вас в лучшем случае к швейным машинкам.

В чем состоят проблемы неспециализированных магазинов при поиске товаров любого относительно узкого сегмента? Ну, наверное проблем тут больше одной, опишу их как я вижу.

Во-первых, это отсутствие специалистов именно в узком сегменте, которые бы детально разбирались в товаре. При этом слово “узкий” не следует понимать буквально, потому что узкий сегмент инструмента, к примеру, это на самом деле широчайший ассортимент, которые растет и меняется каждый год. И который производят как известные солидные фирмы, так и мелкие (в основном китайские) фирмочки. Результат – неполные и неточные описания товаров.

Во-вторых, типовая, уже скорее техническая проблема – это отсутствие уникального идентификатора у товара. Очень часто один товар продается в разных комплектациях. Компьютер в памятью 8 или 16 гигабайт из коробки, инструмент в картонной коробке или кейсе, с теми или иными дополнительными приспособлениями либо расходкой. При этом в сущности, это одна и та же модель – но стоимость дополнительной расходки, кейсов, памяти и пр. вполне может составлять значительную часть цены. Эта проблема приводит к дублированию позиций в поиске, и затрудняет выбор лучшего предложения.

Ну и наверное третья – небольшая глубина и ширина каталога в специализированных разделах. Скажем, при том что в Яндекс Маркете есть 14 (sic!) типов ручных рубанков – там все равно нет например грунтубелей. Ну т.е. даже если у продавца такой появится – в поиске он все равно будет валяться в общей куче (то, что в Яндекс Маркете при этом в основном вообще одна китайская дешевка – это отдельная история, тут я бы винил скорее покупателей, что лучше берут – то и в продаже).

Таким образом, мы имеем, с одной стороны, объяснимый недостаток специалистов, которые разбирались бы в товаре, его пользовательской ценности, комплектации, отличиях моделей друг от друга, а с другой – кучу этих самых моделей, которые отличаются непойми чем. На выходе получается тоже довольно странно. Вот например это – фрагмент моих закладок:

Что мы тут видим? Яндекс Маркет знает, что был вот такой товар, Bosch Biturbo GKT 18V-52 GC бла-бла-бла (в конце концов, я же как-то его в закладки поместил, правда?). И он раньше продавался, а теперь (в этом магазине) не продается. Но он был, и Маркет знает про него достаточно, чтобы его найти. В теории… а попробуем найти реально?

Я не буду приводить вам полный скриншот результатов поиска, они длинные.

Что мы тут видим? Мы видим, что именно этого товара в списке результатов нет. А есть куча других, которые сюда попали не иначе, как по недоразумению. Ну то есть, с одной стороны – в списке куча пил, в названии которых встречается 18V или 18В. С другой – вот на третьей позиции пилка от Bosch на 12 вольт. С третьей – есть пилы сетевые. Есть Bosch PRO и Bosch DIY (несовместимые друг с другом). Есть вообще другие производители. Но самое смешное то, что в длиннющем списке есть лишь одна сетевая погружная пила, которая реально является аналогом искомого товара – на восьмом месте в списке. Ну т.е. на 99% результаты поиска – мусор.

Если вы вдруг не заметили: оно ищет по 18V. А по слову the в английском тексте они не пробовали искать? Нашли бы намного больше 🙂 Где же ваш ИИ, в конце концов?

Решение?

Главный вопрос – что с этим можно сделать? Если бы директором был я (с), то я бы пошел по пути, который давно опробован (скажем, в картах), и пусть не идеально, но работает. Пусть у вас (а в данном случае у вас – это ни у кого) нет специалистов, которые глубоко разбирались бы в товарах, зато у вас есть сообщество. И это сообщество как раз разбирается – ну хотя бы настолько, насколько ему это нужно. Следует сделать так, чтобы каталог товаров был устроен наподобие wiki. И дать возможность пользователям самим расширять и исправлять характеристики товаров.

Сейчас некоторые карточки товаров уже отличаются от других. Вот конкретно эта – предложение магазина itUnite:

Вероятно, эти карточки заполняет продавец, а Маркет тут является платформой, позволяющей магазинам публиковать предложения. И все бы неплохо – кто публикует, тот и отвечает за качество описания. Но…

Если посмотреть внимательно, то ровно эта же пила есть и сама по себе, в виде обычной карточки. Т.е. эта часть товаров просто не занесены в каталог как следует, и поэтому они дублируют друг друга (а если предложений много – то это может быть и три карточки, и больше).

Одна из вещей, которые сообщество могло бы сделать – это как раз убрать это дублирование, т.е. отметить в каталоге, что вот эти карточки – это комплектации или предложения одного и того же товара. Вторая – это занести в каталог такие малоизвестные 🙂 фирмы, как канадская Veritas, или Lee Nielsen, научить софт различать японские пилы катаба и дозуки, и учитывать многие другие тонкости. По сути – пополнять и исправлять каталог на постоянной основе.

Вернемся еще раз к нашей Bosch Biturbo GKT 18V-52 GC. Почему сегодня результаты поиска нерелевантны? Потому что они очевидно не учитывают один из признаков этой пилы – она погружная. Т.е. мы можем нажать на рукоятку, и погрузить диск в материал. Все пилки с префиксом GKS этого не умеют, так что аналогом не являются. С другой стороны, есть ли у найденных товаров что-то общее? Да, есть – у некоторых. Буковка G в обозначении пилы показывает, что пила умеет работать по направляющей шине. Т.е. GKT 18V-52 GC умеет, и GKS 18V-57 G тоже. И как ни странно, но умеет и GKS 12V-26 – хотя в обозначении этого признака в виде буковки тут G нет. Что-то из атрибутов можно было бы извлечь, применяя методы типа машинного обучения, NLP и т.п. Но проще всего – доверить это сообществу.

Дав конечному пользователю возможность редактировать атрибуты, можно было бы позволять ему добавить к некоторым из этих товаров аттрибут “погружная”, или атрибут “работа по шине”. Что характерно – если попробуете сейчас эти свойства найти в описании, то вы их не найдете. На самом деле все еще чуть сложнее, потому что есть разные типы шин, и лишь некоторые из них совместимы, так что работа по шине – это на самом деле тип поддерживаемой шины, от которого мы приходим к моделям самих шин, и уже к их атрибутам).

Ну и добавив атрибуты, нужно сделать возможным потом по ним искать, естественно. Понятно, что дать редактировать описания и заголовки тоже было бы неплохо. Тогда не было бы таких карточек товаров, как вот эта:

Проблема тут в том, что это не плитка. На ней нельзя готовить, ее даже нельзя поставить так, чтобы нагреваемая поверхность была горизонтальна. При этом в отзывах (год назад) это уже было явно написано. И что вы думаете, хоть кто-то озаботился тем, чтобы поправить заголовок? Только сообщество, на мой взгляд в состоянии такое привести в нормальный вид.

Что еще можно и нужно улучшить?

Стоит заметить, что редактировать сообществу нужно позволять не только атрибуты, но и метаданные о них (тип данных, по сути), потому что сегодня органы управления поиском – это отдельная боль. Скажем, как выглядит чекбокс курильщика? А вот он:

В чем тут проблема? В том, что выбор между аккумуляторным и сетевым инструментом не сводится к “покажите мне только аккумуляторные“. На самом деле – это выбор из трех вариантов, только аккумуляторные, только сетевые, и мне все равно. Самое смешное, что зайдя в какой-нибудь соседний раздел вы имено такой набор из двух чекбоксов (или трех радио) и увидите. А почему тут иначе? А фиг его знает. Кто-то когда-то так решил – и все.

И это я еще на начал вспоминать о том, то бывают инструменты, умеющие работать как от сети, так и от аккумулятора. Скажем, из того что сразу пришло в голову – пылесос DeWALT DCV582.

Замечу так же, что если в основу разметки атрибутов положить что-то типа RDF, и некоторые атрибуты сделать URI, то можно было бы легко делать связи между товарами, скажем, принтером, и его расходниками, лобзиком и пилками для него, ну и так далее. Причем связи типизированные, не просто “см. также”, а именно для этого инструмента подходят вот такие аккумуляторы.

В общем-то, такое решение это совсем не новость, его можно посмотреть, взглянув скажем на JIRA (я тут говорю не только про связи между страницами, но и про набор полей, и их вид). Ну то есть, в природе существуют продукты (правда, сделанные совсем для других целей), которые позволяют настраивать UI под себя, в зависимости от того, что именно мы показываем, и весьма гибко.

Выводы

Для начала, хочу отметить, что все что выше описано, не является проблемами, специфичными именно для Яндекс Маркета. Скажем, поиск Амазона в аналогичных ситуациях ведет себя ничуть не лучше, и знание Амазона о производителях тоже оставляет желать. Что с упомянутым e-katalog? Ну тут ситуация чуть другая, судя по всему (я вижу лишь то, что я вижу снаружи) тут за сайтом стоит именно и только пополняемый каким-то способом каталог моделей, поэтому части проблем либо нет, либо они иного сорта. Реально он меня больше устраивает в ряде специфических ситуаций, когда нужно найти не “что-то вроде вот этого”, а “конкретно вот это, и если можно – подешевле”. Но ассортимент, а в итоге объем и глубина каталога тут явно меньше, поэтому шансы найти что-то редкое вообще стремятся к нулю.

Понятно, что у меня нет готового решения. Это лишь предложения, основное из которых – отдать часть работы по поддержке каталога товаров сообществу, раз уж все равно поддержка того же Яндекс Маркета/Амазона с этой работой явно не справляется. Прекрасно представляю все сложности реализации такой идеи на готовом продукте. Но мне кажется, этот путь – чуть ли не единственно возможный путь реального наполнения интернет-каталога знаниями о реальных товарах.

Let’s block ads! (Why?)

Read More

Recent Posts

Роскомнадзор рекомендовал хостинг-провайдерам ограничить сбор данных с сайтов для иностранных ботов

Центр управления связью общего пользования (ЦМУ ССОП) Роскомнадзора рекомендовал компаниям из реестра провайдеров ограничить доступ поисковых ботов к информации на российских сайтах.…

16 часов ago

Apple возобновила переговоры с OpenAI и Google для интеграции ИИ в iPhone

Apple возобновила переговоры с OpenAI о возможности внедрения ИИ-технологий в iOS 18, на основе данной операционной системы будут работать новые…

5 дней ago

Российская «дочка» Google подготовила 23 иска к крупнейшим игрокам рекламного рынка

Конкурсный управляющий российской «дочки» Google подготовил 23 иска к участникам рекламного рынка. Общая сумма исков составляет 16 млрд рублей –…

6 дней ago

Google завершил обновление основного алгоритма March 2024 Core Update

Google завершил обновление основного алгоритма March 2024 Core Update. Раскатка обновлений была завершена 19 апреля, но сообщил об этом поисковик…

6 дней ago

Нейросети будут писать тексты объявления за продавцов на Авито

У частных продавцов на Авито появилась возможность составлять текст объявлений с помощью нейросети. Новый функционал доступен в категории «Обувь, одежда,…

6 дней ago

Объявлены победители международной премии Workspace Digital Awards-2024

24 апреля 2024 года в Москве состоялась церемония вручения наград международного конкурса Workspace Digital Awards. В этом году участниками стали…

6 дней ago