Tripin.ru
Навигатор по поиску отеля и идей для отдыха по отзывам на TripAdvisor. Умная система, которая превращает хаос отзывов в понятные рекомендации.
«Выбор отеля — это про то, подходит ли он именно вам. Мы помогаем найти это за минуты.» — философия Tripin.ru
О проекте
Это была наша коллаборация с партнёром, который строил проект на своём жизненном опыте. К примеру, для него было очень важно найти отели, где люди пишут о том, что реально чистое и свежее бельё всегда. И тогда человек может даже пятизвёздочному отелю предпочесть трёхзвёздочный, если в соседних пятизвёздочных есть нарекания по белью или по комплектации.
Представьте: вы планируете отпуск. Нужен отель. Вы открываете TripAdvisor и видите... 847 отзывов. Пять звезд, но кто-то пишет про шум, кто-то про старую мебель, кто-то в восторге. Как понять, подходит ли это место вам?
Tripin.ru решает эту проблему через поиск по отзывам. Мы анализируем тысячи отзывов, находим паттерны и превращаем их в понятную информацию: тихий ли отель, удобное ли расположение, хороший ли сервис. Реальные характеристики, которые помогут принять решение за минуты.
Проблема выбора отеля знакома каждому путешественнику. Сотни отзывов, десятки сайтов, противоречивые данные — информации слишком много, и она часто противоречива. Что для одного «отлично», для другого — «невыносимо». А время уходит на чтение отзывов вместо планирования самого путешествия.
Поиск по отзывам выявляет вещи, которых нет в фильтрах агрегаторов. Можно выявлять реновации, актуальность отзывов. Ситуативные вещи: если три недели назад оставили отзыв о простоте или частоте в номере, и ещё несколько подтвердили — это что-то значит. По крайней мере, мы не решаем за пользователя, но подсвечиваем: смотри, обрати внимание, мы нашли вот такие отели.
Поиск по отзывам более честный, ограниченный, но даёт другой пласт взаимодействия с данными. Вещи, которые люди подмечают, и даже люди заказных отзывов не подмечают. А когда сами делятся от всего сердца — либо что-то раздражает, либо что-то радует — это может дать гораздо больше правдивой информации. Поэтому этот сервис именно для такого гиковского поиска.
Галерея (grid)
Как это работает
Tripin.ru понимает отзывы. Система обрабатывает отзывы на разных языках, выделяя ключевые темы: расположение (близость к центру, транспорт, шум улицы), условия (чистота, комфорт, состояние номеров), сервис (персонал, завтрак, дополнительные услуги), окружение (пляж, вид, инфраструктура рядом).
Вы указываете приоритеты — тишина, расположение или сервис — и система находит отели, где об этом пишут положительно. Подбирает варианты с удобной транспортной доступностью. Выделяет места с отличным персоналом. Все это работает на основе реальных отзывов.
Два изображения (block two)
Технологии
Мы собрали 500 тысяч отзывов по локации Букет — это далеко не все, но по нормальным местам покрытие было более-менее нормально. Мы их спарсили, оцифровали, создали карточки отелей, нашли их в других базах и привязали к карте.
Проект использует гибридный поиск: векторный поиск и индексный поиск (Vespa). Гибридный поиск сравнивал результаты из этих двух групп и перемешивал, выбирая наиболее подходящие на основе системы весов. Больше отзывов по теме — выше коэффициент. Особое совпадение по нюансу запроса, который оставил пользователь — повышение веса отеля.
Система работает в разных режимах: можно читать отзывы или просто выдать отели, а дальше уже сам проваливаешься. Если просто математически каких-то отзывов больше в этой модели — повышали коэффициент. Если есть особое совпадение по нюансу запроса — этот отель получал больше вес.
Прототип работал отлично: находил именно то, что нужно, потому что был реализован по такой системе, где векторный поиск, индексный поиск и гибридный поиск работали вместе.
Широкое изображение
Статус проекта
Проект находится на стадии разработки, но такой, можно сказать, "несмешной разработки", потому что пока он не в приоритете. Сам по себе эксперимент хотелось бы сделать публичным — чтобы можно было даже на этой коллекции, даже не обновляемой, посмотреть, как это работает. А возможно, это и превратится в коммерческий сервис.