Nasze dane pokazują, że podczas wyszukiwania określonego produktu większość osób używa około 1,5 słowa. Te krótkie zapytania niestety utrudniają wyszukiwanie pełnotekstowe, które oferuje najefektywniejsze wyniki. Chociaż istnieje poprawa w stosowaniu filtrów, często jest ich tak wiele, że jedynie utrudniają sprawę.
Jednym ze sposobów na zwiększenie efektywności wyszukiwania jest zastosowanie podejścia “uczenia się rankingowania”, które tworzy optymalny wykaz wyników. Jednak nawet ta metoda uczenia maszynowego nie jest wszechmocna. Dlatego właśnie opracowaliśmy Zrozumienie Zapytań – świetnego towarzysza w tym zadaniu.
Wyszukiwanie pełnotekstowe jest doskonałym rozwiązaniem, jeśli używasz dłuższych zapytań – powiedzmy czterech lub więcej słów – lub specjalnych terminów, takich jak kod produktu. W takich przypadkach zwykle podaje dokładnie to, czego szukasz na pierwszej pozycji lub pokazuje stronę “Brak wyników”. Tak czy inaczej, obie sytuacje są lepsze niż oferowanie zestawienia całkowicie nieistotnych wyników. Niestety, często tak się dzieje, jeśli używasz krótszych zapytań, minimalizujesz lub pomijasz unikalne słowa.
Jak działa wyszukiwanie w prawdziwym świecie
W rzeczywistości większość ludzi wyszukuje właśnie w ten sposób. Nasze dane pokazują, że ludzie używają średnio 1,43 słowa na zapytanie (z odchyleniem standardowym +/- 0,58, obliczonym dla naszych ponad 150 najbardziej aktywnych użytkowników). Chociaż mamy klientów z wieloma zapytaniami zawierającymi tylko kod produktu (zależy to od domeny), mediana zapytań zawierających tylko kod wynosi tylko 2,9%.
Ludzie korzystający z krótkich, niespecyficznych zapytań są podstawą problemów związanych z technologią wyszukiwania pełnotekstowego. Minusy wyszukiwania pełnotekstowego są takie same jak jego główne zalety – może ono odnaleźć wszystko, co pasuje do zapytania, i to dosłownie wszędzie. Dlatego też zazwyczaj zawiera mnóstwo wyników, które potem wyszukiwarka musi posortować. Wynik pełnotekstowy, obliczany na podstawie krótkich, niespecyficznych zapytań, nie jest wystarczająco dobry, aby uzyskać najbardziej trafny ranking wyników.
Jak powinny zareagować firmy z branży e-commerce?
Właśnie dlatego istnieje opcja ” uczenia się rankingowania”. Ta oparta na uczeniu maszynowym metoda, porządkuje wyniki według wartości liczbowej reprezentującej ich trafność i łączy ludzkie zachowanie z pełnotekstowymi metrykami. W ten sposób, tworzony jest optymalny ranking wyników. W wyszukiwarce Luigi’s Box włączyliśmy już ten mechanizm do naszych produktów związanych z wyszukiwaniem. Zauważyliśmy jednak, że pomimo tego, że jest to bardzo pomocne rozwiązanie, nie jest ostatecznym narzędziem pozbywającym się całego problemu. Trudno jest nauczyć się właściwego modelu rankingowego dla zapytania, które pojawia się raz w miesiącu, ale istnieje wiele domen, w których występuje długi ogon takich zapytań i należy się nimi zająć.
Dobrym rozwiązaniem byłoby skłonienie użytkowników do polegania w większym stopniu na filtrach w celu zawężenia wyników wyszukiwania w oparciu o konkretne parametry ich zainteresowania. Jednak filtry mogą być przytłaczające. Na przykład jeden z naszych klientów ma ponad 2000 różnych parametrów (w zależności od kategorii produktu) i prawie 19 000 różnych wartości dla tych parametrów. Niemożliwe jest zbudowanie intuicyjnego i prostego interfejsu dla nich wszystkich.
Zrozumienie zapytań dostępne na wyciągnięcie ręki
Nasze podejście do tego problemu polega na rozpoznawaniu intencji wyszukiwania użytkowników i przekształcaniu maksymalnej liczby zapytań w filtry wartość-słów. Na przykład, jeśli użytkownik wpisze “otwarte słuchawki”, automatycznie rozpoznamy filtr “System akustyczny: otwarty”, który jest zwykle niedostępny dla standardowych fasetów. Możemy poradzić sobie z każdym z tysięcy dostępnych parametrów i włączyć filtry, które nie byłyby dostępne dla użytkowników, jeśli system rozpozna taką potrzebę.
Wyjątkowym, ale dość częstym przypadkiem jest wyszukiwanie kategorii. W takim przypadku przekierowujemy na stronę kategorii, tym samym przenosimy użytkowników na (często) ręcznie tworzoną stronę z treściami zależnymi od kontekstu witryny, np. z banerami, promocjami itp. Teraz zostały im wyświetlone odpowiednie wyniki i aktualne oferty!
Nasza funkcja, Rozumienie Zapytań, może rozpoznawać kategorie, marki i parametry produktów, co pomaga użytkownikom uzyskać bardziej trafne wyniki dla krótkich zapytań. Jest ona dostępna dla wszystkich naszych klientów.
Tomáš jest CTO i współzałożycielem Luigi's Box. Otrzymał tytuł doktora inżynierii oprogramowania komputerowego na FIIT STU. Tomáš od ponad 10 lat prowadzi badania nad najnowocześniejszymi technologiami wyszukiwania i nieustannie pracuje nad zrewolucjonizowaniem koncepcji wyszukiwania i nawigacji, aby zapewnić użytkownikom stron internetowych jak najlepsze wrażenia.
Więcej wpisów tego autora