Testy syntetyczne offline: Szybka metoda poprawiająca wyniki wyszukiwania

Optymalizacja pod kątem wyszukiwania wymaga wielu testów. Chcesz mieć pewność, że zmiany pozytywnie wpłyną na Twoją witrynę? W takim razie wypróbuj testy syntetyczne offline.

Author Tomáš Kramár
Last update 2023-11-14
Read time 2 minutes

Testy syntetyczne offline: Szybka metoda poprawiająca wyniki wyszukiwania

Podczas konfigurowania wyszukiwania w witrynie można poprawiać zapytania pojedynczo lub przeprowadzać testy A/B. Jeśli jednak chcesz mieć 100% pewności, że wyszukiwanie zadziała tak, jak powinno, rozważ zastosowanie testów syntetycznych offline. Dlaczego? Ponieważ pozwalają one na bezpieczne testowanie zmian w trybie offline, szybko iterują algorytmy wyszukiwania i eliminują ryzyko utraty konwersji.

Każda firma e-commerce dąży do posiadania doskonałej funkcji wyszukiwania. Niestety, droga do niej nie jest prosta, gdyż wymaga doskonałych umiejętności obserwacyjnych, dobrej znajomości analityki wyszukiwania i systematycznego podejścia. Większość ludzi podąża jednak za swoimi przeczuciami, co nie jest najlepszym rozwiązaniem.

Potęga testów syntetycznych offline

Jedną z najlepszych metod poprawy wyników wyszukiwania jest testowanie syntetyczne offline. Offline, ponieważ nie potrzebujesz rzeczywistych użytkowników do testowania, a syntetyczne, ponieważ używasz tylko danych pomiarowych jako punktu odniesienia – na żywo użytkownicy mogą zachowywać się nieco inaczej. Zaletą tej metody jest to, że nie ryzykujesz negatywnego wpływu na współczynnik konwersji, uzyskujesz wyniki dość szybko i potrzebujesz tylko logów wyszukiwania (a dokładniej: zapytań, wyników i interakcji użytkowników z tymi wynikami).

Metoda działa w następujący sposób: skanujesz przeszłe wyszukiwania użytkowników i uruchamiasz je ponownie z nowym algorytmem rankingowym. Jeśli wiesz, jakie wyniki wyszukiwania zostały zwrócone w przeszłości i które z nich zostały kliknięte lub przekonwertowane, możesz porównać je z wynikami nowego algorytmu rankingowego.

Analiza wyników testów syntetycznych offline

Wyobraźmy sobie, że dla zapytania x stare wyszukiwanie zwróciło produkt X na pozycji 1. Oznacza to, że produkt X był elementem o najwyższej konwersji dla tego zapytania. Z nowym algorytmem, nowe wyszukiwanie dla zapytania x zwróciło produkt X na pozycji 10.

Czy wiesz, które wyszukiwanie było lepsze? Prawidłowa odpowiedź to: pierwotne wyszukiwanie.

Weźmy teraz trudniejszy przykład: zapytanie x zwraca produkt Y jako najlepszy wynik. Niektóre osoby klikają na niego. Wydaje się więc, że jest to trafne dopasowanie, jednak prawdziwy, najlepszy wynik X nie znajduje się wśród rezultatów. Nowe wyszukiwanie rozwiązuje ten problem, umieszczając produkt X na pierwszym miejscu, a produkt Y na drugim. W rzeczywistości to, co może wydawać się regresją, wcale nią nie jest, ponieważ wyniki dla zapytania x są lepsze.

Jak widać, często analiza tego, co jest lepsze, nie jest taka prosta i potrzebne są złożone modele, aby uzyskać wiarygodne i przydatne wyniki.

Istnieją różne modele ilościowe zaprojektowane do pomiaru jakości rankingu, takie jak znormalizowany zdyskontowany skumulowany zysk (NDCG), zdyskontowany skumulowany zysk, średni ranking wzajemny lub poprawność rankingu (precyzja, średnia średnia precyzja itp.).

Wszystkie te wskaźniki są często mierzone tylko w odniesieniu do wyników top-n, ponieważ to one mają największą szansę na bycie zauważonymi przez użytkowników. Istnieją jeszcze bardziej niezawodne i złożone modele oparte na ukrytych informacjach zwrotnych, które są lepiej dostosowane do modelowania jakości wyszukiwania. Każdy z tych wskaźników ma inną charakterystykę i modeluje różne aspekty jakości wyszukiwania, ale ostatecznie, niezależnie od tego, który wybierzesz, uzyskasz ilościową miarę wyszukiwania, której możesz użyć do porównania różnych algorytmów rankingowych.

Więcej niż tylko mierzenie zmian w jakości wyszukiwania

Testy syntetyczne offline pozwalają nie tylko zmierzyć zmianę jakości wyszukiwania – umożliwiają też zrozumienie przyczyn występowania różnic w wydajności. Jeśli testy zostaną przeprowadzone prawidłowo, można otrzymać bogate raporty i zestawienia wydajności poszczególnych historycznych zapytań z nowym rankingiem. Następnie możesz rozpocząć zadawanie pytań i zobaczyć dokładne zapytania, w których pomógł nowy ranking lub wręcz przeciwnie – pogorszył wyniki.

Z naszego doświadczenia wynika, że przeanalizowanie kilku zapytań, które miały największy wpływ na wyniki wyszukiwania, może pomóc w zidentyfikowaniu wzorców, w których nowy ranking ma gorsze wyniki. Następnie można skorygować założenia, zaktualizować algorytm rankingu i ponownie przeprowadzić test offline.

Summary output of a single test run. In this case the ranking has improved by 43%. Below the summary, you can see a performance breakdown (for buckets in 25% granularity) and the number of queries that were improved or deteriorated. Notice how even if this change resulted in an overall improvement, there are queries where ranking is now worse.

Offline synthetic test output ranking search

Example output from an offline synthetic test. You can see the users’ query, the results that was clicked from that particular search and how its position changed in the new ranking (position_from – position_to). You can also see the computed metric – NDCG@10 (Normalized Discounted Cumulative Gain computed over the top 10 results).

Najlepszym sposobem jest połączenie metod

Zaletą testów syntetycznych offline jest to, że ujawniają one ważne wnioski. Jeśli test syntetyczny offline wykaże, że nowe wyszukiwanie jest znacznie gorsze niż obecne, to z reguły będzie ono gorsze. Jeśli test syntetyczny offline wykaże, że nowe wyszukiwanie jest znacznie lepsze niż obecne, to faktycznie, na ogół będzie lepsze. Ale jak bardzo?

Tego ta metoda nie może ci powiedzieć, ponieważ nie reprezentuje zachowania w świecie rzeczywistym. Aby się tego dowiedzieć, należy przeprowadzić test A/B na żywo. Więc, następnym razem, gdy będziesz chciał coś poprawić, poruszaj się zgodnie z tymi krokami:

Znajdź zapytanie, które wymaga poprawy.
Zaktualizuj algorytm rankingowy.
Przeprowadź testy syntetyczne offline, aż będziesz mieć pewność, że nastąpiła poprawa.
Uruchom test A/B na żywo, aby to potwierdzić.
Sprawdzaj i powtarzaj.

Tak właśnie robimy to w Luigi’s Box i dzięki temu mamy know-how, któremu zaufaliście. Dobrą wiadomością jest to, że zintegrowaliśmy testy syntetyczne offline z Luigi’s Box, więc jeśli chcesz je wypróbować, nie musisz opracowywać ich samodzielnie.

Aby dowiedzieć się więcej o tej funkcji, skontaktuj się z naszymi przedstawicielami handlowymi.

Przeczytaj więcej

Powiązane strony i artykuły

Jeśli szukasz podobnych treści, skorzystaj z poniższych opcji i dowiedz się więcej o świecie e-commerce i Luigi’s Box.

Jak dobre jest Twoje wyszukiwanie?

Czy kiedykolwiek zastanawiałeś się, jak dobre jest Twoje wyszukiwanie? Prawdopodobnie jest ono wystarczające dla Ciebie, ale czy jest odpowiednie dla Twoich klientów?

Rozumienie zapytań: Poradź sobie z hasłami z długiego ogona

Ludzie nie używają pełnych zdań podczas wyszukiwania. Jak więc upewnić się, że wyszukiwarka zawsze przynosi trafne wyniki?

Tomáš Kramár CTO & Co-Founder

Tomáš jest CTO i współzałożycielem Luigi's Box. Otrzymał tytuł doktora inżynierii oprogramowania komputerowego na FIIT STU. Tomáš od ponad 10 lat prowadzi badania nad najnowocześniejszymi technologiami wyszukiwania i nieustannie pracuje nad zrewolucjonizowaniem koncepcji wyszukiwania i nawigacji, aby zapewnić użytkownikom stron internetowych jak najlepsze wrażenia.

Więcej wpisów tego autora

Discovery Suite zasilany przez AI

Biznes

Pozycje

Funkcje

Integracja z

Zapoznaj się

Kontakt

Studia Przypadków