Marcin Sawicki

27 kwietnia 2023

AI · Sztuczna inteligencja · Wyszukiwarki generatywne

50% wiarygodności. Amerykańskie badanie wyszukiwarek GPT

Kiedyś do wyszukiwarek wpisywaliśmy hasła. Dziś możemy szukać inaczej. Nowa generacja wyszukiwarek internetowych odpowiada na nasze pytania zadawane tak, jak w rozmowie. To są wyszukiwarki generatywne, pracujące podobnie jak czat boty GPT.

Najbardziej znaną wyszukiwarką generatywną jest Bing, ale są też i inne. To np. NeevaAI, perplexity.ai oraz YouChat. Zamiast wyświetlać listy adresów i źródeł te wyszukiwarki streszczają nam odpowiedź, robią podsumowanie wiedzy i teoretycznie mogą zaoszczędzić sporo czasu. Czy w takim razie umieją streszczać i podsumowywać? Muszą się jeszcze uczyć.

Zespół naukowy z Uniwersytetu Stanforda przetestował wyżej wymienione wyszukiwarki pod kątem wiarygodności. Sprawdzili, czy gdy wyszukiwarka coś twierdzi, to potrafi wskazać skąd ma tę wiedzę, a gdy wskazuje skąd, to czy faktycznie pod wskazanym adresem są informacje zgodne z tym, co mówi wyszukiwarka. Okazuje się, że średnio zaledwie nieco ponad połowa zdań wygenerowanych przez te wyszukiwarki ma pokrycie w cytatach ze źródeł. Cytat nie gwarantuje wcale bezbłędności, bowiem niecałe 75% cytatów potwierdza streszczenia, podsumowania czy zdania wygenerowane przez te wyszukiwarki.

Fragm. pracy Liu, Zhang, Liang „Evaluating Verifiability in Generative Search Engines”, Department of Computer Science, Stanford University, kwiecień 2023.

Oprócz tego zespół badawczy oceniał wyniki pracy wyszukiwarek pod kątem płynności tekstu, przydatności wg użytkujących (do tego zakres użycia cytatów oraz poprawność użycia cytatów-źródeł).
Zespół badawczy pisze, że wyniki powinny zdopingować tworzących wyszukiwarki do dalszej pracy, bo w tej chwili wyszukiwarki generatywne nie są wystarczająco wiarygodne.

50% wiarygodności. Amerykańskie badanie wyszukiwarek GPT

Udostępnij: