Badanie: AI w długich rozmowach podwaja liczbę błędów.

Badanie: AI w długich rozmowach podwaja liczbę błędów
Badanie: AI w długich rozmowach podwaja liczbę błędów

Jak sztuczna inteligencja radzi sobie w dialogu?

Jak informuje TSN.ua: Naukowcy z Microsoft Research i Salesforce ustalili, że popularne chatboty oparte na AI popełniają w dłuższych konwersacjach ponad dwa razy więcej błędów. Zjawisko to, określane mianem 'halucynacji' oraz 'inflacji odpowiedzi', znacząco obniża jakość komunikacji z użytkownikiem.

Przeanalizowano ponad 200 tysięcy rozmów z chatbotami. W przypadku pojedynczych zapytań modele osiągały wysoki wskaźnik trafności, sięgający około 90%. W dłuższych, wieloetapowych dialogach skuteczność ta gwałtownie spadała do zaledwie 65%. Im dłuższa jest interakcja, tym większe prawdopodobieństwo wystąpienia nieścisłości w generowanych odpowiedziach.

Nadmiernie rozbudowane wypowiedzi i ich konsekwencje

Analiza wykazała również, że w złożonych rozmowach odpowiedzi modeli stają się dłuższe – od 20% do nawet 300%. Takie 'rozdętnienie' wypowiedzi utrudnia odbiór informacji i może prowadzić do nieporozumień, co jest istotnym wyzwaniem dla tej dynamicznie rozwijającej się technologii.

  • Na globalnym rynku dominuje ChatGPT, z udziałem przekraczającym 80%.
  • Konkurenci, tacy jak Perplexity czy Google Gemini, skupiają łącznie około 15% użytkowników.

Wyniki badania wskazują na pilną potrzebę udoskonalenia algorytmów chatbotów, aby zapewnić większą precyzję i użyteczność w przedłużających się rozmowach. To kluczowy kierunek rozwoju dla technologii AI, które coraz głębiej wnikają w codzienne życie ludzi.

Biorąc pod uwagę ogromną popularność tych narzędzi, szczególnie ChatGPT, poprawa ich stabilności w długotrwałym dialogu może mieć zasadnicze znaczenie dla doświadczeń użytkowników oraz efektywności komunikacji w biznesie i obsłudze klienta.


Czytaj także

Reklama