Badanie: AI w długich rozmowach podwaja liczbę błędów.
Jak sztuczna inteligencja radzi sobie w dialogu?
Jak informuje TSN.ua: Naukowcy z Microsoft Research i Salesforce ustalili, że popularne chatboty oparte na AI popełniają w dłuższych konwersacjach ponad dwa razy więcej błędów. Zjawisko to, określane mianem 'halucynacji' oraz 'inflacji odpowiedzi', znacząco obniża jakość komunikacji z użytkownikiem.
Przeanalizowano ponad 200 tysięcy rozmów z chatbotami. W przypadku pojedynczych zapytań modele osiągały wysoki wskaźnik trafności, sięgający około 90%. W dłuższych, wieloetapowych dialogach skuteczność ta gwałtownie spadała do zaledwie 65%. Im dłuższa jest interakcja, tym większe prawdopodobieństwo wystąpienia nieścisłości w generowanych odpowiedziach.
Nadmiernie rozbudowane wypowiedzi i ich konsekwencje
Analiza wykazała również, że w złożonych rozmowach odpowiedzi modeli stają się dłuższe – od 20% do nawet 300%. Takie 'rozdętnienie' wypowiedzi utrudnia odbiór informacji i może prowadzić do nieporozumień, co jest istotnym wyzwaniem dla tej dynamicznie rozwijającej się technologii.
- Na globalnym rynku dominuje ChatGPT, z udziałem przekraczającym 80%.
- Konkurenci, tacy jak Perplexity czy Google Gemini, skupiają łącznie około 15% użytkowników.
Wyniki badania wskazują na pilną potrzebę udoskonalenia algorytmów chatbotów, aby zapewnić większą precyzję i użyteczność w przedłużających się rozmowach. To kluczowy kierunek rozwoju dla technologii AI, które coraz głębiej wnikają w codzienne życie ludzi.
Biorąc pod uwagę ogromną popularność tych narzędzi, szczególnie ChatGPT, poprawa ich stabilności w długotrwałym dialogu może mieć zasadnicze znaczenie dla doświadczeń użytkowników oraz efektywności komunikacji w biznesie i obsłudze klienta.
Czytaj także
- Dlaczego składane smartfony z Androidem wytrzymują zaledwie 2–3 lata?
- Zawodne turbodoładowanie: oto najbardziej awaryjne silniki i jak ich nie zniszczyć
- JD Power ujawnia ranking niezawodności aut: BMW na czele, Audi i Mercedes rozczarowują
- Ukraiński dron-barracuda jako latający arsenał: ile FPV może przenosić?
- Martwy piksel na ekranie – czy da się go naprawić bez serwisu?
- Fotowoltaika wtapia się w zabytki: panele udające cegłę i dachówkę

