Пяцідзесяцігадовы чат-бот праявіў сябе ў тэсце Цьюрынга лепш за GPT-3.5
Амерыканскія спецыялісты з Універсітэта штата Каліфорнія ў Сан-Дыега распрацавалі анлайн-версію гэтага тэста, у якой вырашылі высветліць, хто лепш зможа прыкінуцца чалавекам: створаны ў 1966 годзе чат-бот «Элайза», які парадзіруе псіхааналітыку, або сучасныя GPT-4 і GPT-3.5.
Адзначаецца, што людзей у якасці суразмоўцаў падыспытныя вызначалі ў 63% выпадкаў, а ў 37% іх прымалі за ШІ. Чат-ботам GPT-4 і GPT-3.5 атрымалася выдаць сябе за чалавека ў 41% і 14% выпадкаў, а «Элайзе» гэта нечакана атрымалася ў 27%, што амаль удвая больш, чым у GPT-3.5.
Поспех старажытнай мадэлі тлумачыцца тым, што яе адказы былі вельмі кансерватыўныя і стваралі ілюзію «нязгодлівага суразмоўцы». Акрамя таго, яна не адрознівалася ўласцівым сучасным мадэлям прыязнасцю і шматслоўем, а таксама некаторыя з падыспытных палічылі чат-бот занадта дрэнным, каб быць мадэллю ШІ, таму яны прынялі яго за чалавека.