
Для прыкладу, з яго дапамогай робатызаваны маніпулятар навучыўся адкрываць высоўныя скрыні.
Eureka выкарыстоўвае GPT-4 і генератыўныя мадэлі для напісання кода. AI-агент прымае каментарыі ад чалавека і рэдагуе алгарытм. Пры гэтым сістэма разумее натуральную мову, і ёй неабавязкова паведамляць дакладныя параметры, якія трэба выправіць. Для больш эфектыўнага навучання Eureka можа аналізаваць вялікія выбаркі кандыдатаў на ўзнагароджанне, выбіраючы з іх лепшых.
Навучанне адбываецца ў дадатку для мадэлявання фізікі Nvidia Isaac Gym. Праграмы ўзнагароджання, створаныя Eureka, пераўзыходзяць праграмы, напісаныя экспертамі, у больш чым 80% задач, павялічваючы прадукцыйнасць робатаў на 50% у сярэднім. Агент выкарыстоўвае мадэляванне з паскарэннем на графічным працэсары для хуткай ацэнкі якасці кандыдатаў на ўзнагароджанне і самаўдасканалення.