Evo — это базовая модель генома, обученная на сотнях миллиардов маркеров ДНК и способная прогнозировать и генерировать последовательности ДНК в масштабе отдельных молекул, молекулярных комплексов, биологических систем и даже целых геномов.
На основе современной архитектуры гибридной модели StripedHyena, Evo обеспечивает языковое моделирование с разрешением в один нуклеотид при длине контекста 131 КБ. Evo точно выполняет прогнозирование с нулевой суммой для различных задач по прогнозированию приспособленности белков, РНК или регуляторной ДНК или экспрессии, которые соответствуют специализированным моделям или превосходят их по эффективности.
Evo — это генеративная модель, используемая для отбора образцов белков CRISPR-Cas и их некодирующих направленных РНК, мультигенных мобильных систем и последовательности размером около 650 кб, которая воспроизводит кодирующую организацию реального генома.
Программа имеет открытый исходный код, который может использовать каждый.