Мадэль, якая паляпшае невялікія LLM

Навіны / Мадэль, якая паляпшае невялікія LLM

AI research AI platform AI LM AI project About AI AI Company

28.01.2025

🚀 Microsoft прадстаўляе RSTAR-Math — гэта мадэль, якая дазваляе паляпшаць невялікія LLM, такія як Qwen-7B і Phi3-mini, даючы ім працаваць на ўзроўні OpenAI o1 у вырашэнні матэматычных задач.

Мадэль імітуе глыбокае мысленне, аналізуючы кожны крок рашэння для павышэння дакладнасці. На кожным кроку генерыруецца тэкставае тлумачэнне і код на Python, які аўтаматычна правяраецца, каб адсяваць памылкі.

📊 Мадэлі паляпшаюць адна адну за кошт ітэратыўнага навучання ў 4 ітэрацыі, што значна павышае іх рост прадукцыйнасці на тэстах.

Крыніца

Ранейшая навіна Раней Наступная навіна Далей