Мадэль, якая паляпшае невялікія LLM
28.01.2025

🚀 Microsoft прадстаўляе RSTAR-Math — гэта мадэль, якая дазваляе паляпшаць невялікія LLM, такія як Qwen-7B і Phi3-mini, даючы ім працаваць на ўзроўні OpenAI o1 у вырашэнні матэматычных задач.
Мадэль імітуе глыбокае мысленне, аналізуючы кожны крок рашэння для павышэння дакладнасці. На кожным кроку генерыруецца тэкставае тлумачэнне і код на Python, які аўтаматычна правяраецца, каб адсяваць памылкі.
📊 Мадэлі паляпшаюць адна адну за кошт ітэратыўнага навучання ў 4 ітэрацыі, што значна павышае іх рост прадукцыйнасці на тэстах.