Мы выкарыстоўваем файлы cookie на гэтым сайце для паляпшэння вашага вопыту карыстання.
Для больш падрабязнай інфармацыі азнаёмцеся з Палітыка канфідэнцыяльнасці

Мадэль, якая паляпшае невялікія LLM
28.01.2025

🚀 Microsoft прадстаўляе RSTAR-Math — гэта мадэль, якая дазваляе паляпшаць невялікія LLM, такія як Qwen-7B і Phi3-mini, даючы ім працаваць на ўзроўні OpenAI o1 у вырашэнні матэматычных задач.

Мадэль імітуе глыбокае мысленне, аналізуючы кожны крок рашэння для павышэння дакладнасці. На кожным кроку генерыруецца тэкставае тлумачэнне і код на Python, які аўтаматычна правяраецца, каб адсяваць памылкі.

📊 Мадэлі паляпшаюць адна адну за кошт ітэратыўнага навучання ў 4 ітэрацыі, што значна павышае іх рост прадукцыйнасці на тэстах.

 

Крыніца