Перейти к основному содержанию
Microsoft представила Phi-4 15B — открытую модель ИИ с выбором режима рассуждения

Microsoft представила Phi-4 15B — открытую модель ИИ с выбором режима рассуждения

Microsoft представила Phi-4 15B — открытую модель ИИ с выбором режима рассуждения

Microsoft объявила о выпуске Phi-4 15B — новой открытой мультимодальной модели искусственного интеллекта с 15 млрд параметров. Ключевой особенностью модели стала способность самостоятельно определять, когда необходимо задействовать режим рассуждения, а когда — выдавать мгновенный ответ.

Microsoft представила Phi-4 15B — открытую модель ИИ с выбором режима рассуждения

Самостоятельный выбор режима работы

Полное название модели — Phi-4-reasoning-vision-15B. Она предназначена для выполнения сложных задач, включая генерацию описаний изображений, привязку элементов интерфейса к визуальному контексту и решение продвинутых математических задач.

В отличие от большинства языковых моделей с открытым исходным кодом, где режим рассуждения требуется включать или отключать вручную, Phi-4 15B способна принимать это решение самостоятельно. Такой подход потенциально повышает эффективность, однако может приводить к непредсказуемости поведения. Для оценки практической ценности этого механизма необходимы дополнительные испытания в реальных сценариях.

Обучение на 200 млрд токенов

По данным Microsoft, модель была обучена на 200 млрд токенов. Для сравнения, многие крупные модели аналогичного класса используют свыше одного триллиона токенов на этапе обучения.

Команда разработчиков также применяла избирательный подход к формированию обучающей выборки. Предполагается, что использование более качественных данных должно положительно сказаться на качестве ответов. При этом в процессе обучения применялась модель GPT-4o, которая использовалась для содействия тренировке Phi-4 15B.

Результаты тестирования

Microsoft представила результаты тестов Phi-4 15B в сравнении с другими открытыми мультимодальными моделями сопоставимого и более высокого класса. Итоги оказались неоднозначными: в ряде тестов модель превзошла более крупные решения, однако по отдельным показателям уступила конкурентам.

В компании продемонстрировали результаты без попыток завышения показателей в пользу собственной разработки. При этом отмечается, что тестовые метрики не всегда отражают реальные возможности модели, поэтому фактические результаты эксплуатации могут отличаться.

Сравнение точности с популярными открытыми моделями без режима рассуждения

BenchmarkPhi-4-reasoning-vision-15BPhi-4-reasoning-vision-15B – force no thinkPhi-4-mm-instructKimi-VL-A3B-Instructgemma-3-12b-itQwen3-VL-8B-Instruct-4KQwen3-VL-8B-Instruct-32KQwen3-VL-32B-Instruct-4KQwen3-VL-32B-Instruct-32K
AI2D_TEST84.884.768.684.680.482.78384.885
ChartQA_TEST83.376.523.5873983.183.284.384
HallusionBench64.463.15665.265.373.574.174.474.9
MathVerse_MINI44.943.832.441.729.854.557.464.264.2
MathVision_MINI36.234.22028.331.945.75054.360.5
MathVista_MINI75.268.750.567.157.477.176.482.581.8
MMMU_VAL54.35242.3525060.764.668.670.6
MMStar64.563.345.96059.468.969.973.774.3
OCRBench7675.662.686.575.389.29088.588.5
ScreenSpot_v288.288.328.589.83.591.591.593.793.9

Сравнение точности с популярными открытыми моделями с режимом рассуждения

BenchmarkPhi-4-reasoning-vision-15BPhi-4-reasoning-vision-15B – force thinkingKimi-VL-A3B-Thinkinggemma-3-12b-itQwen3-VL-8B-Thinking-4KQwen3-VL-8B-Thinking-40KQwen3-VL-32B-Thinking-4KQwen3-VL-32B-Thinking-40K
AI2D_TEST84.879.781.280.483.583.986.987.2
ChartQA_TEST83.382.973.3397878.678.579.1
HallusionBench64.463.970.665.371.67376.476.6
MathVerse_MINI44.953.16129.867.373.378.378.2
MathVision_MINI36.236.250.331.943.150.760.958.6
MathVista_MINI75.274.178.657.477.779.583.983.8
MMMU_VAL54.35560.25059.365.37272.2
MMStar64.563.969.659.469.372.375.575.7
OCRBench7673.779.975.381.28283.785
ScreenSpot_v288.288.181.83.593.392.783.183.1

Позиционирование и доступность

Серия открытых моделей Phi-4, по оценкам наблюдателей, часто остается в тени на фоне повышенного внимания к разработкам китайских компаний, включая Qwen 3.5. При этом Microsoft в большей степени фокусируется на развитии инфраструктуры для сторонних передовых моделей, чем на активном продвижении собственных решений.

Тем не менее Phi-4 15B позиционируется как компактная модель с конкурентоспособными результатами.

Модель уже доступна публично: открытые весовые коэффициенты можно скачать на платформе Hugging Face и в сервисе Microsoft Foundry.