Microsoft launched several new “open” AI models on Wednesday, the most capable of which is competitive with OpenAI’s o3-mini on at least one benchmark.
All of the new permissively licensed models — Phi 4 mini reasoning, Phi 4 reasoning, and Phi 4 reasoning plus — are “reasoning” models, meaning they’re able to spend more time fact-checking solutions to complex problems. They expand Microsoft’s Phi “small model” family, which the company launched a year ago to offer a foundation for AI developers building apps at the edge.
Phi 4 mini reasoning was trained on roughly 1 million synthetic math problems generated by Chinese AI startup DeepSeek’s R1 reasoning model. Around 3.8 billion parameters in size, Phi 4 mini reasoning is designed for educational applications, Microsoft says, like “embedded tutoring” on lightweight devices.
Parameters roughly correspond to a model’s problem-solving skills, and models with more parameters generally perform better than those with fewer parameters.
Phi 4 reasoning, a 14-billion-parameter model, was trained using “high-quality” web data as well as “curated demonstrations” from OpenAI’s aforementioned o3-mini. It’s best for math, science, and coding applications, according to Microsoft.
As for Phi 4 reasoning plus, it’s Microsoft’s previously-released Phi-4 model adapted into a reasoning model to achieve better accuracy on particular tasks. Microsoft claims that Phi 4 reasoning plus approaches the performance levels of R1, a model with significantly more parameters (671 billion). The company’s internal benchmarking also has Phi 4 reasoning plus matching o3-mini on OmniMath, a math skills test.
Phi 4 mini reasoning, Phi 4 reasoning, and Phi 4 reasoning plus are available on the AI dev platform Hugging Face accompanied by detailed technical reports.
“Using distillation, reinforcement learning, and high-quality data, these [new] models balance size and performance,” wrote Microsoft in a blog post. “They are small enough for low-latency environments yet maintain strong reasoning capabilities that rival much bigger models. This blend allows even resource-limited devices to perform complex reasoning tasks efficiently.”
বুধবার মাইক্রোসফট বেশ কয়েকটি নতুন “ওপেন” AI মডেল উন্মোচন করেছে, যার মধ্যে সবচেয়ে শক্তিশালীটি অন্তত একটি বেঞ্চমার্কে OpenAI-এর o3-mini মডেলের সাথে প্রতিযোগিতা করতে সক্ষম।
নতুন যেসব মডেল প্রকাশ করা হয়েছে — Phi 4 mini reasoning, Phi 4 reasoning, এবং Phi 4 reasoning plus — সবগুলোই “রিজনিং” মডেল। মানে, জটিল সমস্যার সমাধানে আরও সময় নিয়ে সঠিক তথ্য যাচাই করতে পারে। এরা মাইক্রোসফটের Phi “স্মল মডেল” পরিবারের সম্প্রসারণ, যা AI ডেভেলপারদের জন্য এজ-ডিভাইসে কাজ করার ভিত্তি গঠনের লক্ষ্যে চালু করা হয়েছিল এক বছর আগে।
Phi 4 mini reasoning ট্রেনিং হয়েছে প্রায় ১০ লাখ সিনথেটিক গাণিতিক সমস্যার উপর, যা তৈরি করেছে চীনা AI স্টার্টআপ DeepSeek-এর R1 রিজনিং মডেল। মডেলটি প্রায় ৩.৮ বিলিয়ন প্যারামিটারের এবং হালকা ডিভাইসে “এম্বেডেড টিউটরিং”-এর মতো শিক্ষামূলক অ্যাপ্লিকেশনের জন্য উপযুক্ত।
একটি মডেলের প্যারামিটার সংখ্যা সাধারণত তার সমস্যা সমাধানের ক্ষমতার সূচক। বেশি প্যারামিটার মানেই সাধারণত বেশি দক্ষতা।
Phi 4 reasoning, ১৪ বিলিয়ন প্যারামিটারের একটি মডেল, ট্রেনিং পেয়েছে “উচ্চ মানের” ওয়েব ডেটা এবং OpenAI-এর o3-mini থেকে নির্বাচিত ডেমোনস্ট্রেশনের মাধ্যমে। এটি গাণিতিক, বৈজ্ঞানিক এবং কোডিং অ্যাপ্লিকেশনের জন্য উপযুক্ত।
Phi 4 reasoning plus হলো মাইক্রোসফটের আগের Phi-4 মডেলের একটি উন্নত সংস্করণ, যা নির্দিষ্ট কাজের ক্ষেত্রে আরও নির্ভুলতা অর্জনের জন্য রূপান্তরিত হয়েছে। মাইক্রোসফট দাবি করেছে যে এটি DeepSeek-এর ৬৭১ বিলিয়ন প্যারামিটারের R1 মডেলের কাছাকাছি পারফর্ম করতে সক্ষম। কোম্পানির অভ্যন্তরীণ পরীক্ষায় Phi 4 reasoning plus এবং o3-mini সমানভাবে OmniMath-এ (একটি গাণিতিক দক্ষতা পরীক্ষা) পারফর্ম করেছে।
এই তিনটি মডেল Hugging Face প্ল্যাটফর্মে পাওয়া যাচ্ছে, যেখানে তাদের সঙ্গে বিস্তারিত প্রযুক্তিগত প্রতিবেদনও সংযুক্ত আছে।
মাইক্রোসফট ব্লগ পোস্টে লিখেছে, “ডিস্টিলেশন, রিইনফোর্সমেন্ট লার্নিং এবং উচ্চমানের ডেটা ব্যবহারের মাধ্যমে এই [নতুন] মডেলগুলো আকার ও কর্মক্ষমতার মধ্যে ভারসাম্য বজায় রাখে। এরা যথেষ্ট ছোট যাতে লো-লেটেন্সি পরিবেশে কাজ করতে পারে, তবে একইসাথে এতটাই শক্তিশালী যে বড় মডেলের মতো কার্যক্ষমতা দেখাতে পারে। ফলে কম রিসোর্সে চলা ডিভাইসেও জটিল রিজনিং টাস্ক সহজে সম্পাদন করা যায়।”