مایکروسافت از توسعه بزرگ‌ترین مدل هوش مصنوعی «1 بیتی» با نام BitNet b1.58 2B4T خبر داده است. به گفته ردموندی‌ها، این مدل به‌صورت متن‌باز و تحت مجوز MIT منتشر شده و به اندازه‌ای بهینه است که روی پردازنده‌های معمولی مانند اپل M2 نیز اجرا می‌شود.

مدل‌های 1 بیتی یا به‌اصطلاح BitNet، نسخه‌های فشرده‌ای از مدل‌های هوش مصنوعی هستند که به‌گونه‌ای طراحی شده‌اند تا با استفاده از منابع سخت‌افزاری محدود نیز عملکرد مناسبی داشته باشند. در این مدل‌ها، وزن‌ها تنها با سه مقدار -1، 0 و 1 نمایش داده می‌شوند که این امر باعث کاهش چشمگیر مصرف حافظه و افزایش سرعت اجرا می‌شود.

براساس گزارش تک‌کرانچ، مدل جدید مایکروسافت دارای 2 میلیارد پارامتر است و روی مجموعه‌ داده‌ای شامل 4 تریلیون توکن آموزش دیده است (معادل حدود 33 میلیون کتاب).

عملکرد مدل 1 بیتی مایکروسافت

هوش مصنوعی جدید و فوق بهینه مایکروسافت با قابلیت اجرا روی CPU معرفی شد

طبق نتایج منتشرشده، BitNet b1.58 2B4T توانسته در تست‌هایی ازجمله GSM8K (ریاضی ابتدایی) و PIQA (منطق فیزیکی) از مدل‌های هم‌رده خود مانند Llama 3.2 1B (متعلق به متا)، Gemma 3 1B (متعل به گوگل) و Qwen 2.5 1.5B (متعلق به گروه علی‌بابا) امتیاز بهتری دریافت کند.

مایکروسافت همچنین اعلام کرده که این مدل در برخی موارد تا 2 برابر سریع‌تر از مدل‌های مشابه عمل می‌کند و درعین‌حال تنها بخشی از حافظه موردنیاز مدل‌های رایج را مصرف می‌کند.

بااین‌حال، برای دستیابی به این مدل، باید از فریمورک اختصاصی مایکروسافت با نام bitnet.cpp استفاده کرد که درحال‌حاضر تنها با سخت‌افزارهای محدودی سازگار است و پشتیبانی از GPUها (که نقش مهمی در اجرای مدل‌های هوش مصنوعی دارند) را شامل نمی‌شود.

این موضوع نشان می‌دهد که اگرچه BitNetها پتانسیل بالایی برای استفاده در دستگاه‌های کم‌مصرف و محدود دارند، اما چالش سازگاری سخت‌افزاری همچنان یکی از موانع اصلی توسعه آن‌ها محسوب می‌شود.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *