متا از جدیدترین مجموعه مدلهای هوش مصنوعی Llama 4 رونمایی کرد که میتوان از آنها بهصورت دستیار هوش مصنوعی متا در واتساپ، مسنجر و اینستاگرام استفاده کرد. متا اکنون 2 مدل Llama 4 را منتشر کرده و 2 مدل دیگر که قدرتمندترند، هنوز عرضه نشدهاند.
براساس اعلام متا، Llama 4 Scout یک مدل کوچک 109 میلیارد پارامتری است که میتوانید آن را با یک پردازشگر گرافیکی انویدیا H100 نیز اجرا کنید. مدل Llama 4 Maverick نیز با 400 میلیارد پارامتر عملکردی در سطح GPT-4o و Gemini 2.0 Flash ارائه میدهد. این 2 مدل جدید اکنون برای دانلود از Meta یا Hugging Face در دسترساند.
متا میگوید هنوز درحال آموزش Llama 4 Behemoth است که «مارک زاکربرگ»، مدیرعامل متا، درباره آن میگوید: «قویترین مدل پایه در جهان است.» مدل چهارم نیز LLama 4 Reasoning نام دارد و ماه آینده میلادی خبرهای بیشتری از آن خواهیم شنید.
مدلهای هوش مصنوعی Llama 4 متا

به گفته متا، Llama 4 Scout یک پنجره زمینه 10 میلیون توکنی دارد و میتواند مدلهای Gemma 3 و Gemini 2.0 Flash-Lite گوگل و Mistral 3.1 را که متنباز هستند، شکست دهد. متا درباره عملکرد مدل بزرگتر Maverick خود در مقابل GPT-4o و Gemini 2.0 Flash ادعاهای مشابهی دارد و میگوید نتایج آن با DeepSeek-V3 در کارهای کدنویسی و استدلال با استفاده از کمتر از نیمی از پارامترهای فعالش قابلمقایسه است.
مدل Llama 4 Behemoth نیز 288 میلیارد پارامتر فعال و درمجموع 2 تریلیون پارامتر درمجموع دارد. این مدل هنوز منتشر نشده اما متا میگوید Behemoth میتواند از رقبای خود (GPT-4.5 و Claude Sonnet 3.7) در چندین بنچمارک STEM بهتر عمل کند.
متا میگوید در Llama 4 به معماری «ترکیبی از متخصصان» (MoE) روی آورده است، رویکردی که در آن بخشهای خاصی از یک مدل کار موردنیاز را انجام میدهند. همچنین این 4 مدل چندوجهی آموزش دیدهاند و میتوانند متن، ویدیو و تصویر دریافت و تولید کنند (صدا ذکر نشده است).
همانند مدلهای گذشته، متا مجموعه Llama 4 را «متنباز» مینامد، اگرچه بهدلیل محدودیتهای مجوز متا به آن انتقاد شده است؛ برای مثال، نهادهای تجاری با بیش از 700 میلیون کاربر فعال ماهانه باید قبل از استفاده از مدلهای لاما از متا درخواست مجوز کنند؛ نهاد «پیشگامان متنباز» یا OSI نیز پارسال گفت مدلهای متا را از دسته متنباز خارج میکند.
متا قصد دارد در کنفرانس LlamaCon خود که 29 آوریل (9 اردیبهشت) برگزار میشود، درباره برنامههای آینده مدلها و محصولات هوش مصنوعی خود صحبت کند.