هلدینگ چینی علی‌بابا چهارشنبه اعلام کرد مدل هوش مصنوعی تولید تصویر و ویدیو خود با نام Wan 2.1 را به‌صورت عمومی و متن‌باز در دسترس کاربران قرار داده است. این اقدام می‌تواند موجب افزایش استفاده از این مدل و تشدید رقابت در حوزه هوش مصنوعی شود.

براساس گزارش رویترز، علی‌بابا اعلام کرده چهار نسخه از مدل Wan 2.1 را منتشر کرده است: T2V-1.3B T2V-14B ،I2V-14B-720 و I2V-14B-480P. این مدل‌ها می‌توانند از طریق ورودی‌های متنی و تصویری، تصاویر و ویدیوهای جدیدی تولید کنند. عدد 14B در نام مدل‌ها نشان‌دهنده استفاده از 14 میلیارد پارامتر است که امکان پردازش داده‌های بیشتر و تولید نتایج دقیق‌تر را فراهم می‌کند.

این مدل‌ها به‌صورت جهانی از طریق پلتفرم‌های ModelScope علی‌بابا کلود و Hugging Face برای اهداف تحقیقاتی، آکادمیک و تجاری در دسترس هستند.

علی‌بابا این خبر را پس از اعلام خبر مشابهی از استارتاپ DeepSeek اعلام کرده است. این استارتاپ با عرضه مدل‌های متن‌باز و کم‌هزینه، توجه سرمایه‌گذاران فناوری را جلب کرد و با عملکردی قابل‌رقابت با شرکت‌هایی مانند OpenAI، باعث شگفتی در این صنعت پرهزینه شد.

هوش مصنوعی تولید ویدیو و تصویر علی‌بابا

علی‌بابا در ژانویه نسخه جدید مدل تولید ویدیو و تصویر خود را معرفی کرد و نام آن را از Wanx به Wan تغییر داد. این شرکت توانایی مدل خود در تولید تصاویر بسیار واقع‌گرایانه را یکی از نقاط قوتش اعلام کرده است.

همچنین علی‌بابا اعلام کرده این مدل در رتبه‌بندی VBench که پلتفرم ارزیابی مدل‌های تولید ویدیو است، جایگاه برتری به دست آورده و در قابلیت‌هایی مانند تعامل با چند شیء در یک ویدیو عملکرد بهتری نسبت به رقبا داشته است.

علاوه‌براین، غول چینی در هفته جاری اعلام کرد طی 3 سال آینده حداقل 380 میلیارد یوان (52 میلیارد دلار) در زیرساخت‌های رایانش ابری و هوش مصنوعی سرمایه‌گذاری خواهد کرد.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *