هلدینگ چینی علیبابا چهارشنبه اعلام کرد مدل هوش مصنوعی تولید تصویر و ویدیو خود با نام Wan 2.1 را بهصورت عمومی و متنباز در دسترس کاربران قرار داده است. این اقدام میتواند موجب افزایش استفاده از این مدل و تشدید رقابت در حوزه هوش مصنوعی شود.
براساس گزارش رویترز، علیبابا اعلام کرده چهار نسخه از مدل Wan 2.1 را منتشر کرده است: T2V-1.3B T2V-14B ،I2V-14B-720 و I2V-14B-480P. این مدلها میتوانند از طریق ورودیهای متنی و تصویری، تصاویر و ویدیوهای جدیدی تولید کنند. عدد 14B در نام مدلها نشاندهنده استفاده از 14 میلیارد پارامتر است که امکان پردازش دادههای بیشتر و تولید نتایج دقیقتر را فراهم میکند.

این مدلها بهصورت جهانی از طریق پلتفرمهای ModelScope علیبابا کلود و Hugging Face برای اهداف تحقیقاتی، آکادمیک و تجاری در دسترس هستند.

علیبابا این خبر را پس از اعلام خبر مشابهی از استارتاپ DeepSeek اعلام کرده است. این استارتاپ با عرضه مدلهای متنباز و کمهزینه، توجه سرمایهگذاران فناوری را جلب کرد و با عملکردی قابلرقابت با شرکتهایی مانند OpenAI، باعث شگفتی در این صنعت پرهزینه شد.
هوش مصنوعی تولید ویدیو و تصویر علیبابا

علیبابا در ژانویه نسخه جدید مدل تولید ویدیو و تصویر خود را معرفی کرد و نام آن را از Wanx به Wan تغییر داد. این شرکت توانایی مدل خود در تولید تصاویر بسیار واقعگرایانه را یکی از نقاط قوتش اعلام کرده است.
همچنین علیبابا اعلام کرده این مدل در رتبهبندی VBench که پلتفرم ارزیابی مدلهای تولید ویدیو است، جایگاه برتری به دست آورده و در قابلیتهایی مانند تعامل با چند شیء در یک ویدیو عملکرد بهتری نسبت به رقبا داشته است.
علاوهبراین، غول چینی در هفته جاری اعلام کرد طی 3 سال آینده حداقل 380 میلیارد یوان (52 میلیارد دلار) در زیرساختهای رایانش ابری و هوش مصنوعی سرمایهگذاری خواهد کرد.