شرکت StabilityAI که مالکیت هوش مصنوعی متنباز Stable Diffusion را دارد بهتازگی نسخه جدید این سرویس را در دسترس کاربران قرار داده است که میتواند دستورات کاربران را دقیقتر اجرا و تصاویر واقعیتری خلق کند.
بهگزارش انگجت، Stable Diffusion که در واقع نسخه جایگزین و متنباز سرویسهای تولید عکس مبتنی بر هوش مصنوعی مانند میدجرنی و DALL-E است و در نسخه جدید خود سعی دارد برخی اشتباهات نسخه پیشین را حل کند. برای مثال، StabilityAI میگوید که این نسخه بهتر از سایر ابزارهای هوش مصنوعی تولید تصویر دستورات کاربران را اجرا میکند و در زمینه کیفیت خروجی میتواند با رقبای نامدارش به رقابت بپردازد.
نسخه جدید هوش مصنوعی Stable Diffusion در دسترس کاربران قرار گرفت
همچنین بدون اینکه کاربران نیاز باشد دستور خاصی به ابزار بدهند، این ابزار میتواند تنوع بیشتری از سبکها، رنگهای پوست و ویژگیها را در تصاویر تولیدی خود بگنجاند.
نسخه ۳.۵ هوش مصنوعی Stable Diffusion هماکنون در ۳ نسخه عرضه میشود. اولین و قدرتمندترین نسخه Stable Diffusion 3.5 Large نام دارد که میتواند تصاویر را با بالاترین کیفیت برای کاربران خلق کند و با بالاترین دقت ممکن دستورات کاربران را بفهمد. به گفته StabilityAI، این نسخه برای استفادههای حرفهای با وضوح ۱ مگاپیکسل مناسب است.
نسخه دوم Large Turbo نام دارد که نسخهای کمی ضعیفتر از مدل قبلی است که بیشتر بر کارایی تمرکز دارد تا حداکثر کیفیت. شرکت سازنده میگوید که این نسخه میتواند در چهار مرحله تصاویری باکیفیت خلق کند و دستورات کاربران را سریعاً متوجه شود.
نسخه سوم نیز Stable Diffusion 3.5 Medium است که برای اجرا بر روی سختافزارهای رایج کاربران طراحی شده و میتواند ترکیبی از سادگی و کیفیت را ارائه دهد. با سهولت سفارشیسازی بیشتر، این مدل میتواند تصاویری بین ۰.۲۵ تا ۲ مگاپیکسل تولید کند. برخلاف دو مدل قبلی که هماکنون در دسترس کاربران هستند، این مدل قرار است در اواخر ماه جاری میلادی بهصورت رسمی عرضه شود.
همچنین StabilityAI در وبلاگ رسمی خود اعلام کرده است که مدلهای هوش مصنوعی جدید این شرکت دارای فیلترهای جدیدی برای بازتاب بهتر تنوع انسانی هستند.