شرکت StabilityAI که مالکیت هوش مصنوعی متن‌باز Stable Diffusion را دارد به‌تازگی نسخه جدید این سرویس را در دسترس کاربران قرار داده است که می‌تواند دستورات کاربران را دقیق‌تر اجرا و تصاویر واقعی‌تری خلق کند.

به‌گزارش انگجت، Stable Diffusion که در واقع نسخه جایگزین و متن‌باز سرویس‌های تولید عکس مبتنی بر هوش مصنوعی مانند میدجرنی و DALL-E است و در نسخه جدید خود سعی دارد برخی اشتباهات نسخه پیشین را حل کند. برای مثال، StabilityAI می‌گوید که این نسخه بهتر از سایر ابزارهای هوش مصنوعی تولید تصویر دستورات کاربران را اجرا می‌کند و در زمینه کیفیت خروجی می‌تواند با رقبای نام‌دارش به رقابت بپردازد.

نسخه جدید هوش مصنوعی Stable Diffusion در دسترس کاربران قرار گرفت

هوش مصنوعی Stable Diffusion

همچنین بدون اینکه کاربران نیاز باشد دستور خاصی به ابزار بدهند، این ابزار می‌تواند تنوع بیشتری از سبک‌ها، رنگ‌های پوست و ویژگی‌ها را در تصاویر تولیدی خود بگنجاند.

نسخه ۳.۵ هوش مصنوعی Stable Diffusion هم‌اکنون در ۳ نسخه عرضه می‌شود. اولین و قدرتمندترین نسخه Stable Diffusion 3.5 Large نام دارد که می‌تواند تصاویر را با بالاترین کیفیت برای کاربران خلق کند و با بالاترین دقت ممکن دستورات کاربران را بفهمد. به گفته StabilityAI، این نسخه برای استفاده‌های حرفه‌ای با وضوح ۱ مگاپیکسل مناسب است.

نسخه دوم Large Turbo نام دارد که نسخه‌ای کمی ضعیف‌تر از مدل قبلی است که بیشتر بر کارایی تمرکز دارد تا حداکثر کیفیت. شرکت سازنده می‌گوید که این نسخه می‌تواند در چهار مرحله تصاویری باکیفیت خلق کند و دستورات کاربران را سریعاً متوجه شود.

نسخه سوم نیز Stable Diffusion 3.5 Medium است که برای اجرا بر روی سخت‌افزارهای رایج کاربران طراحی شده و می‌تواند ترکیبی از سادگی و کیفیت را ارائه دهد. با سهولت سفارشی‌سازی بیشتر، این مدل می‌تواند تصاویری بین ۰.۲۵ تا ۲ مگاپیکسل تولید کند. برخلاف دو مدل قبلی که هم‌اکنون در دسترس کاربران هستند، این مدل قرار است در اواخر ماه جاری میلادی به‌صورت رسمی عرضه شود.

همچنین StabilityAI در وبلاگ رسمی خود اعلام کرده است که مدل‌های هوش مصنوعی جدید این شرکت دارای فیلترهای جدیدی برای بازتاب بهتر تنوع انسانی هستند.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *