OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چت‌بات خود اضافه کرده و از GPT-4o برای تولید تصویر در این چت‌بات استفاده می‌کند. این قابلیت دقت رنگ‌های تصاویر و رندر متن در تصاویر را تا حد قابل‌‌توجهی بهبود می‌دهد.

به‌ گفته «تارا کریستینسن»، سخنگوی OpenAI ویژگی جدید از امروز در دسترس همه کاربران قرار می‌گیرد. او افزود کاربران نسخه عادی ChatGPT باوجود بعضی محدودیت‌ها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. البته ممکن است این محدودیت‌ها نیز به‌مرور براساس تقاضا یا استقبال کاربران تغییر کند.

قابلیت جدید ChatGPT تصاویر را یکپارچه‌تر می‌کند

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و توسعه این قابلیت استفاده شده است؛ مدلی که توانایی پردازش انواع مختلف داده‌‌ها را دارد.

او همچنین از بهبود قابل‌توجه ویژگی «Binding» در ساخت تصاویر گفت: «مدل‌های قدیمی اغلب در حفظ انسجام تصاویر مشکل داشتند، مخصوصاً زمانی که عناصر بیشتری را به عکس‌ها اضافه می‌کردیم.» مثلاً ممکن بود مدل هوش مصنوعی به‌جای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.

این مشکل در ChatGPT رفع شده و مدل جدید می‌تواند بین ۱۵ تا ۲۰ عنصر را به‌درستی در عکس قرار دهد اما مدل‌های قدیمی فقط می‌توانستند 5 تا 8 عنصر را بدون اشتباه تولید کنند.

ChatGPT حالا می‌تواند با مدل GPT-4o تصاویر بهتری تولید کند
عکس ساخته‌شده با Images in ChatGPT

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» استفاده می‌کند؛ یعنی ChatGPT مثل نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست می‌سازد. درحالی‌که مدل‌های قبلی مثل DALL·E براساس روش Diffusion model کل تصویر را هم‌زمان پردازش و طراحی می‌کردند. همین موضوع احتمالاً باعث شده تا یکپارچگی تصاویر بهبود یابد.

مدیر تیم تحقیقاتی OpenAI قابلیت جدید ChatGPT را نتیجه تست‌های متعدد و بعضاً تکراری تیمش در ماه‌های اخیر می‌داند. البته او گفت این ویژگی هنوز در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را هم‌زمان حفظ می‌کند.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *