در آخرین روز از رویداد 12 روزه معرفی محصولات و قابلیتهای جدید مدلهای هوش مصنوعی OpenAI، این شرکت بزرگترین خبر خود را اعلام کرد. شب گذشته از مدل استدلالگر o3 بهعنوان جایگزین o1 رونمایی شد، اما هنوز فاصله زیادی تا عرضه عمومی آن داریم.
بهگزارش تککرانچ، مدل هوش مصنوعی o3 که در واقع خانوادهای از مدلها شامل o3 و o3-mini است. مدل مینی کوچکتر و سبکتر خواهد بود تا برای امور خاص کارایی بیشتری داشته باشد. OpenAI ادعا میکند که خانواده o3 حداقل در برخی شرایط خاص به سطح هوش جامع مصنوعی (AGI) نزدیک میشود. اما البته هنوز کاستیهای زیادی وجود دارد و راه زیادی تا رسیدن به یک مدل AGI واقعی وجود دارد.
مدل هوش مصنوعی o3 جانشین o1 است، اما چرا نام آن o2 نیست؟ احتمالاً مشکلات حقوقی مانع از این مسئله شده است. طبق گزارش نشریه اینفورمیشن، OpenAI از روی o2 پریده تا با اپراتور مخابراتی بریتانیایی O2 دچار درگیری حقوقی نشود. «سم آلتمن»، مدیرعامل OpenAI بهنحوی این مسئله را در پخش زنده این شرکت تأیید کرد.
عرضه پیشنمایش مدل هوش مصنوعی OpenAI o3
مدلهای o3 و o3-mini هنوز بهصورت گسترده در دسترس قرار نگرفتهاند، اما کارشناسان ایمنی میتوانند برای دسترسی به پیشنمایش o3-mini از امروز نامنویسی کنند. پیشنمایش o3 در آینده عرضه میشود، اما OpenAI هنوز تاریخی اعلام نکرده است. آلتمن میگوید برنامه آنها این است که o3-mini در اواخر ژانویه و پس از آن o3 در دسترس قرار بگیرد.
مدل هوش مصنوعی o3 با روشی موسوم به «یادگیری تقویتی» آموزش داده شده است تا پیش از پاسخدادن با فرایندی که OpenAI آن را «زنجیره خصوصی تفکر» مینامد، فکر کند. این مدل قادر است در حین انجام یک کار استدلال و قدمهای بعدی را از پیش برنامهریزی کند. در نتیجه میتواند با برداشتن مجموعهای از قدمها یک مسئله را حل کند.
یکی از تفاوتهای o3 با o1 قابلیت مدل جدید در تنظیم زمان استدلال است. این مدلها را میتوان تنظیم کرد تا زمان رایانش (یا تفکر) کوتاه، متوسط یا طولانی داشته باشند. هرچه زمان بیشتری در اختیار مدل o3 برای فکرکردن وجود داشته باشد، کارها را بهتر انجام میدهد.
در خصوص ادعای نزدیکشدن o3 به سطح AGI، این مدل در بنچمارک ARC-AGI که نشان میدهد یک سیستم هوش مصنوعی تا چه حد میتواند مهارتهای جدید را خارج از دادههای آموزشی خود یاد بگیرد، به امتیاز 87.5 درصد دست یافته است. این امتیاز البته در حالت تفکر طولانی بهدست آمده است. o3 در بدترین حالت (با زمان تفکر کوتاه) 3 برابر عملکرد بهتری نسبت به o1 دارد.