خانه
اخبار اقتصادی و عمومی
تکنولوژی
هوش مصنوعی FantasyTalking معرفی شد؛ ساخت شخصیت‌های سخنگوی واقع‌گرایانه [تماشا کنید]

هوش مصنوعی FantasyTalking معرفی شد؛ ساخت شخصیت‌های سخنگوی واقع‌گرایانه [تماشا کنید]

دیجیاتو2 روز قبل

2 روز قبل

1 دقیقه

12,0 بازدیدها

0 دیدگاه

هوش مصنوعی جدید چینی‌ها فقط با یک تصویر و فایل صوتی، ویدیوهایی واقع‌گرایانه با حرکات دقیق لب، چهره، بدن و پس‌زمینه تولید می‌کند.

محققان چینی هوش مصنوعی از مدلی نوآورانه با نام FantasyTalking رونمایی کرده‌اند که می‌تواند فقط با یک تصویر پرتره ثابت، ویدیوهایی واقع‌گرایانه و قابل‌کنترل از چهره‌های درحال صحبت‌ تولید کند. این مدل از معماری پیشرفته مبتنی‌بر Video Diffusion Transformer بهره می‌برد و با استفاده از تکنیک‌های هماهنگ‌سازی صوتی-تصویری، هماهنگی دقیقی میان حرکات لب، حالات چهره، حرکات بدن و صدای ورودی ایجاد می‌کند.

طبق توضیحات صفحه Github این پروژه، در قلب آن استراتژی دومرحله‌ای برای همگام‌سازی صوت و تصویر وجود دارد.

نحوه تولید آواتار سخنگو توسط هوش مصنوعی FantasyTalking

در مرحله اول، مدل با آموزش در سطح کلیپ، حرکات کلی صحنه شامل چهره، اشیای اطراف و پس‌زمینه را با صدای ورودی هماهنگ می‌کند. در مرحله دوم، جزئیات حرکات لب با دقت فریم‌به‌فریم و با استفاده از ماسک‌های خاصی اصلاح می‌شود تا کامل با صدا منطبق شود.

یکی از چالش‌های اساسی در حوزه‌ گرافیک و بینایی ماشین تولید آواتارهای متحرک از تصویر ثابت بوده است. اغلب روش‌های قبلی برای حفظ واقع‌گرایی و هماهنگی با صدا، از مدل‌های سه‌بعدی میانجی مثل 3DMM یا FLAME استفاده می‌کردند اما این روش‌ها در بازتولید حرکات ظریف صورت و انیمیشن‌های طبیعی ناکارآمد بودند.

در ویدیو زیر می‌توانید برخی نمونه‌های ساخته‌ این مدل و مدل‌های دیگر را با هم مقایسه کنید:

FantasyTalking همچنین از ماژول ویژه برای کنترل شدت حرکات بهره می‌برد که امکان تنظیم میزان انیمیشن حالات چهره و بدن را فراهم می‌کند. این ویژگی تولید ویدیوهایی فراتر از حرکت لب‌ها را ممکن می‌کند. برخلاف بسیاری از مدل‌های دیگر، این سیستم برای حفظ هویت چهره از مکانیزمی مبتنی‌بر چهره استفاده می‌کند که نتایج طبیعی‌تر و یکپارچه‌تری ارائه می‌دهد.

از دیگر توانایی‌های این مدل می‌توان به تولید ویدیوهای حرف‌زدن شخصیت‌ها با زوایای مختلف (نمای نزدیک، نیم‌تنه، تمام‌قد، از روبه‌رو یا زاویه‌دار)، پشتیبانی از استایل‌های گرافیکی مختلف (واقع‌گرایانه یا کارتونی) و حتی متحرک‌سازی (Animate) حیوانات اشاره کرد.

در مقایسه با روش‌های بسته و پیشرفته‌ای مانند OmniHuman-1، مدل FantasyTalking از نظر واقع‌گرایی، حفظ هویت، انسجام حرکتی و تطابق صوتی-تصویری کیفیت بالاتری ارائه می‌دهد.

اشتراک‌ها:

زلزله امروز اصفهان

25 دقیقه قبل

خرید ماشین با تتر در ایران

59 دقیقه قبل

آواتار ۱۱ در دوازده دقیقه فروش رفت

59 دقیقه قبل

مدیریت خصوصی عقب‌ماندگی‌ تولید «ایران‌ خودرو» را جبران کرد

1 ساعت قبل

۱۰ مصوبه شورای عالی اشتغال/ تاکید بر تسریع تسهیلات اشتغالی

2 ساعت قبل

ساخت ۳۰۰ هزار مسکن برای کارگران در بازه زمانی ۳ ساله

2 ساعت قبل

مدل هوش مصنوعی GPT-4.1 معرفی شد؛ پرچم‌دار جدید، قدرتمند و کم‌هزینه OpenAI

2 ساعت قبل

صعود فلر به صدر پرسودترین‌ها!

3 ساعت قبل

جهش ۲۰۰ درصدی مانترا پس از سقوط بزرگ!

3 ساعت قبل

مهلت نهایی بخشودگی جرائم مالیات بر ارزش افزوده مشخص شد

بر اساس اعلام سازمان امور مالیاتی، در صورتی که مودیان اظهارنامه مالیاتی خود را در زمان معین و از طریق سامانه مودیان ثبت و ارائه کنند، از بخشودگی جرایم مالیات

3 ماه قبل

خوشحالی ترامپ از ۱۰۰ هزار دلاری شدن بیت کوین! + عکس

دونالد ترامپ در توییتی رسیدن قیمت بیت‌کوین به ۱۰۰ هزار دلار را تبریک گفت.

4 ماه قبل

تغییر زمان واریز یارانه معیشتی اسفند ۱۴۰۳ | از سوپرایز دولت رونمایی شد

پرداخت یارانه نقدی از سوی دولت به مردم، سیاستی است که با هدف حمایت از اقشار کم‌درآمد و جبران بخشی از هزینه‌های زندگی در ایران اجرا می‌شود. این طرح که

1 ماه قبل

قیمت میوه‌های تنظیم بازاری شب عید اعلام شد

رئیس جهاد کشاورزی استان تهران از توزیع میوه‌های تنظیم بازاری از پنجشنبه ۲۳ اسفند خبر داد و گفت: پرتقال با قیمت هر کیلوگرم ۴۲ هزار تومان و سیب ۵۳ هزار

1 ماه قبل

گسترش صادرات خدمات پس از فروش محصولات ایران خودرو

شرکت ایساکو به‌عنوان متولی خدمات پس از فروش محصولات تولیدی شرکت ایران‌خودرو، تعداد نمایندگی‌های فروش قطعات و خدمات پس از فروش خود را در کشور ونزوئلا افزایش داد.

5 ماه قبل

۴ میلیون بازدید از اماکن فرهنگی و تاریخی در نوروز ۱۴۰۴

بیش از ۴ میلیون و ۴۰۰ هزار بازدید از اماکن فرهنگی‌ و تاریخی سراسر کشور در ایام نوروز ۱۴۰۴ ثبت شد. در این میان، تخت جمشید، حافظیه و سعدیه در

2 هفته قبل

ایران، کاندیدای اصلی برای تبدیل شدن به هاب فرآوری مواد معدنی در منطقه

بهرام شکوری، رئیس کمیسیون معدن و صنایع معدنی اتاق ایران، در گفت‌وگویی با اشاره به موقعیت استراتژیک ایران برای تبدیل شدن به هاب فرآوری مواد معدنی در منطقه، بیان کرد:

2 ماه قبل

کاهش تعداد اعضای هیئت مدیره در شرکت های تابعه/ شرکت های غیر مولد و املاک مازاد بفروش می رسند

در راستای اجرای فرهنگ چابک‌سازی در گروه خودروسازی سایپا، تعداد اعضای هیات‌مدیره شرکت‌های تابعه کاهش یافت و املاک مازاد و شرکت‌های غیرمولد در صف فروش قرار گرفتند. این اقدامات علاوه

1 ماه قبل

OpenAI مدعی شد؛ توسعه ابزاری که با دقت 99 درصد تصاویر ساخت هوش مصنوعی را شناسایی می‌کند

شرکت OpenAI درحال توسعه ابزاری به‌منظور تشخیص تصاویر ایجادشده توسط هوش مصنوعی است که دقت 99 درصدی دارد.

6 ماه قبل