شرکت ElevenLabs حالا سرویس کلون‌کردن صدا با هوش مصنوعی و API تبدیل متن به گفتار ارائه می‌دهد. این شرکت به‌تازگی قابلیت ساخت ربات‌های مکالمه‌محور با هوش مصنوعی را معرفی کرده است.

به‌گزارش تک‌کرانچ، این استارتاپ اعلام کرد کاربران اکنون می‌توانند روی پلتفرم توسعه‌دهنده ElevenLabs دستیار مکالمه‌ای (Conversational Agent) بسازند که شامل متغیرهای قابل‌تنظیمی مانند لحن صدا و طول پاسخ‌ها است.

تا پیش از این ElevenLabs روی ارائه صداهای مختلف و ابزارهای هوش مصنوعی برای خدمات تبدیل متن به گفتار متمرکز بود. به گفته «سم اسکلار»، مدیر رشد این شرکت، بسیاری از مشتریان از این قابلیت برای ایجاد ایجنت مکالمه‌محور استفاده می‌کردند. اما چالش اصلی، یکپارچه‌سازی پایگاه دانش و مدیریت وقفه‌های مشتریان بود. به همین دلیل این شرکت تصمیم گرفت یک خط تولید کامل برای پردازش ربات‌های مکالمه‌ای بسازد.

امکانات جدید برای ساخت دستیار مکالمه‌ای

کاربران می‌توانند با ورود به حساب‌کاربری ElevenLabs، یک دستیار مکالمه‌ای ایجاد کنند. آنها می‌توانند با انتخاب یک الگو یا ساخت پروژه جدید، تنظیماتی مانند زبان اصلی ایجنت، پیام اولیه، و پرامپت سیستم برای تعیین شخصیت دستیار را مشخص کنند. توسعه‌دهندگان همچنین باید یک مدل زبانی بزرگ مانند Gemini یا Claude، میزان خلاقیت پاسخ و محدودیت استفاده از توکن‌ها را تنظیم کنند. قابلیت‌های دیگر این سرویس از قرار زیر است:

  • تنظیماتی مانند صدا، تأخیر در پاسخ، پایداری، معیارهای احراز هویت، و حداکثر طول مکالمه.
  • اضافه‌کردن پایگاه دانش سفارشی شامل فایل‌ها، لینک‌ها یا بلوک‌های متنی برای پشتیبانی از ربات مکالمه‌ای.
  • یکپارچه‌سازی مدل زبانی سفارشی با ربات.

شرکت‌ها می‌توانند معیارهایی را برای جمع‌آوری اطلاعات خاص از مشتریان (مانند نام و ایمیل) و همچنین ارزیابی موفقیت یا شکست مکالمه در قالب زبان طبیعی تعریف کنند.

توسعه قابلیت‌های گفتاری در دستیار هوش مصنوعی

ElevenLabs

ElevenLabs از خط تولیدی اختصاصی برای تبدیل متن به گفتار بهره می‌برد اما برای محصول جدیدش، قابلیت تبدیل گفتار به متن را نیز توسعه داده است. اگرچه درحال‌حاضر API تبدیل گفتار به متن را به‌صورت مستقل ارائه نمی‌کند، ممکن است در آینده این کار را انجام دهد و با سرویس‌های شرکت‌هایی مانند آمازون، مایکروسافت، گوگل و همچنین APIهای تخصصی مانند Whisper (OpenAI) ،AssemblyAI ،Deepgram ،Speechmatics و Gladia رقابت کند.

این شرکت که به‌دنبال جذب سرمایه جدید با ارزشی بیش از 3 میلیارد دلار است، با استارتاپ‌های دیگری مانند Vapi و Retell که دستیار‌های مکالمه‌ای می‌سازند، رقابت می‌کند. همچنین رقیب API مکالمه لحظه‌ای OpenAI خواهد بود. بااین‌حال، ElevenLabs معتقد است قابلیت‌های سفارشی‌سازی و توانایی تغییر مدل‌ها، مزیت رقابتی آن نسبت به OpenAI خواهد بود.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *