یک سامانه پادکست‌سازی مبتنی بر هوش مصنوعی هر هفته ۳۰۰۰ قسمت تولید می‌کند — و مردم گوش می‌دهند

در مسیر رسیدن به ۱۵۰٬۰۰۰ قسمت تا پایان ۲۰۲۵، شبکه پادکست Quiet Please از Inception Point AI بر کمیت بیش از کیفیت تأکید دارد

هیچ صنعتی در برابر هوش مصنوعی ایمن نیست؛ حتی پادکست‌سازی هم مستثنی نیست.

این ادعا اغراق نیست. در حال حاضر حداقل ۱۷۵٬۰۰۰ قسمت پادکست تولید شده توسط هوش مصنوعی در پلتفرم‌هایی مانند Spotify و Apple موجود است. این نوآوری به لطف Inception Point AI، یک استارتاپی با تنها هشت کارمند، که در هر هفته ۳۰۰۰ قسمت تولید می‌کند و موضوعاتی از گزارش‌های آب‌وهوای محلی و پیگیری گل‌پودر تا شرح دقیق ترور چارلی کرک و تأثیر فرهنگی‌اش، و حتی یک سری زندگینامه درباره آنا وینتور را در بر می‌گیرد، حاصل می‌شود.

شبکه پادکست‌سازی آن به نام Quiet Please تا کنون ۱۲ میلیون دانلود کلیهٔ قسمت‌ها را به‌دست آورده و ۴۰۰٬۰۰۰ مشترک جذب کرده است — بنابراین بله، مردم واقعاً به پادکست‌های هوش مصنوعی گوش می‌دهند.

توانایی Inception Point در پر‑کردن بازار با قسمت‌های صوتی با سرعتی که هیچ تیم انسانی نمی‌تواند مقابل آن بایستد، به‌وضوح نشان‌دهندهٔ وعدهٔ هوش مصنوعی و همچنین سناریوی کابوسی است که می‌تواند تمام مشاغل را تهدید کند. حتی در سالی که شرکت‌ها بیش از یک میلیون شغل را از دست دادند و بسیاری این کاهش را به هوش مصنوعی نسبت می‌دهند، همچنان این باور وجود داشت که نقش‌های خلاقانه‌ای ایمن باقی می‌مانند. در واقع جذابیت اصلی یک پادکست، شخصیت میزبان آن است. اما ژانین رایت، مدیرعامل Inception Point، معتقد است این ابزار دلیلی بر این‌که خودکارسازی می‌تواند پادکست‌سازی را مقیاس‌پذیر، سودآور و در دسترس‌پذیر کند، بدون نیاز به نویسندگان، ویرایشگران یا میزبان‌های انسانی.

«قیمت اکنون آن‌قدر پایین است که می‌توانید ریسک‌های زیادی بپذیرید»، رایت به TheWrap گفت. «می‌توانید محتوای فراوان و ژانرهای متنوعی تولید کنید که پیش از این از لحاظ تجاری امکان‌پذیر نبوده‌اند و به مخاطبان وسیعی که تا به‌حال هیچ‌گونه محتوا برایشان ساخته نشده بود، خدمات بدهید.»

با قیمت یک دلار برای هر قسمت، رایت رویکردی بر پایهٔ کمیت بیش از کیفیت اتخاذ می‌کند.

«ثروت در نیش‌هاست، قطعاً»، رایت گفت. «دوستانم در صنعت پادکست‌سازی می‌پرسند: «آیا برنامه‌ای داری که وارد ۱۰ برتر باشد؟ برنامه‌هایتان چه امتیازی دارند؟» ما حتی به این شکل به آن فکر نمی‌کنیم.»

زمان‌بندی Inception Point خوش‌یمن است. صنعت پادکست‌سازی تبدیل به قطبی برای خبرنگاران، هنرمندان، ورزشکاران و متخصصان پزشکی alike شده است. بیش از ۵۸۴ میلیون نفر در سال ۲۰۲۵ به پادکست‌ها گوش دادند و برآوردها نشان می‌دهد تا سال ۲۰۲۶ این عدد به ۶۱۹ میلیون خواهد رسید، طبق گزارش Riverside. حتی Netflix نیز وارد کسب‌وکار پادکست‌سازی شده و در چارچوب استراتژی ۲۰۲۶ خود، مشارکت با Spotify و The Ringer برای پادکست‌های تصویری را برقرار کرده است.

Inception Point که خود را «نسخه صوتی Reddit یا Wikipedia» می‌نامد، محتوای فوق‌ تخصصی را همراه با شخصیت‌های مختلف هوش مصنوعی ترکیب می‌کند تا شنوندگان هدفمند را جذب کند. این شرکت برنامه‌ها و موضوعات خود را انتخاب می‌کند و به‌طور خاص از موضوعاتی که ممکن است برای مدل‌های هوش مصنوعی دشوار باشد، خودداری می‌کند؛ به‌طوری‌که نیازی به بازبینی انسانی برای هر قسمت نیست. اما جایی که تلاش محاسبه‌شده گذاشته می‌شود، در بیش از ۱۲۰ شخصیت میزبان است.

Inception Point بیان کرد که شخصیت‌های تولیدشده توسط آن، بیش از یک نسخه پیشرفته از Siri هستند. این شرکت به نیش‌های خاص، روندهای ویروسی و بهینه‌سازی برای موتورهای جستجو (SEO) متکی است تا به مخاطبان هدف دست یابد. آن‌ها پادکست‌هایی از گزارش‌های هواشناسی محلی و پیگیری گل‌پودرها تا شرح دقیق ترور چارلی کرک و تأثیر فرهنگی‌اش، و همچنین سری زندگینامه‌ای درباره آنا وینتور ایجاد کرده‌اند.

اگرچه برخی کاربران آنلاین محتوا را «ملق هوش مصنوعی» می‌نامند، شرکت استدلال می‌کند که محتوای بیوگرافیک و «آموزش‑سرگرمی» آن ارزش در بازار پادکست‌سازی پر ازدحام دارد.

در حالی که Inception Point عموماً از موضوعات بحث‌برانگیز دور می‌شود، سیستم‌های هوش مصنوعی آن تشخیص دادند که ترور چارلی کرک در حال رواج است.

با وجود هزاران پادکست در روز، گوش دادن به تمام قسمت‌های تولید شده در این شبکه عملاً امکان‌پذیر نیست. به همین دلیل، شرکت در مواجهه با موضوعات بحث‌برانگیز که ممکن است شخصیت‌هایش را در دردسر بیندازد، محتاط است؛ اما مداخله‌ای انسانی نیز وجود دارد. در مورد قسمت‌های مربوط به Kirk، انسان‌ها پیش از انتشار محتوا به گوش کردند.

«زمانی که ما به مسائلی می‌پردازیم که آن‌ها را سیاست سخت یا خبرهای سخت می‌نامیم، قبل از انتشار یک بازبینی انسانی انجام می‌دهیم»، رایت گفت. «ما می‌خواهیم اطمینان حاصل کنیم که همه موارد به‌درستی از نظر واقعیتی صحیح هستند، و همچنین می‌خواهیم که موضوع با حساسیت مناسب رفتار شود.»

اما شرکت آن‌قدر کوچک است که بازبینی انسانی حتی برای یک‌چهارک یا کمتر از تولید روزانه آن ممکن نیست. این شرکت از چندین مدل زبانی بزرگ (LLM) استفاده می‌کند تا محتوا را مقایسه کرده و اطمینان حاصل کند که شامل توهمات یا پاسخ‌های ساختگی که به‌صورت خودجوش ظاهر می‌شوند، نیست — امری که می‌تواند در مدل‌های هوش مصنوعی رخ دهد. با این حال، این شیوه‌ها بیشتر برای کاهش ریسک‌های نادرستی طراحی شده‌اند تا پیشگیری فعالانه از آن‌ها همان‌گونه که یک ویراستار انسانی انجام می‌دهد.

مسئلهٔ دیگری، تطبیق لحن مناسب با بهترین شخصیت است. به‌عنوان مثال، مدل‌های هوش مصنوعی هنوز در یافتن تعادل بین احترام و ارائهٔ یک نظر تند و جسورانه مشکل دارند.

«این همان حوزه‌ای است که هنوز احساس می‌کنم هوش مصنوعی جای پیشرفت دارد»، او گفت. «هر روز بهتر می‌شود. می‌توانید احساسات فراوانی را برنامه‌ریزی کنید، اما در همین زمینه هنوز به‌طور جدی به بازبینی نیاز داریم.»

آشنایی با میزبان‌های هوش مصنوعی

از میان ۱۲۰ شخصیت موجود، «مربی اعتماد به‌نفس» به نام کای وجود دارد که صدای بریتانیایی‌اش و بارگذاری‌های روزانه‌ش سعی می‌کند روتینی برای شنوندگانش ایجاد کند. قسمت‌های سه‌دقیقه‌ای هدفشان تقویت اعتماد به‌نفس شنوندگان از طریق «هوش مصنوعی دوستانه» است. نظرات او از نکات و ترفندهای خودیاری در سرتاسر اینترنت جمع‌آوری می‌شود.

یا مخاطبان می‌توانند آخرین شایعات را از میهمان «سکرتهای سلبریتی» به نام ویویان استیل دریافت کنند. لحن او آن‌چنان شاد نیست که شاید انتظار داشته باشید. صدای او رباتیک به‌نظر می‌رسد هنگامی که دربارهٔ آخر هفته عروسی سلنا گومز و بنی بلانکو صحبت می‌کند، و از نظرات قاطعی که معمولاً در پادکست‌های پاپ‑کالچر دیده می‌شود، خالی است.

پست به اشتراک گذاشته شده توسط ویویان استیل (@vvsteeleip)

تقریباً تمام میهمانان با ریتمی مشابه و یکنواخت در تمام قسمت‌ها سخن می‌گویند، به‌ندرت بین بخش‌ها و گاهی حتی جملات مکث می‌کنند. رایت گفت تیم او شخصیت‌ها را با پس‌زمینه‌ها، ضعف‌ها، نقص‌ها و حتی حس شوخ‌طبعی برنامه‌ریزی می‌کند «تا آن‌ها را جذاب‌تر و شبیه به انسان سازد».

پنج‌تا از این شخصیت‌ها حضور در اینستاگرام دارند که هرکدام کمتر از هزار دنبال‌کننده دارند، اما شرکت هنوز به‌صورت رسمی از تولید ویدئو استفاده نکرده است. برای تعداد معدودی که آزمایش کرده‌اند، ویدئوها به‌وضوح توسط هوش مصنوعی تولید شده‌اند و بین حرکات آواتارها گاهی ناهنجاری‌های گلیچی دیده می‌شود.

جدا از شخصیت‌ها، ابزار هوش مصنوعی اینترنت را به‌دنبال محتوای آموزشی و بیوگرافیک می‌گیرد.

«این عامل برنامه‌ریزی شده است تا افرادی را شناسایی کند که مردم ممکن است بخواهند دربارهٔ آن‌ها اطلاعات منظم دریافت کنند، و سپس بر اساس درخواست‌ها و قالب ما، محتوایی دربارهٔ این شخص به‌صورت پویا ایجاد می‌کند»، رایت توضیح داد. «زمانی که اطلاعات جالب جدیدی دربارهٔ آن شخص در دسترس باشد، به‌صورت منظم به‌روزرسانی می‌شود.»

به‌عنوان مثال، وقتی کرک شلیک شد، ربات هوش مصنوعی او را به‌عنوان یک فعال محافظه‌کار که شبکه پادکست قبلاً سری زندگینامه‌ای دربارهٔ او دارد، شناسایی کرد؛ بنابراین یک قسمت موضوعی جدید دربارهٔ مرگ او به‌صورت پویا تولید کرد. پس از افزایش تقاضا برای این قسمت، تیم چندین پادکست دیگر دربارهٔ ترور کرک و پیامدهای آن تولید کرد.

Inception Point تنها شرکتی نیست که از هوش مصنوعی در پادکست‌ها استفاده می‌کند.

شرکت هنوز رقیب قابل‌توجهی در مقیاسی که تولید می‌کند ندارد، اما رایت این را با بازوهای باز می‌پذیرد. نزدیک‌ترین رقیب آن PocketFM است. این پلتفرم صوتی مستقر در هند از ابزارهای هوش مصنوعی مانند ElevenLabs برای تولید صدا برای سری‌های صوتی ساختگی استفاده می‌کند و ابزارهای هوش مصنوعی را برای کمک به نوشتن و سازگاری داخلی آزمایش کرده است. این استارتاپ اعلام کرد که تا ماه آگوست تقریباً ۱٬۰۰۰ پروژهٔ آزمایشی در ماه راه‌اندازی می‌کند و از همان استراتژی حجم تولیدی که Inception Point به کار می‌برد، بهره می‌برد.

یک استاد دانشگاه کورنل به TheWrap گفت که سایت‌های علمی تقریباً هر چیزی را به یک پادکست تبدیل می‌کنند. به‌غم محققانی که نارضایتی دارند، مقالات پژوهشی بدون رضایت نویسندگان، با استفاده از ابزارهای صدا تولیدشده توسط هوش مصنوعی، به شکل پادکست تبدیل شده‌اند. سایت‌هایی مانند Academia.edu به‌صورت خودکار نسخه‌های پادکست هوش مصنوعی مقالات علمی را ایجاد می‌کنند و سپس به نویسندگان این امکان را می‌دهد تا از سرویس انصراف دهند. استاد این نکته را مورد انتقاد قرار داد که اصطلاح «پادکست» بر هر بخشی از دانش عمومی اعمال می‌شود.

جو کاپوروسو، رئیس شرکت ورزشی و رسانه‌ای Whistle، گفت که برخی ارزشهای ابزارهای هوش مصنوعی را برای خلاقیت‌های پادکست خود می‌بیند اما در مورد تأثیر آن بر قسمت‌های تمام‌دوره‌ای هنوز مطمئن نیست.

«من تصور می‌کنم در مورد برخی از بخش‌های بداهه‌ای که در یک قسمت عادی اتفاق می‌افتد، هنوز چیزی مانده باشد؛ و در مورد روش‌های مختلفی که گفتگوها به‌طور طبیعی جریان می‌یابند»، کاپوروسو به TheWrap گفت. «اما برای برخی از قسمت‌های فرمولی و بخش‌های فرمولی مانند خواندن تبلیغات، مطمئنم هوش مصنوعی بخش بزرگی خواهد داشت.»

پادکست‌های Inception Point بیشتر جنبه بیوگرافیکی دارند و بیشتر دربارهٔ اطلاعات واقعی دربارهٔ شخصیت‌هایی همچون برادران کلس، به‌جای استفاده از صدای آن‌ها، بیان می‌شوند.

در حالی که رایت معتقد است صداهای هوش مصنوعی می‌توانند شنوندگان را به همان اندازه میزبانان انسانی جذب کنند، برخی دیگر در صنعت همچنان با تردید مواجه هستند. برخی خودکارسازی را به‌عنوان ابزاری برای کارآمدی می‌بینند — نه به‌عنوان جایگزینی خلاقانه.

«من فکر نمی‌کنم شخصیتی کامپیوتری بتواند شوخ‌طبعی که Funny Marco به یک برنامه می‌آورد یا حقیقتی که Kylie Kelce به بخش ‘Not Gonna Lie’ می‌بخشد را جایگزین کند»، ریان جان، معاون اجرایی ارشد و سرپرست استراتژی و درآمد برای Wave Sports + Entertainment، به TheWrap گفت. «فکر می‌کنم این‌ها جایگزین‌شدنشان بسیار دشوار خواهد بود.»

سه پلتفرم اصلی — Apple Podcasts، Spotify و YouTube — از خالقان نمی‌خواهند که زمان ایجاد پادکست توسط هوش مصنوعی را فاش کنند، اما تمام میهمانان هوش مصنوعی Inception Point در ابتدای هر قسمت اعلام می‌کنند که هوش مصنوعی هستند.

گام‌های بعدی

در مورد گام‌های بعدی شرکت، رایت گفت ویدئو در افق است. با این حال، کاورهای تصویرسازی شده توسط هوش مصنوعی برای پادکست‌ها، در نمایش سابینا کارپنترز و تاکر کارلسون کمی ناقص هستند.

Inception Point قبلاً ویدئوهای کوتاه‌مدت و ایجاد پروفایل‌های شبکه‌های اجتماعی برای شخصیت‌ها را آزمایش کرده است به امید تبدیل آن‌ها به اینفلوئنسرها. رایت امیدوار است در آینده نزدیک هزاران شخصیت دیگر بسازد تا ببیند کدام یک پابرجا خواهند ماند.

پنج شخصیت موجود در اینستاگرام به‌وضوح متفاوت از گرافیکی هستند که برای تصویر نمایه پادکست استفاده می‌شود. همچنین، صداهای نشان‌داده شده در پروفایل‌هایشان کمی با صداهای استفاده‌شده در پلتفرم‌های صوتی اولیه متفاوت است.

پست به اشتراک گذاشته شده توسط مارکوس الری (@marcuselleryip)

در مسیر تولید نزدیک به ۱۵۰٬۰۰۰ قسمت تا پایان سال، Inception Point AI پیش از این در بازار پادکست‌سازی شلیک بزرگی داشته است؛ اما آیا این شرکت به‌سرعت می‌سوزد و درخشد یا تأثیر ماندگار در این عرصه ایجاد می‌کند؟

«من فکر می‌کنم به‌سرعت به مرحله‌ای می‌رسیم که هوش مصنوعی روش پیش‌فرض برای تولید محتوا شود، نه‌تنها در حوزه صدا، بلکه در تلویزیون، فیلم، تبلیغات، تصویر و همه چیز. سپس ما اعلام می‌کنیم که آیا محتوا با هوش مصنوعی ساخته نشده یا آن‌که با هوش مصنوعی ساخته شده است»، رایت گفت. «اما در حال حاضر، کاملاً خوشحالیم که پیشروی می‌کنیم.»

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا