ویدیوهای نوستالژی هوش مصنوعی، برای چه کسی ساخته شده‌اند؟

ابزارهای تولید ویدیو همچون سُورا بر یک تک‌فرهنگی که دیگر وجود ندارد تکیه می‌کنند — و خروجی‌هایشان به‌صراحت آشغال خالص هستند.

نوشته چارلز پولیام‑مور

ویدیوهای نوستالژی هوش مصنوعی برای چه کسی

اخیراً سیل وام‌گیری از ویدیوهای هوش مصنوعی تولیدی به نمایش درآمده است؛ ویدیوهایی که در آن نوجوانان تازه‌چهره با نوستالژی عجیبی دربارهٔ بهتر بودن جهان در دهه‌های ۸۰ و ۹۰ می‌پردازند. همان‌طور که این جوانان هوش مصنوعی به‌صورت لبخندهای «اسمایز» و مدل‌های موی زمان خود می‌درخشند، کلیپ‌ها به تصاویری رؤیایی از کوچه‌های آفتاب‌گیر و ماشین‌های کلاسیک می‌پرند؛ در حالی که آهنگ‌هایی چون «Everybody Wants to Rule the World» و آهنگ‌هایی الهام‌گرفته از آهنگ‌ساز دَنکی کونگ کانتری در پس‌زمینه پخش می‌شود. کلیه این‌ها بسیار عجیب است — گویی به‌دلیل اوج‌گیری در دوران دبیرستان به خود می‌بالید.

اگرچه این ویدیوها عجیب‌اند، منطقی نسبتاً ساده برایشان وجود دارد. در سطحی، این محتوا به جذابیت مردم نسبت به گذشته می‌پردازد — به‌ویژه بینندگان جوان که به‌دلیل عدم تجربهٔ مستقیم از آن دوره‌ها، می‌توانند جزئیات ناهماهنگی که مدل‌های هوش مصنوعی تمایل دارند در خروجی‌های ویدیو خود بگنجانند، نادیده بگیرند. اما این ویدیوها همچنین تصویری ایده‌آل از گذشته می‌نگرند که در آن همه زیبا هستند، اکثر افراد سفیدپوست‌اند و همه دانش غیرقابل توضیحی دربارهٔ فشارهای زندگی در سال ۲۰۲۵ دارند. این نوع نوستالژی، توهمی نئو‑کونی برای افرادی است که از باز کردن کتاب‌های تاریخ می‌ترسند.

اما درک دلایل پشت برخی از کلیپ‌های بسیار پوچ هوش مصنوعی که در آن‌ها سلبریتی‌های مرده از گذشته به کارهای ناتمام می‌پردازند، بسیار دشوارتر است. تعداد زیادی ویدیو ستارگان را نشان می‌دهد که رفتارشان با واقعیت هیچ‌چیز مشترکی ندارد: مایکل جکسون که مرغ سرخ‌شده می‌دزدد، استیون هاوکینگ که در X Games رقابت می‌کند، اینشتین که قهرمان UFC می‌شود، باب راس که توسط پلیس به‌دلیل … نقاشی دیوارهای بزرگ بدون اجازه دستگیر می‌شود، ملکه الیزابت و پرنسس دیانا که در یک مسابقه تبلیغاتی WWE به‌هم می‌زنند. نژادپرستی، توان‌زدائی و جنسیت‌زدایی گسترده‌ای که در این کلیپ‌ها به تصویر کشیده می‌شود، باعث می‌شود تا آن‌ها شبیه شوخی‌های سطحی و نازک‌قلمی فامیلی‌گای شوند. با این حال، در برنامه سُورا، این نوع «کمدی» ضایعاتی به نظر می‌رسد که همه به آن علاقه‌مندند.

به‌دلیل نامعلومی، فرِد راجرز اغلب محور این کلیپ‌هاست؛ جایی که او را می‌بینید که با تُپاک رِپ می‌کند، به زنان همانند مری لین مونرو نگاه‌های سلفی می‌اندازد و کمدی پر از اسلحه‌ها را نمایش می‌دهد. هیچ‌یک از این دیپ‌فیک‌ها به‌خصوص قانع‌کننده نیستند و اکثر آن‌ها هنوز یک نشان آبشاری دارند که نشان می‌دهد با مدل سُورا از OpenAI ساخته شده‌اند. ولی با تمام وحشت‌انگیزی، این «زَفِه‌چینی» در همه‌جا حاضر است و آمار بازدیدها نشان می‌دهد — صرف‌نظر از اینکه از عشق، نفرت یا بی‌تفاوتی ناشی می‌شود — مردم نمی‌توانند از تماشای آن دست بکشند. حداقل، این همان چیزی است که تیم پشت برنامهٔ ویدئویی اجتماعی تازه‌راه‌اندازی شدهٔ OpenAI می‌خواهد شما فکر کنید.

به‌وضوح مشخص است که OpenAI از پر کردن اینترنت با ویدیوهای تولیدشده توسط سُورا چه منفعتی می‌برد. این محتوا راه دیگری برای شرکت است تا تکنولوژی‌اش را ترویج دهد و ایدهٔ کار کردن افراد در «کارخانهٔ زَفِه‌چینی» را به‌عنوان راهی برای سرگرمی عادی‌سازی کند. به‌نظر می‌رسد این همان هدف نهایی برنامه سُورا است؛ جایی که تولید یک ویدیو به سادگی نوشتن چند جمله در جعبهٔ درخواست است. OpenAI و رقبای آن همه می‌خواهند به‌عنوان منبعی دیده شوند که از آن نوعی هنر انقلابی و نوین به‌وجود آمده است — هنری که به مردم امکان می‌دهد خلاقیت خود را به‌صورت‌‍هایی بیان کنند که پیش از آن ممکن نبود.

افرادی که این ویدیوها را می‌سازند، مانند جیک پائول، اسنوپ‌داگ و شاکیل اونیل، به‌وضوح به این ایده پیوسته‌اند یا حداقل به‌واسطهٔ پرداخت‌ها وانگار باور دارند تا هواداران ساده‌فکر خود را قانع کنند که استخراج «زَفِه‌چینی» از یک سطل، واقعاً جالب است. اما وقتی به‌طور کافی این محتوا را می‌بینید (که زیاد نیست)، واضح می‌شود که چقدر این کار بی‌خلاق و بی‌مزاحمت است. همچنین حس واضحی به وجود می‌آید که هیچ‌یک از این سازندگان توانایی تصور چیزی فراتر از «اگر این سلبریتی مرده کاری وحشیانه می‌کرد که باعث دل‌فروش‌هایشان می‌شد؟» را ندارند.

محتوای این ویدیوها نشانگر وضعیت فعلی هوش مصنوعی تولیدی است؛ اما حتی بیشتر از آن، بر این نکته تأکید می‌کند که خروجی این فناوری تحت تأثیر مرگ تدریجی تک‌فرهنگی قرار گرفته است.

اگرچه برخی استدلال می‌کنند که جامعه زمانی که همه برنامه‌های تلویزیونی و فیلم‌های یکسان را تماشا می‌کردند — گفت‌وگوهای افسانه‌ای «سرچ‌های آب‌پز» — احساس همبستگی بیشتری داشت، تک‌فرهنگی بدون نقص نبود. آن زمان قدرت تصمیم‌گیری در فرهنگ پاپ در میان یک گروه محدود — اغلب مردان سفیدپوست مسن — متمرکز بود. تک‌فرهنگی موانع ساختاری پیرامون کسب‌وکار تولید هنر برای عموم ایجاد می‌کرد و فناوری‌های مدرن مانند اینترنت و شبکه‌های اجتماعی به مردم این امکان را دادند که از این دروازه‌بانان دور بزنند.

بعنوان یک تصادفی، این‌که بسیاری از مؤسسان هوش مصنوعی تولیدی به‌شدّت روی این ایده تأکید کرده‌اند که محصولاتشان برای توانمندسازی مردم و «دموکراتیک‌سازی» خلق هنر است، اتفاقی نیست. این همان وعده بود. اما وقتی در برنامه سُورا اسکرول می‌کنید و صدها ویدیو را می‌بینید که روی همان پرامپت‌های پایه‌ای مانند «یک سلبریتی یا حیوان توسط پلیس به‌دلیل مشکوک بودن به رانندگی زیر اثر الکل متوقف می‌شود» تکرار می‌شوند، سخت است که پلتفرم را به‌عنوان مکانی ببینید که کاربران تشویق می‌شوند به تکرار الگوهای شناخته‌شده بپردازند، نه خلق چیزی واقعاً اصیل یا حتی به‌نوعی جذاب.

دقیقاً محتوای «خوب» هوش مصنوعی تولیدی کجا است؟

به‌جز سام آلمَن‌ها (به عنوان مثال)، که به‌طور مستقیم از این محتوا بهره‌مند می‌شوند، دشوار است مشخص شود که این گونه ویدیوها برای چه کسانی است و چه چیزی را به‌عنوان طنز می‌پذیرند. استدلالی وجود دارد که این بی‌هدفی‌ها برای جذب نسل زومِر‌ها و کودکان نسل الفا که «مغز‌فروختگی» را به‌عنوان بخشی از هویت خود پذیرفته‌اند، ساخته شده است. اما عنصر طنز این ویدیوها دقیقاً «کار نمی‌کند» اگر به‌دلیل عدم شناخت از این افراد هوش‌مصنوعی‑تولیدشده نداشته باشید. بدون این زمینه، نقطهٔ لطیفه‌ها بسیار زشت‌تر می‌شود. فرِد راجرز که با مری لین مونرو شیرجه می‌زند، اکنون به‌صورت «یک پیر مرد که به‌صورت تجاوزگر جنسی رفتار می‌کند» دیده می‌شود؛ استیون هاوکینگ حالا «این مرد ALS دارد و از صندلی چرخ‌دار استفاده می‌کند».

اگرچه طرفداران هوش مصنوعی ادعا می‌کنند که این فناوری می‌تواند هنر معناداری تولید کند، برنامه سُورا به‌وضوح نشان می‌دهد که چگونه این نوع ویدیوها به‌صورت فرمولی و مشتق‌گرایانه ساخته می‌شوند و به‌راحتی به‌عنوان «زَفِه‌چی» رد می‌شوند. تمام این محتوا حس می‌شود که برای جذب ویروسی‌بودن در شبکه‌های اجتماعی ساخته شده است، نه برای بیان خلاقیت انسانی. این کلیپ‌ها ممکن است شمار شگفت‌انگیزی بازدید داشته باشند، اما «عددها افزایش می‌یابند» معیار قابل اعتمادی برای تعیین ماندگاری واقعی آن‌ها نیست.

ادعای این‌که ویدیوهای هوش مصنوعی تولیدی از جملهٔ جفری اپستین که از دادگاه به‌صورت پرپ‌واک خارج می‌شود، «آیندهٔ سرگرمی» یا بازتاب سلیقهٔ جوانان در حوزهٔ رسانه است، یک توهین شدید به هوش آن‌هاست. این تصور نشان می‌دهد که مردم نمی‌توانند یا نمی‌خواهند کیفیت را ارزیابی کنند یا توجه‌شان را به‌عنوان چیزی می‌دانند که باید تقویت شود. ما همواره این‌طور به‌خبر می‌شویم که این فناوری هر روز بهتر می‌شود و «محتوای خوب» هوش مصنوعی تولیدی پیرامون گوشهٔ خیابان است. پس محتواهای «خوب» کجا هستند؟ چقدر میلیاردهای دلار دیگر باید به این چرخهٔ هیجان‌انگیز هوش مصنوعی تزریق کنیم تا چیزی تولید شود که بیش از یک لحظهٔ کوتاه به‌خاطر سپرده شود یا به‌خاطر داشته شدن باشد؟

همه‌ی این‌ها بیشتر شبیه یک روند پر زرق‌وشوشت است که سعی دارد مردم را قانع کند هوش مصنوعی تولیدی ارزش هیجان‌زده شدن دارد. نوآوری‌های این ویدیوها به‌نظر می‌رسد که به‌سرعت فرسوده شوند چون تعداد آن‌ها به‌طور فراوانی در دسترس است. تا کنون تنها وعده‌ای که هوش مصنوعی برآورده کرده، مقیاس‌پذیری‌اش بوده است. اما این نیز به این معناست که ما زودتر از آن خسته می‌شویم؛ زیرا دائماً با آن مواجه هستیم. و وقتی یک مد جدید و هیجان‌انگیز هوش مصنوعی برای همه‌گان ظاهر می‌شود، راحت می‌توان تصور کرد که همه‌ی این لحظهٔ «زَفِه‌چی» را فراموش کنند.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا