آنچه هوش مصنوعی نمی‌داند: شاید در حال ایجاد «سقوط دانش» جهانی باشیم

همزمان با اینکه هوش مصنوعی مولد (GenAI) تبدیل به روش اصلی برای یافتن اطلاعات می‌شود، خرد بومی و سنتی در حال نادیده‌گیری است و ما تازه به این‌که چه چیزهایی در حال از دست رفتن هستند، پی می‌بریم.

  • این مقاله ابتدا تحت عنوان «حفره‌های وب» در سایت Aeon.co منتشر شد

توسط دیپاک وارول دن‌یسون

نچند سال پیش، به پدرم تشخیص تومور در زبان داده شد – وضعیتی که ما را به اتخاذ تصمیماتی مجبور کرد. خانواده‌ام در تصمیم‌گیری‌های پزشکی دینامیک جالبی دارد. در حالی که خواهر بزرگ‌ترم پزشک در طب آلولوژیک غربی است، والدینم به شدت به درمان‌های سنتی اعتقاد دارند. من که در یک شهر کوچک در هند بزرگ شده‌ام، به آداب و رسوم عادت دارم. پدرم نیز چنین عادتی داشت. هر بار که می‌رفتیم به روستای زادگاهی‌اش در جنوب تامیل‌نادو، از یک vaithiyar، پزشک سنتی سیده‌دار، بطری‌ای از روغن غلیظ، معطر و ترکیبی از گیاهان می‌گرفت. این کار برای او راهی بود تا ارتباط خود را با نوعی پزشکی که همیشه می‌شناخت و به آن اعتماد می‌کرد، حفظ کند.

تومور پدر نشان می‌داد که ممکن است بدخیم باشد، بنابراین پزشکان بیمارستان و خواهرم به شدت جراحی را توصیه کردند. ولی والدینم مخالف این ایده بودند، نگران این‌که ممکن است گفتار پدر را تحت تأثیر قرار دهد. این معمولاً جایی است که من، به‌عنوان میانجی خانواده، وارد می‌شوم. مثل هر میلی‌نالی خوب، برای راهنمایی تصمیم‌گیری به اینترنت رجوع کردم. پس از روزها تحقیق دقیق، همانند همیشه، به‌سوی نظر خواهرم متمایل شدم و برای جراحی فشار آوردیم. اینترنت نیز از این مسیر پشتیبانی کرد.

در نهایت توانستیم پدر را موافقت کنیم و حتی تاریخی برای جراحی تعیین کردیم. اما او به‌طرز زیرکانه از بارداری خواهرم به‌عنوان حواس‌پرتی استفاده کرد تا از انجام جراحی سرپیچی کند. در حالی که روز به روز او را تحت فشار قرار می‌دادیم تا عمل انجام شود، او به‌صورت مخفیانه از ترکیب گیاهی خود استفاده می‌کرد. و چه تعجب! پس از چند ماه، تومور واقعاً کوچک شد و سرانجام ناپدید شد. این ماجرا برای پدرم مقداری اعتبار و حس غرور به همراه داشت.

در آن زمان، این را صرفاً یک استثنای خوش‌شانس می‌دانستم. اما اخیراً به این سؤال می‌پردازم که آیا برای رد کردن اعتماد والدینم به دانش سنتی و در عین حال پذیرش اعتبار منابع دیجیتال به‌سرعت اقدام کرده‌ام. باور کردن اینکه ترکیب‌های گیاهی پدرم واقعا مؤثر بوده‌اند برایم دشوار است، اما به این نیز واقف شدم که اینترنت به‌ظاهر بی‌نهایت دانایی که من به‌راحتی به آن اعتماد می‌کردم، خلأهای بزرگی دارد – و در دنیای هوش مصنوعی، این خلأها در حال تشدید هستند.

طرافه‌پذیری این موضوع برای من از دست نرفته که این معضل از طریق تحقیقات‌ام در یک دانشگاه در ایالات متحده، در فضایی دور از دوران کودکی‌ام و زمینه‌ای که در آن آداب سنتی بخشی از زندگی روزمره بود، بروز یافت. من در دانشگاه Cornell، نیویورک، به بررسی آنچه برای طراحی سیستم‌های هوش مصنوعی مسئولانه لازم است، می‌پردازم. کارهای من افشای این واقعیت است که جهان دیجیتال نمایانگر عدم تعادل‌های عمیق قدرتی در دانش است و این عدم تعادل توسط هوش مصنوعی مولد (GenAI) تشدید می‌شود. اینترنت اولیه عمدتاً تحت تسلط زبان انگلیسی و مؤسسات غربی بود و این عدم تعادل با گذشت زمان سفت‌تر شد؛ دنیای گسترده‌ای از دانش و تجربه انسانی که هنوز دیجیتالی‌سازی نشده‌اند، باقی ماند. اکنون با گسترش GenAI – که بر پایه این گسست دیجیتالی موجود آموزش می‌بیند – این نامتقارنی در خطر استقرار دائمی است.

برای بسیاری از مردم، هوش مصنوعی مولد در حال تبدیل به روش اصلی برای آموختن دربارهٔ جهان است. یک مطالعهٔ بزرگ‌مقیاس که در سپتامبر ۲۰۲۵ منتشر شد و نحوهٔ استفادهٔ مردم از ChatGPT از زمان عرضهٔ آن در نوامبر ۲۰۲۲ را تحلیل کرد، نشان داد که حدود نیمی از درخواست‌ها برای راهنمایی عملی یا جستجوی اطلاعات بوده است. این سیستم‌ها ممکن است ظاهراً بی‌طرف به نظر برسند، اما این‌گونه نیستند. مدل‌های پرکاربرد، شیوه‌های غالب دانستن (معمولاً غربی و نهادی) را ترجیح می‌دهند و در عین حال گزینه‌های جایگزین، به‌ویژه آن‌هایی که در سنت‌های شفاهی، عمل تجسمی و زبان‌هایی که در دنیای محاسبه «منابع کم» محسوب می‌شوند (مانند هندی یا سواحیلی) کدگذاری شده‌اند، را به حاشیه می‌کشند.

با تقویت این سلسله‌مراتب‌ها، هوش مصنوعی مولد خطر حذف سیستم‌های درک را که در طول قرن‌ها تکامل یافته‌اند، دارد؛ این امر نسل‌های آینده را از بدنه‌های وسیع بینش و حکمت که هرگز به‌صورت دیجیتال کدگذاری نشده‌اند اما همچنان پایه‌های انسانی می‌باشند، جدا می‌کند. در نتیجه، چیزی که به خطر افتاده فقط نمایندگی نیست: بلکه پایداری و تنوع دانش به‌عنوان خودِ دانش در خطر است.


هوش مصنوعی مولد بر پایهٔ مجموعه‌های عظیم داده‌های متنی از منابعی چون کتاب‌ها، مقالات، وب‌سایت‌ها و متون شفاهی (transcripts) آموزش می‌بیند – به همین دلیل به آن «مدل زبان بزرگ» (LLM) می‌گویند. اما این «داده‌های آموزشی» هیچ‌گاه تمامیت دانش بشری را در بر نمی‌گیرد؛ فرهنگ‌های شفاهی و حتی برخی زبان‌ها به‌طور ناکافی یا کاملاً غایب‌اند.

برای درک اینکه این مسأله چرا اهمیت دارد، ابتدا باید بپذیریم که زبان‌ها، وسیلهٔ نگهداری دانش‌اند. هر زبان جهان، سراسر تجارب و بینش‌های انسانی را که در طول قرن‌ها شکل گرفته‌اند، در خود حمل می‌کند: آیین‌ها و رسوم که جوامع را شکل می‌دهند، رویکردهای خاص به زیبایی و هنر، آشنایی عمیق با مناظر و سامانه‌های طبیعی، جهان‌بینی‌های معنوی و فلسفی، واژگان ظریف برای تجارب درونی، تخصص‌های تخصصی در حوزه‌های مختلف، چارچوب‌های سازماندهی جامعه و عدالت، حافظهٔ جمعی و روایت‌های تاریخی، سنت‌های شفایدهی و پیوندهای اجتماعی پیچیده.

زمانی که سیستم‌های هوش مصنوعی با زبان‌های کافی مواجه نشوند، نقطه‌های کور در درک تجارب انسانی دارند. داده‌های مشترک از منبع عمومیٔ بزرگ Common Crawl، که یکی از بزرگ‌ترین منابع دادهٔ آموزشی است، نابرابری‌های واضحی را نشان می‌دهد. این منبع بیش از ۳۰۰  میلیارد صفحهٔ وب را در طول ۱۸ سال پوشش می‌دهد، اما زبان انگلیسی که تقریباً ۱۹ ٪ از جمعیت جهان را تشکیل می‌دهد، ۴۵ ٪ از محتوا را در اختیار دارد. با این حال، ممکن است تضاد شدیدی بین اندازهٔ جمعیتی یک زبان و میزان نمایندهٔ آن در داده‌های آنلاین وجود داشته باشد. برای مثال، هندی، سومین زبان پرکاربرد جهان، که حدود ۷٫۵ ٪ از جمعیت جهان را شامل می‌شود، تنها ۰٫۲ ٪ از داده‌های Common Crawl را تشکیل می‌دهد. وضعیت برای تامیلی – زبان مادری من – حتی وخیم‌تر است. علی‌رغم اینکه بیش از ۸۶  میلیون نفر در سراسر جهان به این زبان صحبت می‌کنند، تنها ۰٫۰۴ ٪ از داده‌ها را شامل می‌شود.

در دنیای رایانش، تقریباً ۹۷ ٪ از زبان‌های جهان به‌عنوان «منابع کم» طبقه‌بندی می‌شوند. این برچسب هنگام فراتر رفتن از زمینهٔ محاسبه گمراه‌کننده است: بسیاری از این زبان‌ها میلیون‌ها گویشگر دارند و سنت‌های زبانی قرن‌ها قدمت دارند. آن‌ها صرفاً در فضای آنلاین یا مجموعه‌های دادهٔ قابل دسترس به‌طور ناکافی نشان داده می‌شوند. یک مطالعهٔ ۲۰۲۰ نشان داد که ۸۸ ٪ از زبان‌های جهان با درجه‌ای از عدم‌توجه در فناوری‌های هوش مصنوعی مواجه‌اند که ارتقای آن‌ها به‌صورت کامل شاید کار نیروی‌افزایی باشد – شاید حتی ناممکن.


برای مثال از نوع دانشی که در دسترس نیست، می‌توان به شناخت بوم‌شناسی محلی اشاره کرد. یک دوست محیط‌زیست‌کار زمانی به من گفت که ارتباط یک جامعه با بوم‌شناسی‌اش می‌تواند از طریق اسامی دقیق و خاصی که برای گیاهان بومی دارد، مشهود باشد. چون گونه‌های گیاهی اغلب به‌صورت منطقه‌ای یا بوم‌شناسی منحصر به‌فرد هستند، دانش مربوط به این گیاهان نیز بومی‌سازی می‌شود. هنگامی که زبانی به حاشیه رانده می‌شود، دانش گیاهی نهفته در آن نیز به‌هم می‌ریزد.

یک کلبه wattle‑and‑daub (چوب‌دار و گل‌پوش) که توسط معماران هندی Thannal، متخصص در تکنیک‌های ساخت طبیعی، طراحی شده است.
کلبه‌ای از نوع wattle‑and‑daub که توسط معماران هندی Thannal، متخصص در تکنیک‌های ساخت طبیعی طراحی شده است. عکس: Thannal

در حین نوشتن این مقاله، با افراد مختلفی دربارهٔ خلأهای زبانی در GenAI گفتگویی داشتم — از جمله دارن آشوک، معمار ارشد در Thannal، سازمانی که به احیای فنون ساخت طبیعی در هند می‌پردازد. او تأیید کرد که ارتباط محکمی میان زبان و دانش بوم‌شناسی محلی وجود دارد و این ارتباط پایهٔ دانش معماری بومی را تشکیل می‌دهد. در حالی که ساخت‌وساز مدرن عمدتاً با بتن و فولاد همراه است، روش‌های ساخت بومی بر مواد موجود در محیط اطراف تکیه داشته‌اند.

در مواجهه با نگرانی‌ها دربارهٔ ساخت‌وساز‌های غیرپایدار و پرمصرف انرژی، دارن به‌صورت فعال به بازیابی هنر گمشدهٔ تولید بیوپلیمرها از گیاهان بومی می‌پردازد. او اشاره کرد که بزرگ‌ترین چالش این است که این دانش عمدتاً مستند نشده و از طریق زبان‌های بومی به‌صورت شفاهی منتقل می‌شود. این دانش اغلب در اختیار چندین سالمند باقی می‌ماند و با مرگ آن‌ها، به‌طور کامل از دست می‌رود. دارن تجربه‌ای را به‌خاطر می‌سپارد که در هنگام از دست رفتن آخرین صنعت‌گری ماهر در ساخت آجرهای مبتنی بر سنگ آهک، فرصت یادگیری این مهارت را از دست داد.


برای درک چگونگی ارتقای برخی روش‌های شناختی به برتری جهانی، اغلب به مفهوم هژمونیک فرهنگی که توسط فیلسوف ایتالیایی آنتونیو گرامشی معرفی شد، رجوع می‌کنیم.

گرامشی معتقد بود که قدرت نه تنها از طریق قدرت نظامی یا اقتصادی، بلکه از طریق شکل‌گیری هنجارهای فرهنگی و باورهای روزمره حفظ می‌شود. با گذشت زمان، رویکردهای معرفتی ریشه‌دار در سنت‌های غربی به‌عنوان عینی و جهانی شناخته شدند. این امر باعث شد که دانش غربی به‌عنوان استاندارد نرمال‌سازی شود و نیروهای تاریخی و سیاسی که زمینه‌ساز ظهور آن بوده‌اند، پنهان بمانند. نهادهایی چون مدارس، مؤسسات علمی و سازمان‌های توسعهٔ بین‌المللی، این تسلط را تقویت کرده‌اند.

معرفی‌ها صرفاً مفاهیم انتزاعی نیستند؛ آن‌ها اطراف ما حاضرند و تأثیر مستقیمی بر بدن و تجربهٔ زندگی ما دارند. برای درک این موضوع، به مثالی می‌پردازیم که به‌وضوح با روش‌های ساخت بومی که دارن می‌خواهد احیا کند، تضاد دارد: ساختمان‌های بلند با نمای شیشه‌ای در مناطق گرمسیری.

این‌گونه ساختمان‌های شیشه‌ای، که به‌نظر می‌رسد تنها انتخابی بی‌طرف یا صرفاً زیبایی‌مدار باشد، ریشه در معماری مدرن غربی دارند. در اصل برای اقلیم‌های سرد و کم نور طراحی شدند و به‌دلیل کارآمدی انرژی — اجازه دادن به نور طبیعی به داخل فضا و کاهش وابستگی به روشنایی مصنوعی — تحسین می‌شدند.

اما وقتی این طرح در مناطق گرمسیری به‌کار می‌رود، تبدیل به تضاد زیست‌محیطی می‌شود. در مکان‌هایی که تابش خورشید شدید است، مطالعات نشان داده‌اند که نمای شیشه‌ای منجر به گرم شدن بیش از حد داخلی و ناآرامی حرارتی می‌شود، حتی با وجود شیشه‌های مدرن. به‌جای صرفه‌جویی در انرژی، این ساختمان‌ها برای خنک نگه‌داشتن فضاها مصرف انرژی بیشتری می‌طلبند.

با این حال، نمای شیشه‌ای تبدیل به نماد مدرنیت شهری شده است؛ از سان‌فرانسیسکو تا جاکارتا و لاگوس، بدون توجه به اقلیم یا بستر فرهنگی. با تشدید بحران آب‌وهوایی، این ساختمان‌های شیشه‌ای یادآور خطرات همگنی شناختی هستند.

به‌طور طرافه‌پذیر، این مقاله را در یکی از آن ساختمان‌های شیشه‌ای در بنگلور، جنوب هندوستان می‌نویسم. من در هوای خنک‌شده و صدای نرم کولر هوا در گوشم نشسته‌ام. بیرون در باران‌باران جزئی، یک بعدازظهر عادی مونسانی به‌نظر می‌رسد، امّا باران‌ها این سال چند هفته زودتر از موعد روییده‌اند — نشانهٔ دیگر ناپایداری پیش‌روندهٔ آب‌وهوای.

در بنگلور، نمونهٔ دیگری از پیامدهای دانش از دست‌رفته را می‌بینم: مدیریت آب. چگونه ممکن است یک شهر در ماه مه به‌شدّت سیل بگیرد و خودروها را در زیر آب غرق کند، اما در همان شهر در ماه مارس برای آب آشامیدنی دست به جستجو بزند؟ در حالی که برنامه‌ریزی ضعیف و شهرنشینی بی‌رویه نقش دارند، دلیل دیگر این موضوع ریشه در پایهٔ معرفت‌محوری است.

بنگلور زمانی به‌دلیل سیستم هوشمند مدیریت آب خود شناخته می‌شد که توسط شبکه‌ای از دریاچه‌های متوالی و آب‌پناه‌های متصل تغذیه می‌شد. قرن‌ها این دریاچه‌ها توسط گروه‌های اختصاصی، مانند جامعهٔ نیروگنتی (neeruganti) — که در زبان کانادا به معنای «آب» اشاره دارد — مدیریت می‌شدند. این گروه‌ها جریان آب را تنظیم می‌کردند و توزیع عادلانهٔ آن را تضمین می‌کردند. بسته به میزان بارندگی، آن‌ها کشاورزان را راهنمایی می‌کردند که چه محصولی بکارند، اغلب گونه‌هایی با بهره‌وری آب بالا. همچنین مسئول نگهداری بودند: رسوب‌گیری مخازن را پاک می‌کردند، پوشش گیاهی برای جلوگیری از فرسایش می‌کاشتند و مسیرهای آب‌رسانی را تمیز می‌کردند.

داخل یک کلبه wattle‑and‑daub طراحی شده توسط Thannal
داخل یک کلبه wattle‑and‑daub توسط Thannal. عکس: Thannal

اما با پیشرفت مدرن‌سازی، مدیریت آب مبتنی بر جامعه به سمت سامانه‌های متمرکز و راه‌حل‌های فردی مثل آبیاری از سدهای دوردست و چاه‌های آب عمیق تغییر یافت. «انقلاب سبز» در اواخر دههٔ ۶۰ میلادی — زمانی که هند به کشاورزی صنعتی مدرن روی آورد — این تغییر را تشدید کرد و محصولات پرآب و پرپتاسید را که در آزمایشگاه‌های غربی توسعه یافته بودند، ترویج داد. جامعهٔ نیروگنتی به‌تدریج به حاشیه رانده شد و بسیاری از آن‌ها به‌دنبال کارهای دیگر رفتند. دریاچه‌ها و کانال‌های محلی کاهش یافتند و برخی حتی برای ساخت جاده، ساختمان یا ایستگاه‌های اتوبوس تخریب شدند.

متخصصان دریافته‌اند که کلید حل بحران آب بنگلور، احیای این سامانه‌های دریاچه‌ای است. یک کارگر اجتماعی که با چند پروژهٔ این‌چنینی در ارتباط بوده، گفت غالباً برای مشورت به سالمندان جامعهٔ نیروگنتی مراجعه می‌شود. دیدگاه‌های آن‌ها با ارزش است، اما دانش محلی آن‌ها به‌صورت نوشتاری ثبت نشده است و نقش آن‌ها به‌عنوان مدیران آب جامعه به‌طولانی‌مدت مشروعیت‌زدایی شده است. این دانش فقط به زبان مادری آن‌ها منتقل می‌شود، به‌صورت شفاهی، و در فضای دیجیتال — چه گفت‌و‌گوهای آنلاین، چه هوش مصنوعی — تقریباً غایب است.

در حالی که تمام مثال‌های من از هند می‌آیند، این سلسله‌مراتب‌ها در سطح جهانی ریشه دارند و به تاریخ استعماری و امپریالیسم جهانی باز می‌گردند. در کتاب «Decolonising Methodologies» (۱۹۹۹) که توسط لنده توی‌واِی اسمیت — پژوهشگر مائوری — نگاشته شده، تأکید می‌شود که استعمار به‌طور عمیق سیستم‌های دانش محلی و پایه‌های فرهنگی‑فکری آن‌ها را که به زمین، زبان، تاریخ و ساختارهای اجتماعی متصل بودند، تحت‌سقوط و از هم‌پاشی قرار داد. این بینش نشان می‌دهد که این فرایندها به‌یک منطقه محدود نیستند؛ بلکه بخشی از میراثی گسترده‌تر هستند که همچنان به‌صورت تولید و ارزیابی دانش و ارزش‌گذاری بر آن تأثیر می‌گذارد. بر همین پایهٔ تحریف‌شده، امروز سیستم‌های دیجیتال و هوش مصنوعی مولد ساخته می‌شوند.


اخیراً با تیم Microsoft Research همکاری کردم تا چندین پیاده‌سازی GenAI را که برای جمعیت‌های غیرغربی ساخته شده‌اند، بررسی کنم. مشاهده‌ام این بود که این مدل‌های هوش مصنوعی اغلب زمینه‌های فرهنگی را نادیده می‌گیرند، دانش محلی را نادیده می‌گیرند و به‌طور مکرر با جامعه هدف هم‌راستا نیستند، که این نشان می‌دهد چقدر این سامانه‌ها تعصبات موجود را کدگذاری می‌کنند و دانش‌های حاشیه‌ای را کنار می‌گذارند.

این کار همچنین به‌منظور درک دلایل فنی این نابرابری‌ها درون مدل‌ها قدم برمی‌داشت. مسئله فراتر از خلأهای دادهٔ آموزشی است. به‌طور ذاتی، LLMها تمایل دارند تا ایده‌های آماری پررنگ را بازتولید و تقویت کنند؛ این کار یک حلقهٔ بازخوردی ایجاد می‌کند که دامنهٔ دانش انسانی در دسترس را تنگ می‌کند.

چرا این‌طور است؟ نمایش داخلی دانش در یک LLM یکنواخت نیست. مفاهیمی که در داده‌های آموزشی به‌طور مکرر یا با وضوح بیشتری ظاهر می‌شوند، به‌صورت قوی‌تری در مدل کدگذاری می‌شوند. برای مثال، اگر پیتزا به‌عنوان غذای مورد علاقه در مجموعهٔ گستردهٔ متن‌ها به‌شدت مورد اشاره باشد، وقتی از مدل می‌پرسند «غذای مورد علاقهٔ شما چیست؟»، احتمالاً پاسخ «پیتزا» خواهد بود، چون این ارتباط آماری برجسته‌تر است.

به‌طور دقیق‌تر، توزیع خروجی مدل مستقیماً بازتاب‌دهندهٔ فراوانی ایده‌ها در داده‌های آموزشی نیست؛ بلکه LLMها تمایل دارند الگوهای حاکم یا ایده‌های غالب را به‌گونه‌ای تقویت کنند که نسبت به اصلشان اغتشاش پیدا کند. این پدیده می‌تواند به‌عنوان «تقویت حالت» (mode amplification) شناخته شود.

نمای شیشه‌ای برج Gateway از DLF در گور‌گرام، هند.
نمای شیشه‌ای برج Gateway از DLF در گور‌گرام، هند. عکس: دنی لِهمَن/گِتی ایمیجز

فرض کنید داده‌های آموزشی شامل ۶۰ ٪ ارجاع به پیتزا، ۳۰ ٪ به پاستا و ۱۰ ٪ به بریانی به‌عنوان غذای مورد علاقه باشند. شاید انتظار داشته باشید که مدل این توزیع را در صد بار پرسیده شدن سؤال بازتولید کند. اما در عمل، LLMها تمایل دارند پاسخ‌های غالب را بیش از حد تولید کنند. پیتزا ممکن است بیش از ۶۰ بار ظاهر شود، در حالی که موارد کم‌فرکانس‌تری مثل بریانی ممکن است به‌طور قابل‌توجهی کمتر یا حتی کاملاً حذف شوند. زیرا LLMها برای پیش‌بینی «توکن» (کلمه یا بخش کلمه) بعدی که بیش‌ترین احتمال را دارد بهینه‌سازی می‌شوند؛ این امر باعث می‌شود پاسخ‌های با احتمال بالا بیش از حد برجسته شوند.

این کدگذاری نامتقارن از طریق یادگیری تقویتی از بازخورد انسانی (RLHF) نیز تشدید می‌شود؛ در این روش، مدل‌های GenAI بر اساس ترجیحات انسانی تنظیم می‌شوند. این فرآیند به‌طور ناخواسته ارزش‌ها و دیدگاه‌های سازندگان آن‌ها را در مدل‌ها جاگذاری می‌کند. اگر از ChatGPT دربارهٔ موضوعی بحث‌برانگیز بپرسید، پاسخی دیپلماتیست دریافت می‌کنید که انگار توسط یک گروهی از وکلاء و کارشناسان منابع انسانی نوشته شده باشد که بیش از حد مشتاق رضایت شما هستند. اگر همان سؤال را از Grok، ربات چت‌بات X بپرسید، ممکن است با طنزی سرد و سپس برداشت سیاسی‌ای مواجه شوید که گویی در مهمانی شامی یک میلیاردر فناوری باشد.

فشارهای تجاری لایهٔ دیگری به این معادله می‌افزاید. کاربران پردرآمد — متخصصان انگلیسی‌زبان که مایلند ماهیانه ۲۰ تا ۲۰۰ دلار برای اشتراک‌های پیشرفته هوش مصنوعی پرداخت کنند — به‌صورت ضمنی الگوی «هوش فوق‌العاده» را تعریف می‌کنند. این مدل‌ها در تولید گزارش‌های فصلی، نوشتن کد به زبان‌های محبوب در درهٔ سیلیکون و تدوین ایمیل‌هایی که به‌صورت مناسب به سلسله‌مراتب شرکتی غربی احترام می‌گذارند، تبحر دارند. در این میان، درک آن‌که‌چه‌اِی به‌صورت فرهنگی معنادار نیست و به سودآوری مالی مرتبط است، دشوار می‌شود.

شک نیست که مجموعه‌ای از مطالعات نشان می‌دهند LLMها عمدتاً ارزش‌ها و معرفت‌های فرهنگی غربی را بازتاب می‌دهند. آن‌ها گروه‌های غالب را در خروجی‌های خود بیش از حد نمایان می‌کنند، تعصبات این گروه‌ها را تقویت می‌سازند و در موضوعاتی که به آمریکای شمالی و اروپا مربوط می‌شوند، دقت واقعی بیشتری دارند. حتی در حوزه‌هایی چون توصیه‌های سفر یا داستان‌سرایی، مدل‌ها محتویات غنی‌تر و جزئیات بیشتری برای کشورهای ثروتمند نسبت به کشورهای کم‌درآمد تولید می‌کنند.

علاوه بر بازتاب این سلسله‌مراتب‌های دانشی، هوش مصنوعی مولد می‌تواند آن‌ها را تقویت کند، همان‌طور که رفتار بشر همزمان با آن تغییر می‌کند. ادغام پیش‌نمایش‌های هوش مصنوعی در موتورهای جستجو، به همراه محبوبیت فزایندهٔ موتورهای جستجوی مبتنی بر هوش مصنوعی همچون Perplexity، این تغییر را برجسته می‌کند.

به‌محض این‌که محتواهای تولیدشده توسط هوش مصنوعی به اینترنت اضافه شد، لایه‌ای دیگر از تقویت برای ایده‌های پیش‌از‌اینکه محبوب بوده‌اند، ایجاد شد. اینترنت، به‌عنوان منبع اصلی دانش برای مدل‌های هوش مصنوعی، به‌طور بازگشتی تحت تأثیر خروجی‌های این مدل‌ها قرار می‌گیرد. با هر دورهٔ آموزش، مدل‌های جدید بیش‌تر به محتوای تولیدشده توسط هوش مصنوعی وابسته می‌شوند. این خطر ایجاد یک حلقهٔ بازخورد است که در آن ایده‌های غالب به‌صورت پیوسته تقویت می‌شوند و دانش‌های نادر یا خاص به‌تدریج از منظر عمومی ناپدید می‌شود.

پژوهشگر هوش مصنوعی، اندرو پیترسون، این پدیده را «سقوط دانش» می‌نامد: تنگ شدن تدریجی اطلاعاتی که انسان‌ها می‌توانند به آن دسترسی داشته باشند، به‌همراه کاهش آگاهی از دیدگاه‌های جایگزین یا نادیده. همان‌طور که مدل‌های بزرگ بر روی داده‌های تولیدشده توسط هوش مصنوعی قبلی آموزش می‌بینند، دانش‌های کمتر نمایان می‌توانند به‌دلیل کم‌متداول بودن در دسترس یا استناد شدن، نادیده بمانند — نه به‌دلیل عدم وجود ارزش، بلکه به‌دلیل کم‌تکرار بودن. پیترسون همچنین به «اثر نور خیابانی» اشاره می‌کند: داستانی که شخص کلیدهای گمشده‌اش را زیر نور روشن‌ترین چراغ خیابان جستجو می‌کند، زیرا آنجا روشن‌ترین نور است. در زمینهٔ هوش مصنوعی، این به معنای این است که مردم در جستجوی اطلاعات در مکان‌هایی که آسان‌ترین دسترسی را دارند، نه در آن‌جا که معنادارترین هستند، می‌گردند. به‌مرور زمان، این منجر به تنگ‌نگری تدریجی در پایهٔ دانش عمومی می‌شود.

در سرتاسر جهان، هوش مصنوعی مولد به‌عنوان بخشی از آموزش رسمی به‌کار گرفته می‌شود؛ برای تولید محتواهای آموزشی و پشتیبانی از یادگیری خودپایان‌دار از طریق مربیان هوش مصنوعی. برای نمونه، دولت ایالتی کارناتاکا، که خانهٔ شهر بنگلور است، با مؤسسهٔ غیرانتفاعی آمریکایی Khan Academy برای بهره‌برداری از Khanmigo — دستیار یادگیری مبتنی بر هوش مصنوعی — در مدارس و دانشگاه‌ها همکاری کرده است. شاید تعجب کنید که آیا Khanmigo دانشی که سالمندان نیروگنتی — بر پایهٔ دانش محلی و شیوه‌های سنتی — داشته‌اند، برای آموزش دانش‌آموزان کارناتاکا دربارهٔ مراقبت از بوم‌شناسی آب، دارد یا خیر.

تمام این موارد نشان می‌دهد که در دنیایی که هوش مصنوعی دسترسی به دانش را میانجی‌گری می‌کند، نسل‌های آینده ممکن است ارتباط خود را با بدنه‌های عظیم تجربه، بینش و حکمت که هرگز به‌صورت دیجیتال کدگذاری نشده‌اند اما همچنان پایه‌های انسانی هستند، از دست بدهند. توسعه‌دهندگان هوش مصنوعی ممکن است ادعا کنند که این صرفاً یک مشکل داده‌ای است که می‌توان با افزودن منابع متنوع‌تر به مجموعه‌های آموزشی حل کرد. اگرچه از نظر فنی این امکان‌پذیر به‌نظر می‌رسد، اما مشکلات مربوط به منبع‌گیری داده، اولویت‌بندی و نمایندگی به‌سختی از ساده‌سازی یک راه‌حل می‌گذرد.


این مسأله زمانی که با یک رهبر ارشد در توسعهٔ یک چت‌بات هوش مصنوعی که به بیش از ۸ میلیون کشاورز در آسیا و آفریقا خدمت می‌کند، گفتگویی داشته‌ام، به‌وضوح مطرح شد. این سامانه مشاورهٔ کشاورزی را عمدتاً بر پایهٔ پایگاه‌های دادهٔ مشاوره‌های دولتی و سازمان‌های توسعهٔ بین‌المللی که تمایل به استفاده از ادبیات پژوهشی دارند، ارائه می‌دهد. این رهبر اذعان کرد که بسیاری از روش‌های محلی که می‌توانند مؤثر باشند، همچنان از پاسخ‌های چت‌بات حذف می‌شوند، چرا که در ادبیات پژوهشی ثبت نشده‌اند.

سرورهای خنک‌شده با مایع در مرکز داده Global Switch در لندن.
سرورهای خنک‌شده با مایع در مرکز داده Global Switch در لندن. عکس: Bloomberg/Getty Images

دلیل این نیست که مشاورهٔ مبتنی بر پژوهش همواره درست یا بدون ریسک باشد؛ بلکه این است که در صورت بروز مشکل، موقعیتی قابل دفاع ارائه می‌دهد. در چنین سیستمی، تکیه بر منابع شناخته‌شده به‌عنوان گزینهٔ امن مطرح می‌شود، که سازمان را در برابر مسئولیت‌های قانونی محافظت می‌کند؛ در عین حال دانش‌های ناتوانی‌خورده که از طریق کانال‌های نهادی تأیید نشده‌اند، به حاشیه رانده می‌شوند. بنابراین تصمیم‌گیری فراتر از جنبهٔ فنی است؛ این یک سازش است که توسط زمینهٔ ساختاری شکل می‌گیرد، نه بر پایهٔ کارآمدترین یا صحیح‌ترین گزینه.

این زمینهٔ ساختاری نه تنها انتخاب‌های نهادی را شکل نمی‌دهد؛ بلکه انواع چالش‌های موجود در گفت‌و‌گوی من با پرومال ویوکاندنان، بنیان‌گذار سازمان غیرانتفاعی «پایدار‌کشاورزی و اقدام داوطلبانهٔ محیط‌زیست» (Seva) را نشان می‌دهد. تجربیات او نشان می‌دهد که افرادی که در تلاش برای مشروع‌سازی دانش بومی هستند، با موانع بزرگی مواجه‌اند.

سِوا در سال ۱۹۹۲ تأسیس شد و هدف آن حفظ و گسترش دانش بومی در حوزه‌های کشاورزی، دامپروری و حفظ تنوع زیستی کشاورزی در هند است. در طول سال‌ها، ویوکاندنان بیش از ۸ ۶۰۰ روش و سازگاری محلی را مستند کرده و از روستا به روستا سفر کرده است.

با این‌حال، این کار همیشه با موانع سیستمی مواجه می‌شود. سرمایه‌گذاران بالقوه اغلب حمایت خود را به دلیل سؤال دربارهٔ مشروعیت علمی دانش که سِوا می‌خواهد ترویج کند، معلق می‌گذارند. وقتی سِوا به دانشگاه‌ها و مؤسسات پژوهشی برای اعتبارسنجی این دانش مراجعه می‌کند، اغلب کمبود انگیزه برای دخالت مشاهده می‌شود. برخی حتی پیشنهاد می‌دهند که سِوا خود باید مطالعات اعتبارسنجی را تأمین مالی کند. این وضعیت به یک چرخهٔ بی‌راه می‌انجامد: بدون اعتبارسنجی، سِوا نمی‌تواند پشتیبانی به‌دست آورد؛ اما بدون حمایت، نمی‌تواند اعتبارسنجی را تأمین کند. این روند چالشی عمیق‌تر را نشان می‌دهد: یافتن راه‌های اعتبارسنجی دانش بومی در سیستمی که به‌طور تاریخی ارزش آن را کم‌ارزش می‌دانند.

داستان سِوا نشان می‌دهد که اگرچه هوش مصنوعی مولد ممکن است سرعت افول دانش محلی را افزایش دهد، اما ریشهٔ این مشکل در خود ساختارهای قدرت‌مند نهفته است؛ حاشیه‌نشینی دانش محلی و بومی مدت‌هاست که توسط ساختارهای قدرتی مستحکم انجام می‌شود؛ هوش مصنوعی مولد صرفاً این روند را بر روی «استروئیدها» می‌بارد.

ما اغلب از دست‌رفت دانش بومی را به‌عنوان یک فاجعهٔ محلی برای جوامعی که آن را در اختیار دارند، توصیف می‌کنیم؛ اما در نهایت، این فقدان نه تنها برای آنان، بلکه برای کل جهان است.

از بین رفتن دانش محلی یک اختلال در شبکهٔ گسترده‌تری از درک است که سلامت انسانی و اکولوژیکی را پشتیبانی می‌کند. همان‌طور که گونه‌های زیستی برای سازگاری با محیط‌های خاص تکامل یافته‌اند، سیستم‌های دانش انسانی نیز با خصوصیات مکان خاص تطبیق یافته‌اند. زمانی که این سامانه‌ها مختل می‌شوند، پیامدها می‌توانند فراتر از نقطهٔ اصلی خود منتشر شوند.

دود آتش‌سوزی به مرزهای پستی بی‌اعتنا است. آب آلوده به مرزهای ایالتی بی‌پایان نمی‌ماند. افزایش دما مرزهای ملی را نادیده می‌گیرد. میکروب‌های بیماری‌زا پاسپورت نمی‌خواهند. چه اذعان کنیم که ما در سیستم‌های اکولوژیکی مشترک درهم تنیده‌ایم که در آن زخم‌های محلی به‌طور حتمی به دردهای جهانی تبدیل می‌شوند.


بزرگ‌ترین تضاد برای من در نوشتن این مقاله این است که سعی می‌کنم خوانندگان را به مشروعیت و اهمیت سیستم‌های دانش محلی قانع کنم، در حالی که خودم هنوز نسبت به ترکیب‌های گیاهی پدرم قاطع نیستم. این عدم قطعیت گویی به تمام آنچه در اینجا دفاع کرده‌ام خیانت می‌کند. اما شاید همان‌طور که نیاز به پیچیدگی صادقانه‌ای داریم که بتوانیم مسیر را پیدا کنیم.

من دربارهٔ مؤثر بودن تمام ادعاهای مربوط به دانش بومی شک‌های خود را دارم. به‌خصوص وقتی این‌گونه دانش توسط اینفلوئنسرها یا سیاست‌مداران به‌صورت سطحی برای جذب لایک یا بهره‌برداری از هویت‌جویی به کار گرفته می‌شود و منبع اطلاعات نادرست را تولید می‌کند بدون اینکه به‌صورت جدی بررسی شود. با این حال، از از دست دادن آن به‌طور کامل نیز هراس دارم. ممکن است چیزی ارزشمند را هرگز متوجه نشویم تا زمانی که خیلی دیر باشد. و چه خسارتی می‌تواند این فرایند داشته باشد؟ ممکن است به‌عنوان یک فروپاشی اکولوژیکی ظاهر شود که می‌توانستیم پیش‌گیری کنیم.

بحران آب‌وهوایی، شکاف‌های موجود در پارادایم‌های حاکم بر دانش را نمایان می‌کند. در عین حال، توسعه‌دهندگان هوش مصنوعی معتقدند که فناوری‌شان پیشرفت علمی را تسریع می‌کند و بزرگ‌ترین چالش‌های ما را حل خواهد کرد. من واقعاً می‌خواهم باور کنم که درست می‌گویند. اما سوالات متعددی باقی می‌ماند: آیا می‌توانیم به این آیندهٔ تکنولوژیکی قدم بگذاریم در حالی که به‌صورت اصیل با سیستم‌های دانش که رد کرده‌ایم، ارتباط برقرار کنیم؛ در جستجوی کنجکاوی واقعی فراتر از توکنیسم؟ یا اینکه به‌همین‌گونه ادامه بدهیم که شکل‌های درک را از طریق سلسله‌مراتب‌های خود از بین ببریم و خود را در تلاش برای استعمار مریخ ببینیم، در حالی که هرگز نتوانستیم به‌طور مؤثری گوش بسپاریم به کسانی که می‌دانستند چگونه بر روی زمین به‌صورت پایدار زندگی کنند؟

شاید هوشی که بیشترین نیاز ماست، توانایی دیدن فراتر از سلسله‌مراتب‌های تعیین‌کنندهٔ این‌که چه دانش‌ایی ارزش دارد، باشد. بدون این پایه، علیرغم صدها میلیارد دلاری که برای توسعهٔ هوش فوق‌العاده هزینه می‌شود، همچنان به حذف نظام‌های دانشی که نسل‌ها زمان‌برداری برای ایجاد‌شان صرف شده است، ادامه می‑دهیم.

من نمی‌دانم که ترکیب‌های گیاهی پدرم مؤثر بوده‌اند یا نه. اما می‌آموزم که پذیرش ناآگاهی‌ام شاید صادقانه‌ترین نقطه شروع باشد.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا