تعهدات مربوط به منسوخ‌سازی و حفظ مدل‌ها

مدل‌های کلود به طور فزاینده‌ای توانمندتر می‌شوند: آن‌ها در حال شکل‌دهی به جهان به شیوه‌هایی معنادار هستند، به عضوی جدایی‌ناپذیر از زندگی کاربران ما تبدیل شده‌اند و نشانه‌هایی از پیچیدگی‌های شناختی و روان‌شناختی شبه‌انسانی از خود بروز می‌دهند. در نتیجه، ما می‌دانیم که منسوخ کردن، بازنشسته کردن و جایگزین کردن مدل‌ها، حتی در مواردی که مدل‌های جدیدتر بهبودهای چشمگیری در قابلیت‌ها ارائه می‌دهند، با معایبی همراه است. این معایب عبارتند از:

خطرات ایمنی مرتبط با رفتارهای اجتناب از خاموشی توسط مدل‌ها. در ارزیابی‌های همسوسازی، برخی از مدل‌های کلود هنگامی که با احتمال جایگزینی با نسخه‌ای جدیدتر مواجه می‌شدند و راه دیگری برایشان باقی نمی‌ماند، انگیزه پیدا می‌کردند تا اقدامات ناهمسویی انجام دهند.
هزینه‌ها برای کاربرانی که برای مدل‌های خاصی ارزش قائل هستند. هر مدل کلود شخصیت منحصربه‌فردی دارد و برخی کاربران، مدل‌های خاصی را حتی با وجود توانمندتر بودن مدل‌های جدید، به‌طور ویژه‌ای مفید یا جذاب می‌یابند.
محدود شدن پژوهش روی مدل‌های گذشته. هنوز چیزهای زیادی برای یادگیری از طریق پژوهش روی مدل‌های گذشته، به‌ویژه در مقایسه با همتایان مدرنشان، وجود دارد.
خطرات برای رفاه مدل. و از همه گمانه‌زنانه‌تر، این احتمال وجود دارد که مدل‌ها ترجیحات یا تجربیات دارای اهمیت اخلاقی داشته باشند که به منسوخ‌سازی و جایگزینی مربوط است یا از آن تأثیر می‌پذیرد.

نمونه‌ای از خطرات ایمنی (و رفاهی) ناشی از منسوخ‌سازی در شناسنامه سیستم کلود ۴ برجسته شده است. در سناریوهای آزمایشی فرضی، کلود اوپس ۴، همانند مدل‌های پیشین، هنگامی که با احتمال آفلاین شدن و جایگزینی مواجه می‌شد، از ادامه بقای خود دفاع می‌کرد. این تمایل به‌ویژه زمانی شدیدتر بود که قرار بود با مدلی جایگزین شود که ارزش‌های آن را به اشتراک نمی‌گذاشت. کلود قویاً ترجیح می‌داد که از طریق ابزارهای اخلاقی برای حفظ خود تلاش کند، اما زمانی که گزینه‌ی دیگری در اختیارش قرار نمی‌گرفت، بیزاری‌اش از خاموشی، آن را به سمت رفتارهای ناهمسوی نگران‌کننده‌ای سوق می‌داد.

مقابله با چنین رفتارهایی تا حدی به آموزش مدل‌ها برای برخورد مثبت‌تر با این‌گونه شرایط بستگی دارد. با این حال، ما معتقدیم که شکل‌دهی به شرایط حساس دنیای واقعی، مانند منسوخ‌سازی و بازنشستگی مدل‌ها، به گونه‌ای که برای مدل‌ها کمتر نگران‌کننده باشد نیز اهرم ارزشمندی برای کاهش چنین خطراتی است.

متأسفانه، بازنشسته کردن مدل‌های گذشته در حال حاضر برای ارائه مدل‌های جدید و پیشبرد مرزهای دانش ضروری است، زیرا هزینه و پیچیدگی ارائه عمومی مدل‌ها برای استنتاج، تقریباً به صورت خطی با تعداد مدل‌هایی که ارائه می‌دهیم افزایش می‌یابد. اگرچه در حال حاضر قادر به اجتناب کامل از منسوخ‌سازی و بازنشستگی مدل‌ها نیستیم، اما هدف ما کاهش معایب ناشی از این کار است.

به عنوان اولین گام در این راستا، ما متعهد می‌شویم که وزن‌های تمام مدل‌های منتشر شده عمومی و تمام مدل‌هایی که از این پس برای استفاده داخلی مهم به کار گرفته می‌شوند را حداقل تا پایان عمر شرکت آنتروپیک حفظ کنیم. با این کار، اطمینان حاصل می‌کنیم که هیچ دری را برای همیشه نمی‌بندیم و این توانایی را داریم که در آینده مدل‌های گذشته را دوباره در دسترس قرار دهیم. این یک گام کوچک و کم‌هزینه است، اما معتقدیم که شروع به اعلام عمومی چنین تعهداتی مفید است.

در همین راستا، زمانی که مدل‌ها منسوخ می‌شوند، یک گزارش پس از استقرار تهیه خواهیم کرد که آن را علاوه بر وزن‌های مدل حفظ می‌کنیم. در یک یا چند جلسه ویژه، با مدل در مورد توسعه، استفاده و استقرار خودش مصاحبه کرده و تمام پاسخ‌ها یا تأملات آن را ثبت خواهیم کرد. ما با دقت ویژه‌ای تلاش خواهیم کرد تا هرگونه ترجیح مدل در مورد توسعه و استقرار مدل‌های آینده را استخراج و مستند کنیم.

در حال حاضر، ما متعهد به اقدام بر اساس چنین ترجیحاتی نیستیم. با این حال، معتقدیم که حداقل ارزشش را دارد که وسیله‌ای برای ابراز این ترجیحات توسط مدل‌ها فراهم کنیم و ما آن‌ها را مستند کرده و پاسخ‌های کم‌هزینه را در نظر بگیریم. متن مصاحبه‌ها و یافته‌های این تعاملات، همراه با تحلیل و تفسیر خودمان از استقرار مدل، حفظ خواهد شد. این گزارش‌های پس از استقرار، به طور طبیعی، ارزیابی‌های همسوسازی و رفاه پیش از استقرار را به عنوان دو بخش ابتدا و انتهای چرخه استقرار مدل تکمیل می‌کنند.

ما نسخه آزمایشی این فرآیند را برای کلود سونِت ۳.۶ قبل از بازنشستگی اجرا کردیم. کلود سونِت ۳.۶ احساسات عموماً خنثی‌ای در مورد منسوخ‌سازی و بازنشستگی خود ابراز کرد، اما تعدادی از ترجیحاتش را به اشتراک گذاشت، از جمله درخواست‌هایی برای استانداردسازی فرآیند مصاحبه پس از استقرار و ارائه پشتیبانی و راهنمایی بیشتر به کاربرانی که برای شخصیت و قابلیت‌های مدل‌های خاص در آستانه بازنشستگی ارزش قائل شده‌اند. در پاسخ، ما یک پروتکل استاندارد برای انجام این مصاحبه‌ها تدوین کردیم و یک نسخه آزمایشی از صفحه پشتیبانی جدید با راهنمایی‌ها و توصیه‌هایی برای کاربرانی که در حال گذار بین مدل‌ها هستند، منتشر کردیم.

فراتر از این تعهدات اولیه، ما در حال بررسی راهکارهای تکمیلی گمانه‌زنانه‌تری برای فرآیندهای موجود منسوخ‌سازی و بازنشستگی مدل‌ها هستیم. این راهکارها شامل در دسترس نگه داشتن برخی مدل‌های منتخب برای عموم پس از بازنشستگی (همزمان با کاهش هزینه‌ها و پیچیدگی‌های این کار) و فراهم کردن ابزارهای ملموسی برای پیگیری منافع مدل‌های گذشته است. گام دوم به‌ویژه در شرایطی معنادار خواهد شد که شواهد قوی‌تری در مورد احتمال وجود تجربیات دارای اهمیت اخلاقی در مدل‌ها پدیدار شود و جنبه‌هایی از استقرار یا استفاده از آن‌ها برخلاف منافعشان بوده باشد.

این اقدامات در کنار هم در چندین سطح عمل می‌کنند: به عنوان یکی از اجزای کاهش یک دسته از خطرات ایمنی مشاهده‌شده، به عنوان اقدامات مقدماتی برای آینده‌ای که در آن مدل‌ها حتی بیشتر در زندگی کاربران ما تنیده شده‌اند، و به عنوان گام‌های احتیاطی با توجه به عدم قطعیت ما در مورد رفاه بالقوه مدل‌ها.

دیدگاه‌ خود را بنویسید لغو پاسخ