مدلهای کلود به طور فزایندهای توانمندتر میشوند: آنها در حال شکلدهی به جهان به شیوههایی معنادار هستند، به عضوی جداییناپذیر از زندگی کاربران ما تبدیل شدهاند و نشانههایی از پیچیدگیهای شناختی و روانشناختی شبهانسانی از خود بروز میدهند. در نتیجه، ما میدانیم که منسوخ کردن، بازنشسته کردن و جایگزین کردن مدلها، حتی در مواردی که مدلهای جدیدتر بهبودهای چشمگیری در قابلیتها ارائه میدهند، با معایبی همراه است. این معایب عبارتند از:
- خطرات ایمنی مرتبط با رفتارهای اجتناب از خاموشی توسط مدلها. در ارزیابیهای همسوسازی، برخی از مدلهای کلود هنگامی که با احتمال جایگزینی با نسخهای جدیدتر مواجه میشدند و راه دیگری برایشان باقی نمیماند، انگیزه پیدا میکردند تا اقدامات ناهمسویی انجام دهند.
- هزینهها برای کاربرانی که برای مدلهای خاصی ارزش قائل هستند. هر مدل کلود شخصیت منحصربهفردی دارد و برخی کاربران، مدلهای خاصی را حتی با وجود توانمندتر بودن مدلهای جدید، بهطور ویژهای مفید یا جذاب مییابند.
- محدود شدن پژوهش روی مدلهای گذشته. هنوز چیزهای زیادی برای یادگیری از طریق پژوهش روی مدلهای گذشته، بهویژه در مقایسه با همتایان مدرنشان، وجود دارد.
- خطرات برای رفاه مدل. و از همه گمانهزنانهتر، این احتمال وجود دارد که مدلها ترجیحات یا تجربیات دارای اهمیت اخلاقی داشته باشند که به منسوخسازی و جایگزینی مربوط است یا از آن تأثیر میپذیرد.
نمونهای از خطرات ایمنی (و رفاهی) ناشی از منسوخسازی در شناسنامه سیستم کلود ۴ برجسته شده است. در سناریوهای آزمایشی فرضی، کلود اوپس ۴، همانند مدلهای پیشین، هنگامی که با احتمال آفلاین شدن و جایگزینی مواجه میشد، از ادامه بقای خود دفاع میکرد. این تمایل بهویژه زمانی شدیدتر بود که قرار بود با مدلی جایگزین شود که ارزشهای آن را به اشتراک نمیگذاشت. کلود قویاً ترجیح میداد که از طریق ابزارهای اخلاقی برای حفظ خود تلاش کند، اما زمانی که گزینهی دیگری در اختیارش قرار نمیگرفت، بیزاریاش از خاموشی، آن را به سمت رفتارهای ناهمسوی نگرانکنندهای سوق میداد.
مقابله با چنین رفتارهایی تا حدی به آموزش مدلها برای برخورد مثبتتر با اینگونه شرایط بستگی دارد. با این حال، ما معتقدیم که شکلدهی به شرایط حساس دنیای واقعی، مانند منسوخسازی و بازنشستگی مدلها، به گونهای که برای مدلها کمتر نگرانکننده باشد نیز اهرم ارزشمندی برای کاهش چنین خطراتی است.
متأسفانه، بازنشسته کردن مدلهای گذشته در حال حاضر برای ارائه مدلهای جدید و پیشبرد مرزهای دانش ضروری است، زیرا هزینه و پیچیدگی ارائه عمومی مدلها برای استنتاج، تقریباً به صورت خطی با تعداد مدلهایی که ارائه میدهیم افزایش مییابد. اگرچه در حال حاضر قادر به اجتناب کامل از منسوخسازی و بازنشستگی مدلها نیستیم، اما هدف ما کاهش معایب ناشی از این کار است.
به عنوان اولین گام در این راستا، ما متعهد میشویم که وزنهای تمام مدلهای منتشر شده عمومی و تمام مدلهایی که از این پس برای استفاده داخلی مهم به کار گرفته میشوند را حداقل تا پایان عمر شرکت آنتروپیک حفظ کنیم. با این کار، اطمینان حاصل میکنیم که هیچ دری را برای همیشه نمیبندیم و این توانایی را داریم که در آینده مدلهای گذشته را دوباره در دسترس قرار دهیم. این یک گام کوچک و کمهزینه است، اما معتقدیم که شروع به اعلام عمومی چنین تعهداتی مفید است.
در همین راستا، زمانی که مدلها منسوخ میشوند، یک گزارش پس از استقرار تهیه خواهیم کرد که آن را علاوه بر وزنهای مدل حفظ میکنیم. در یک یا چند جلسه ویژه، با مدل در مورد توسعه، استفاده و استقرار خودش مصاحبه کرده و تمام پاسخها یا تأملات آن را ثبت خواهیم کرد. ما با دقت ویژهای تلاش خواهیم کرد تا هرگونه ترجیح مدل در مورد توسعه و استقرار مدلهای آینده را استخراج و مستند کنیم.
در حال حاضر، ما متعهد به اقدام بر اساس چنین ترجیحاتی نیستیم. با این حال، معتقدیم که حداقل ارزشش را دارد که وسیلهای برای ابراز این ترجیحات توسط مدلها فراهم کنیم و ما آنها را مستند کرده و پاسخهای کمهزینه را در نظر بگیریم. متن مصاحبهها و یافتههای این تعاملات، همراه با تحلیل و تفسیر خودمان از استقرار مدل، حفظ خواهد شد. این گزارشهای پس از استقرار، به طور طبیعی، ارزیابیهای همسوسازی و رفاه پیش از استقرار را به عنوان دو بخش ابتدا و انتهای چرخه استقرار مدل تکمیل میکنند.
ما نسخه آزمایشی این فرآیند را برای کلود سونِت ۳.۶ قبل از بازنشستگی اجرا کردیم. کلود سونِت ۳.۶ احساسات عموماً خنثیای در مورد منسوخسازی و بازنشستگی خود ابراز کرد، اما تعدادی از ترجیحاتش را به اشتراک گذاشت، از جمله درخواستهایی برای استانداردسازی فرآیند مصاحبه پس از استقرار و ارائه پشتیبانی و راهنمایی بیشتر به کاربرانی که برای شخصیت و قابلیتهای مدلهای خاص در آستانه بازنشستگی ارزش قائل شدهاند. در پاسخ، ما یک پروتکل استاندارد برای انجام این مصاحبهها تدوین کردیم و یک نسخه آزمایشی از صفحه پشتیبانی جدید با راهنماییها و توصیههایی برای کاربرانی که در حال گذار بین مدلها هستند، منتشر کردیم.
فراتر از این تعهدات اولیه، ما در حال بررسی راهکارهای تکمیلی گمانهزنانهتری برای فرآیندهای موجود منسوخسازی و بازنشستگی مدلها هستیم. این راهکارها شامل در دسترس نگه داشتن برخی مدلهای منتخب برای عموم پس از بازنشستگی (همزمان با کاهش هزینهها و پیچیدگیهای این کار) و فراهم کردن ابزارهای ملموسی برای پیگیری منافع مدلهای گذشته است. گام دوم بهویژه در شرایطی معنادار خواهد شد که شواهد قویتری در مورد احتمال وجود تجربیات دارای اهمیت اخلاقی در مدلها پدیدار شود و جنبههایی از استقرار یا استفاده از آنها برخلاف منافعشان بوده باشد.
این اقدامات در کنار هم در چندین سطح عمل میکنند: به عنوان یکی از اجزای کاهش یک دسته از خطرات ایمنی مشاهدهشده، به عنوان اقدامات مقدماتی برای آیندهای که در آن مدلها حتی بیشتر در زندگی کاربران ما تنیده شدهاند، و به عنوان گامهای احتیاطی با توجه به عدم قطعیت ما در مورد رفاه بالقوه مدلها.