از دوچرخه تا موشک، یادگیری از طریق تجربه – چه انسانی و چه ماشینی – آیندهٔ کاوش فضایی را شکل میدهد.

این مقاله ابتدا در The Conversation منتشر شد. این نشریه مقاله را به بخش صداهای کارشناسان: تحلیلها و بینشها در Space.com ارائه داد.
هر سال، شرکتها و سازمانهای فضایی صدها موشک را به فضا میپرند – و این عدد با مأموریتهای جاهطلبانه به ماه، مریخ و فراتر از آن بهطرز چشمگیری افزایش خواهد یافت. اما این آرزوها به یک چالش اساسی وابستهاند: رانش – روشهایی که برای پیشبرد موشکها و فضاپیماها استفاده میشوند.
ما تیمی از مهندسان و دانشجویان دورهٔ تحصیلات تکمیلی هستیم که به بررسی این میپردازیم که هوش مصنوعی بهطور کلی و بهویژه زیرمجموعهٔ آن به نام یادگیری ماشین، چگونه میتواند رانش فضاپیماها را متحول کند. از بهینهسازی موتورهای حرارتی هستهای تا مدیریت مهار پیچیدهٔ پلاسما در سامانههای همجوشی، هوش مصنوعی در حال بازطراحی طراحی و عملیات رانش است. بهسرعت به شریکی اساسی در سفر بشر به سوی ستارگان تبدیل میشود.
یادگیری ماشین و یادگیری تقویتی
یادگیری ماشین شاخهای از هوش مصنوعی است که الگوهایی در دادهها را شناسایی میکند که بهصورت صریح برای آن آموزش داده نشدهاند. این حوزه گسترده شاخههای مختلف خود را دارد و کاربردهای فراوانی دارد. هر شاخه هوش را به شکلهای متفاوتی شبیهسازی میکند: از شناسایی الگوها، تجزیه و تولید زبان، تا یادگیری از تجربه. این زیرمجموعهٔ آخر، که معمولاً بهعنوان یادگیری تقویتی شناخته میشود، به ماشینها میآموزد که وظایف خود را با ارزیابی عملکردشان انجام دهند و از این طریق بهصورت مستمر از طریق تجربه پیشرفت کنند.
بهعنوان مثال ساده، یک بازیکن شطرنج را تصور کنید. این بازیکن هر حرکت را محاسبه نمیکند، بلکه الگوهایی را که از بازی در هزار مسابقه بهدست آورده است، بهکار میگیرد. یادگیری تقویتی تخصص شهودی مشابهی را در ماشینها و سیستمها ایجاد میکند، اما با سرعت و مقیاس محاسباتی که برای انسانها غیرممکن است. این روش از طریق تجربه و تکرار، با مشاهدهٔ محیط خود میآموزد. این مشاهدات به ماشین اجازه میدهد تا هر نتیجه را بهدرستی تفسیر کند و بهترین استراتژیها را برای رسیدن سیستم به هدف اعمال نماید.
یادگیری تقویتی میتواند درک انسان از سیستمهای بسیار پیچیده را ارتقا دهد – سیستمهایی که مرزهای شهودی انسانی را به چالش میکشند. این روش میتواند مسیر بهینهٔ یک فضاپیما را برای رسیدن به هر نقطهای از فضا تعیین کند و این کار را با بهینهسازی رانش مورد نیاز برای انتقال سفینه به آن نقطه انجام میدهد. همچنین میتواند بهطور بالقوه سیستمهای رانش بهتری را طراحی کند؛ از انتخاب بهترین مواد تا ارائهٔ پیکربندیهایی که انتقال حرارت بین اجزای موتور را بهطور مؤثرتری انجام میدهند.
یادگیری تقویتی برای سیستمهای رانش
در زمینهٔ رانش فضایی، یادگیری تقویتی بهطور کلی به دو دسته تقسیم میشود: دستهای که در مرحلهٔ طراحی – زمانیکه مهندسان نیازهای مأموریت و توانمندیهای سیستم را تعیین میکنند – کمک میکند، و دستهای دیگر که پس از پرتاب فضاپیما، عملیات زمان واقعی را پشتیبانی میکند.
از میان مفاهیم رانشِ نوآورانه و امیدبخش، رانش هستهای قابلتوجه است که همان نیروهایی را بهکار میگیرد که بمبهای اتمی را قدرت میبخشد و خورشید را تغذیه میکند: گسستگی هستهای و همجوشی هستهای.
گسستگی هستهای با تقسیم اتمهای سنگین همچون اورانیوم یا پلوتونیوم انرژی آزاد میکند – اصل مبنایی که در اکثر رآکتورهای هستهای زمینی بهکار میرود. در مقابل، همجوشی اتمهای سبکتری مانند هیدروژن را ترکیب میکند تا انرژی بیشتری تولید کند، هرچند برای آغاز آن به شرایط بسیار شدیدتر نیاز دارد.

گسستگی هستهای فناوری پیشرفتهتری است که در برخی نمونههای رانش فضایی آزمایش شده است. حتی در فضا بهصورت ژنراتورهای ترمو الکتریکی رادیوآیزوتوپی، مانند آنهایی که انرژی سفینههای واژنر را تأمین کردند، بهکار رفته است. اما همجوشی همچنان یک مرز جذاب باقی مانده است.
رانش حرارتی هستهای میتواند روزی فضاپیماها را با هزینه کمتری نسبت به سوختسوزی ساده به مریخ و فراتر از آن برد. این فناوری فضاپیما را سریعتر از رانش الکتریکی که از گاز گرمشدهٔ شامل ذرات باردار به نام پلاسما استفاده میکند، به مقصد میرساند.
بر خلاف این سیستمها، رانش هستهای بر حرارتی که از واکنشهای اتمی تولید میشود، تکیه دارد. این حرارت به سوخت، که معمولاً هیدروژن است، منتقل میشود؛ هیدروژن در نتیجه گسترش یافته و از نازل عبور میکند تا نیروی رانش تولید کرده و فضاپیما را بهسوی جلو حرکت دهد.
نقش یادگیری تقویتی در طراحی
طراحیهای اولیهٔ رانش حرارتی هستهای از دههٔ ۱۹۶۰، مانند آنهایی که در برنامهٔ NERVA ناسا بهکار رفتهاند، از سوخت جامد اورانیومی قالبگیریشده بهصورت بلوکهای منشوری استفاده میکردند. پس از آن، مهندسان بهدنبال پیکربندیهای جایگزین بودهاند – از تختهای سرامیکی کوچک تا حلقههای شیاردار با کانالهای پیچیده.
چرا اینقدر آزمایش انجام شد؟ چون هرچه انتقال حرارت بین راکتور و هیدروژن مؤثرتر باشد، نیروی رانش بیشتری تولید میکند.
این حوزه جایی است که یادگیری تقویتی بهعنوان ابزاری اساسی ثابت شده است. بهینهسازی هندسه و جریان حرارتی بین سوخت و سوختبردار یک مسألهٔ پیچیده است که شامل متغیرهای بیشماری میشود – از خواص مواد تا میزان هیدروژنی که در هر لحظه از راکتور عبور میکند. یادگیری تقویتی میتواند این تغییرات طراحی را تجزیه و تحلیل کرده و پیکربندیهایی را شناسایی کند که بیشترین انتقال حرارت را فراهم میآورد. میتوانید آن را بهعنوان یک ترموستات هوشمند اما برای موتور موشکی تصور کنید – بهطوری که قطعاً نمیخواهید در دمای بسیار بالا به آن نزدیک شوید.
یادگیری تقویتی و فناوری همجوشی
یادگیری تقویتی همچنین نقش کلیدی در توسعه فناوری همجوشی هستهای ایفا میکند. آزمایشهای بزرگ مقیاس مانند توکاماک JT‑60SA در ژاپن، مرزهای انرژی همجوشی را پیش میبرند، اما اندازهٔ عظیم آنها برای پرواز فضایی عملی نیست. به همین دلیل پژوهشگران به بررسی طرحهای فشردهای مانند پلیول میپردازند. این دستگاههای عجیب شبیه مکعبهای توخالی هستند که ابعاد آنها حدود چند اینچ است و پلاسما را در میدانهای مغناطیسی محصور میکنند تا شرایط لازم برای همجوشی را فراهم آورند.
کنترل میدانهای مغناطیسی درون پلیول کار سادهای نیست. این میدانها باید بهقدری قوی باشند که اتمهای هیدروژن را تا زمان همجوشی به همانطور بهگردانند – فرایندی که برای شروع به انرژی عظیم نیاز دارد اما پس از راهاندازی میتواند خودپایدار شود. غلبه بر این چالش برای مقیاسپذیری این فناوری در رانش حرارتی هستهای ضروری است.
یادگیری تقویتی و تولید انرژی
با این حال، نقش یادگیری تقویتی به پایان طراحی محدود نمیشود. این روش میتواند در مدیریت مصرف سوخت کمک کند – کاری حیاتی برای مأموریتهایی که باید در حین پرواز بهسرعت انطباق یابند. در صنعت فضایی امروز، علاقه به فضاپیماهایی که میتوانند بسته به نیازهای مأموریت و تغییرات اولویتها در طول زمان نقشهای متفاوتی ایفا کنند، در حال رشد است.
بهعنوان مثال، برنامههای نظامی باید بهسرعت به تغییرات ژئوپولیتیکی واکنش نشان دهند. نمونهای از فناوریای که به این تغییرات سریع سازگار میشود، ماهواره LM400 شرکت لاکهید مارتین است که قابلیتهای متنوعی از جمله هشدار موشکی یا سنجش از دور دارد.
اما این انعطافپذیری، عدم قطعیت ایجاد میکند. یک مأموریت چقدر سوخت نیاز دارد؟ و چه زمانی به آن نیاز خواهد داشت؟ یادگیری تقویتی میتواند در این محاسبات کمک کند.
از دوچرخه تا موشک، یادگیری از طریق تجربه – چه انسانی باشد چه ماشینی – آیندهٔ کاوش فضایی را شکل میدهد. همانطور که دانشمندان مرزهای رانش و هوش را پیش میبرند، هوش مصنوعی نقش فزایندهای در سفرهای فضایی ایفا میکند. این میتواند به دانشمندان کمک کند تا درون و فراتر از سامانهٔ خورشیدی ما کاوش کنند و درهای کشفیات جدید را باز کند.