جنگ هوش مصنوعی وارد مرحله جدید شد: نبرد بر سر حافظه

نگاهها در رقابت جهانی هوش مصنوعی، به سمت سختافزار است؛ از رقابت بر سر GPUهای پیشرفته گرفته تا سرمایهگذاریهای چندمیلیارددلاری برای ساخت دیتاسنترهای عظیم. اما در این میان، یک فرض کمتر به چالش کشیده شده است و آن اینکه افزایش قدرت پردازشی، تنها مسیر پاسخ به رشد تقاضای هوش مصنوعی است.
استارتآپ رادیکسآرک (RadixArk) دقیقاً همین فرض را هدف گرفته است. این شرکت که بهتازگی در یک دور سرمایهگذاری اولیه ۱۰۰ میلیون دلار جذب کرده و به ارزشگذاری ۴۰۰ میلیون دلاری رسیده، بهجای ساخت چیپهای جدید، سراغ بهینهسازی استفاده از همان منابع موجود رفته است. رویکردی که در شرایط کمبود جهانی GPU، به یک ضرورت تبدیل شده است.
بحران پنهان: حافظه، نه محاسبه
بحث اصلی در زیرساخت هوش مصنوعی، اغلب حول قدرت محاسباتی میچرخد، اما واقعیت فنی پیچیدهتر است. مدلهای زبانی بزرگ برای پاسخگویی سریع، به تکنیکی به نام KV cache متکی هستند؛ روشی برای ذخیره محاسبات قبلی تا از تکرار آنها جلوگیری شود. این تکنیک اگرچه سرعت را افزایش میدهد، اما هزینه مصرف شدید حافظه را دارد.
در عمل، این یعنی حتی اگر پردازندهها قدرتمند باشند، محدودیت حافظه میتواند کل سیستم را کند یا پرهزینه کند. به بیان دیگر، گلوگاه واقعی از «compute» به «memory» منتقل شده است.
راهحل RadixArk: حذف محاسبات تکراری
محصول اصلی این شرکت، موتور متنبازی به نام SGLang است؛ لایهای میانی بین مدل و سختافزار که تلاش میکند اجرای مدلها را کارآمدتر کند. ایده اصلی ساده اما اثرگذار است: چرا باید بخشهایی از یک درخواست که قبلاً پردازش شدهاند، دوباره محاسبه شوند؟

رادیکسآرک با استفاده از ساختاری به نام Radix tree، دادههای مربوط به KV cache را سازماندهی میکند و درخواستهای جدید را با دادههای قبلی تطبیق میدهد. اگر شباهتی وجود داشته باشد، سیستم آن بخش را نادیده میگیرد و مستقیماً به ادامه پردازش میرود. نتیجه، کاهش محسوس مصرف منابع و هزینه است.
این رویکرد را میتوان نوعی «کشینگ پیشرفته» دانست، اما در مقیاسی که مستقیماً بر اقتصاد اجرای مدلهای هوش مصنوعی تأثیر میگذارد.
تغییر زمین بازی: از مقیاسپذیری سختافزار به بهرهوری نرمافزار
سرمایهگذاران این استارتاپ از جمله Accel و بازوی سرمایهگذاری انویدیا، روی یک گزاره کلیدی شرطبندی کردهاند و آن این است که در شرایطی که عرضه سختافزار محدود است، برنده کسی است که بتواند از هر واحد منابع، بیشترین خروجی را بگیرد.
این تغییر زاویه، یادآور دورههایی در تاریخ فناوری است که بهینهسازی نرمافزاری، جایگزین توسعه سختافزار شده است. اگر این روند در AI هم تثبیت شود، میتواند توازن قدرت را از تولیدکنندگان چیپ به توسعهدهندگان زیرساخت نرمافزاری تغییر دهد.
از استنتاج تا آموزش: جاهطلبی فراتر از یک لایه
رادیکسآرک فعلاً روی بهینهسازی مرحله استنتاج تمرکز دارد بخشی که مستقیماً با هزینههای عملیاتی سرویسهای AI در ارتباط است. اما برنامههای اعلامشده شرکت نشان میدهد که این تنها نقطه شروع است. هدف نهایی، ورود به لایه آموزش مدلها و تبدیل شدن به یک پلتفرم کامل برای تولید و اجرای مدلهای هوش مصنوعی است.
این یعنی رقابت بالقوه با بازیگرانی که امروز در دو سر طیف فعالیت میکنند، از ارائهدهندگان زیرساخت گرفته تا توسعهدهندگان مدل.
اگر فرض RadixArk درست باشد، یعنی مسئله اصلی AI دیگر کمبود GPU نیست، بلکه اتلاف منابع است. در چنین سناریویی، شرکتهایی که صرفاً بر توسعه سختافزار تکیه کردهاند، با یک تهدید جدی مواجه میشوند، کاهش مزیت رقابتی در برابر راهکارهای نرمافزاری که همان کار را با هزینه کمتر انجام میدهند.
منبع: wsj
منبع





