گوگل از جدیدترین مدل هوش مصنوعی متن باز خود با نام Gemma 3 رونمایی کرد

گوگل امروز از Gemma 3، جدیدترین مدل متنباز هوش مصنوعی خود، رونمایی کرد. این مدل که ادامهدهنده مسیر مدلهای پیشین این شرکت به نام Gemma1 و ۲ محسوب میشود، به گونهای طراحی شده که عملکرد پیشرفته و بهینهسازیشده را روی دستگاههای معمولی، حتی گوشیهای هوشمند به اجرا بگذارد. گوگل میگوید این مدل براساس ارزیابیهای اولیه انسانی از Llama-405B و همچنین مدلهای پیشرفتهای همچون DeepSeek-V3 و o3-mini عملکرد بهتری را به نمایش گذاشته است.
به گزارش پیوست، گوگل در پست وبلاگی خود میگوید این مدل پیشرفتهترین مدل باز توسعه یافته توسط این شرکت است که قابل حمل و مسئولانه توسعه یافته است. توسعهدهندگان با استفاده از Gemma 3 میتوانند به توسعه اپلیکیشنهای هوش مصنوعی بپردازند و این مدل در ابعاد 1B، 4B، 12B و 27B قابل استفاده است که گزینههای متنوعی را براساس سختافزار و عملکرد مورد نیاز در اختیار کاربران و توسعه دهندگان میگذارد.


ویژگیهای کلیدی مدل Gemma 3
- بهینهسازی برای پردازش سریع: این مدل بهعنوان بهترین مدل تکشتابدهنده جهان شناخته شده و در ارزیابیهای اولیه انسانی در LMArena از مدلهای Llama-405B، DeepSeek-V3 و o3-mini عملکرد بهتری را به ثبت رسانده است.
- پشتیبانی از زبانهای متنوع: این مدل از بیش از ۳۵ زبان را بهصورت پیشفرض پشتیبانی میکند و پشیتبانی پیش آموزش مربوط به ۱۴۰ زبان را نیز در خود دارد.
- توانمندیهای پیشرفته متنی و قابلیتهای استدلال دیداری: این مدل امکان توسعه اپلیکیشنهایی با قابلیت تحلیل متن، تصاویر و ویدیوهای کوتاه را برای توسعهدهندگان فراهم میکند و کاربردهای متعددی برای اپلیکیشنهای مبتنی بر Gemma 3 ممکن خواهد بود.
- پشتیبانی از وظایف پیچیده با پنجره محتوایی گسترده: Gemma 3 از یک پنجره محتوایی ۱۲۸ هزار توکنی پشیتبانی میکند که امکان پردازش و درک حجم زیادی از اطلاعات را برای اپلیکیشن فراهم میسازد.
- افزایش دقت با مدلهای کوانتیزهشده: نسخههای کوانتیزهشده (quantized) این مدل، با وجود کاهش اندازه مدل و بهینهسازی مصرف منابع پردازشی، خللی در دقت مدل ایجاد نمیکنند.
- پشتیبانی از Function Calling یا فراخوانی توابع: مدل جدید گوگل از قابلیت فراخوانی توابع و خروجیهای ساختاریافته پشیتبانی میکند که به توسعه دهندگان اجازه میدهد وظایف خودکار و تجربههای عاملیتی را توسعه و ارائه دهند.
تمرکز بر ایمنی و توسعه مسئولانه
گوگل میگوید مدل Gemma 3 با استانداردهای ایمنی دقیق توسعه یافته است. گوگل با تاکید بر ایجاد تعادلی میان نوآوری و امنیت، تصرحی میکند که در توسعه این به حاکمیت داده، همسویی با سیاستهای امنیتی از طریق یادگیری تقویتی و ارزیابی دقیق متعهد بوده است.
این مدل همچنین در برگیرنده ShieldGemma 2 ، ابزاری برای تشخیص ایمنی تصویر است که میتواند محتوای خطرناک، خشونتآمیز و جنسی را شناسایی کند. گوگل تأکید دارد که در طول توسعه این مدل، ارزیابیهای گستردهای را برای کاهش خطر سواستفاده به انجام رسانده است.
ادغام آسان با ابزارهای موجود
گوگل میگوید مدل Gemma 3 این امکان را دارد که با ابزارهای مختلف توسعه از جمله Hugging Face، PyTorch، JAX، Google AI Edge و Kaggle همخوانی دارند و همچنین برای استفاده بهتر از پردازندههای گرافیکی شرکت انویدیا بهینهسازی شدهاند.
همچنین، از طریق Google AI Studio میتوان بدون نیاز به تنظیمات پیچیده، این مدل را آزمایش و اجرا کرد.
گوگل علاوه بر این به توسعهدهندگان و محققان اجازه میدهد تا با استفاده از Gemma 3 مدلهای جدیدی را برای پژوهشهای آکادمیک و حتی استفاده تجاری توسعه دهند. همچنین، برنامه تحقیقاتی Gemma 3 Academic که از سوی گوگل راهاندازی شده است، برای پژوهش مبتنی بر Gemma 3، ۱۰ هزار دلار اعتبار Google Cloude را در اختیار محققان میگذارد.
منبع




