مارتک: متا، شرکت مادر فیسبوک، به تازگی و همزمان با کنفرانس مایکروسافت اینسپایر، از مدل جدید هوش مصنوعی مولد خود به نام LLaMA 2 رونمایی کرد. الگوی زبانی بزرگی مبتنی بر هوش مصنوعیِ متا، نه تنها اکنون در دسترس است، بلکه منبعیباز و رایگان برای استفاده تجاری خواهد بود. این در حالی است که مدل نخستین این ابزار با نام LLaMA تنها برای اهداف تحقیقاتی در دسترس بود.
انتشار این خبر، همراه با پشتیبانی کامل مایکروسافت از LLaMA 2، به این معنا است که دنیای هوش مصنوعی مولد، در آستانه تغییر بزرگی قرار دارد. بنا به گزارش وبسایت venturebeat.com، اکنون بسیاری از شرکتهایی که برای پذیرش و بهرهبرداری از امکانات هوش مصنوعی عجله دارند، گزینه جذاب دیگری پیشروی خود دارند که برخلافChatGPT Plus ، رهبر و رقیب هوش مصنوعی با منبعباز، کاملا رایگان است.
شایعات پیرامون انتشار نسخه جدیدی از LLaMA دستکم یک ماه است که به گوش میرسد؛ چرا که پیش از این سناتورهای آمریکایی، شرکت متا را در مورد در دسترس بودن مدل هوش مصنوعی آن زیر سوال برده بودند.
اولین نسخه از LLaMA برای دانشگاهیان و محققان دارای مجوز پژوهشی در دسترس بود. با این حال، شایعاتی که ازLLaMA به بیرون درز کرد، باعث ایجاد بحثهایی شد که در نهایت به تحقیقات دولتی رسید. انتشار LLaMA 2 از سوی متا، بحثهای قبلی را به عقب رانده و عرضه مدلی قدرتمندتر که در دسترستر از مدل قبلی است، به طور بالقوه چشمانداز الگوهای زبانی بزرگ هوش مصنوعی را دگرگون میکند. مدل LLaMA 2 در پلتفرم هوش مصنوعی مایکروسافت آژور در دسترس است. نکته قابلتوجه اینکه آژور همچنین خانه اصلی OpenAI و خانواده GPT-3/GPT-4 LLM هم هست. همچنین شرکت مایکروسافت هم در شرکت سابق متا فیسبوک و هم در OpenAI سرمایهگذاری کرده است.
مارک زاکربرگ، بنیانگذار و مدیرعامل متا، به طور خاص از منبعباز بودن LLaMA استقبال کرده است. زاکربرگ در بیانیهای خاطرنشان کرد که متا سابقه طولانی در زمینه ابزارهای منبعباز دارد و اقدامات قابلتوجهی به ویژه در زمینه هوش مصنوعی با چارچوب یادگیری ماشین PyTorch انجام داده است. زاکربرگ همچنین گفت: «OpenAI باعث نوآوری میشود، زیرا توسعهدهندگان بیشتری را قادر میسازد تا با فناوری جدید همگام و همسو شوند.
همچنین منعباز بودن این ابزار، ایمنی و امنیت را بهبود میبخشد، زیرا وقتی نرمافزار متنباز است، افراد بیشتری میتوانند آن را برای شناسایی و رفع مشکلات احتمالی بررسی کنند. معتقدم که اگر اکوسیستم بازتر بود، پیشرفت بیشتری را شاهد بودیم. به همین دلیل است که ما Llama 2 را منبعباز میکنیم.» یان لیکان، معاون و دانشمند ارشد هوش مصنوعی در متا نیز افزود: « ورود LLaMA 2 اتفاق بسیار بزرگی است. ارائه مجوز برای استفاده تجاری از این ابزار، چشمانداز بازار LLM را از اساس دگرگون میکند. »
اولین مدل از LLaMA در ماه فوریه توسط متا به عنوان یک مدل 65 میلیارد پارامتری ارائه شد که قادر به انجام طیف وسیعی از وظایف متداول هوش مصنوعی مولد است. در مقابل LLaMA 2 دارای مدلهایی با 7، 13 و 70 میلیارد پارامتر است. متا ادعا میکند که مدلهای از پیش آموزشدیده روی یک مجموعه داده عظیم آموزش داده شدهاند که 40 درصد بزرگتر از نمونه مورد استفاده برای LLaMA 1 بوده است. با توجه به معیارهای ارائه شده از سوی متا،LLaMA نه تنها روی دادههای بیشتر آموزش دیده است، بلکه با پارامترهای بیشتر، این مدل نیز بهتر از مدل قبلی خود عمل میکند.
در LLaMA 2 همهچیز مبتنی بر قدرت پردازشی نیست، بلکه امنیت دادهها نیز فاکتور مهمی در استفاده از این ابزار است. برای استفاده از این ابزار، ابتدا آموزشهایی با دادههای در دسترس عموم انجام میشود. سپس مدل طراحی شده یک سری مراحل تنظیم دقیق نظارت شده (SFT) را طی میکند. سپس LLaMA 2 از یک چرخه یادگیری تقویتی از بازخورد انسانی (RLHF) برای ارتقا درجه ایمنی بهره میبرد. مقاله تحقیقاتی متا در مورد LLaMA 2 جزئیات جامعی را در مورد گامهای جامع برداشته شده برای کمک به امنیت بیشتر و محدود کردن سوگیری احتمالی ارائه میدهد.
در این مقاله آمده است: «درک آنچه در دادههای پیشآموزشی وجود دارد، هم برای افزایش شفافیت و هم برای روشن کردن علل ریشهای مسائل احتمالی پاییندستی، مانند سوگیریهای بالقوه، اهمیت دارد.»