این هفته، OpenAI گفت که قصد دارد یک مدل زبان متن باز را برای اولین بار پس از سالها منتشر کند.
خالق ChatGPT این خبر را از طریق فرم درخواست بازخورد برای این استراتژی فاش کرد و گفت که میخواهد از توسعهدهندگان، محققان و مردم بخواهد تا به آن کمک کنند تا «این مدل را تا حد امکان مفید باشد.
طبق گفته OpenAI، این مدل منبع باز «در ماههای آینده» عرضه خواهد شد.
اولین مدل منبع باز هوش مصنوعی OpenAI
OpenAI گفت آخرین باری که یک مدل منبع باز منتشر کرد برای GPT-2 LLM در سال 2019 بود. راه اندازی جدید در GPT-4.5 است.
این شرکت تصمیم گرفت مدلهای خود را پس از سرمایهگذاری 1 میلیارد دلاری مایکروسافت در این استارت آپ، به عنوان بخشی از یک همکاری چند ساله برای پیشبرد توسعه مدل هوش مصنوعی (AI) انحصاری کند.
مایکروسافت تا به امروز بیش از 13 میلیارد دلار در OpenAI سرمایه گذاری کرده و مدلهای OpenAI منحصر به مشتریان خدمات ابری Azure مایکروسافت است. OpenAI همچنین تنها از Azure برای نیازهای رایانش ابری خود استفاده کرد، اما این اتفاق در ژانویه 2025 به پایان میرسد. در شش سال گذشته، OpenAI مدلهای زبان بزرگ خود را بسته نگه داشته است، از GPT-3 تا آخرین مدل GPT-4.5 و همچنین برای مدلهای o1 و o3.
تصمیم OpenAI در حالی اتخاذ میشود که مدلهای منبع باز مانند Meta’s Llama، Mistral’s LLM و DeepSeek محبوبیت پیدا کردهاند. در ماه مارس، مارک زاکربرگ، مدیر عامل متا در Threads گفت که Llama یک میلیارد بار دانلود شده است. Llama در سال 2023 راه اندازی شد. متا در یک پست وبلاگی گفت: هوش مصنوعی منبع باز برای اطمینان از دسترسی مردم در همه جا به مزایای هوش مصنوعی بسیار مهم است.
این غول رسانه های اجتماعی گفت Spotify یکی از شرکتهایی است که از Llama برای ارائه توصیههای سفارشی آهنگها، هنرمندان، پادکستها یا کتابهای صوتی جدید به شنوندگان خود استفاده کرده است.
استارتآپ چینی هوش مصنوعی DeepSeek، که مدلهای منبع باز ارزان آن توجه سیلیکون ولی را در ژانویه به خود جلب کرد، بنا به گزارشها مجبور شد دسترسی API را به دلیل افزایش تقاضا را محدود کند. سه شرکت بزرگ ابری – AWS، Microsoft Azure و Google Cloud – همگی مدل استدلال R1 DeepSeek را برای استفاده توسط مشتریان به پلتفرمهای خود اضافه کردهاند.
پس از محبوبیت DeepSeek، سام آلتمن، مدیر عامل OpenAI، در اواخر ژانویه گفت که این استارتاپ باید «استراتژی منبع باز متفاوتی را در طی یک انجمن اجتماعی با کاربران Reddit تعیین کند».
غولهای فناوری چینی مدلهای هوش مصنوعی را پس از DeepSeek راهاندازی کردند
به دنبال محبوبیت DeepSeek، غولهای فناوری چینی نسخههای به روز شده مدلهای هوش مصنوعی خود را – همه در ماه مارس – منتشر کردند. Alibaba Cloud مدل چندوجهی Qwenb 2.5-Omni-7B خود را منتشر کرد که میتواند متن، تصاویر، صدا و ویدئو را پردازش کند و در عین حال متن و پاسخهای گفتاری طبیعی را در زمان واقعی تولید کند.
علی بابا گفت که عملکرد این مدل “بی نظیر” است و به عنوان منبع باز در Hugging Face و GitHub در دسترس است. این مدل بخشی از مدلهای بنیادی خانواده Qwen علی بابا است.
بایدو دو مدل هوش مصنوعی جدید منتشر کرد: یک مدل بومی چند وجهی به نام Ernie 4.5 و یک مدل استدلالی «عمیق فکر» به نام Ernie X1. بایدو گفت که این مدلها «قابلیتهای پیشرفتهتری را با قیمتی در دسترستر ارائه میکنند». این شرکت گفت که Ernie 4.5 در ژوئن امسال به صورت متن باز عرضه خواهد شد اما برنامهای برای X1 فاش نکرد.
به گزارش ساوت چاینا مورنینگ پست، تنسنت از مدل استدلالی Hunyuan T1 خود رونمایی کرد که ظاهراً از نظر عملکرد و قیمت رقیب DeepSeek است. استارتآپ AI Manus به دلیل عامل هوش مصنوعی خود که میتواند وظایف عمومی را به جای یک مهارت خاص انجام دهد، به صورت ویروسی منتشر شد. مدل پایهای را معرفی نکرد، بلکه از LLMهای دیگران مانند Anthropic’s Claude برای نیرو بخشیدن به مدل خود استفاده میکند.
منبع : pymnts