شرکت OpenAI در حال انتشار یک مدل منبع باز هوش مصنوعی

فروردین ۱۸, ۱۴۰۴

این هفته، OpenAI گفت که قصد دارد یک مدل زبان متن باز را برای اولین بار پس از سال‌ها منتشر کند.

خالق ChatGPT این خبر را از طریق فرم درخواست بازخورد برای این استراتژی فاش کرد و گفت که می‌خواهد از توسعه‌دهندگان، محققان و مردم بخواهد تا به آن کمک کنند تا «این مدل را تا حد امکان مفید باشد.

طبق گفته OpenAI، این مدل منبع باز «در ماه‌های آینده» عرضه خواهد شد.

اولین مدل منبع باز هوش مصنوعی OpenAI

اولین مدل منبع باز هوش مصنوعی OpenAI

OpenAI گفت آخرین باری که یک مدل منبع باز منتشر کرد برای GPT-2 LLM در سال 2019 بود. راه اندازی جدید در GPT-4.5 است.

این شرکت تصمیم گرفت مدل‌های خود را پس از سرمایه‌گذاری 1 میلیارد دلاری مایکروسافت در این استارت آپ، به عنوان بخشی از یک همکاری چند ساله برای پیشبرد توسعه مدل هوش مصنوعی (AI) انحصاری کند.

مایکروسافت تا به امروز بیش از 13 میلیارد دلار در OpenAI سرمایه گذاری کرده و مدل‌های OpenAI منحصر به مشتریان خدمات ابری Azure مایکروسافت است. OpenAI همچنین تنها از Azure برای نیازهای رایانش ابری خود استفاده کرد، اما این اتفاق در ژانویه 2025 به پایان می‌رسد. در شش سال گذشته، OpenAI مدل‌های زبان بزرگ خود را بسته نگه داشته است، از GPT-3 تا آخرین مدل GPT-4.5 و همچنین برای مدل‌های o1 و o3.

تصمیم OpenAI در حالی اتخاذ می‌شود که مدل‌های منبع باز مانند Meta’s Llama، Mistral’s LLM و DeepSeek محبوبیت پیدا کرده‌اند. در ماه مارس، مارک زاکربرگ، مدیر عامل متا در Threads گفت که Llama یک میلیارد بار دانلود شده است. Llama در سال 2023 راه اندازی شد. متا در یک پست وبلاگی گفت: هوش مصنوعی منبع باز برای اطمینان از دسترسی مردم در همه جا به مزایای هوش مصنوعی بسیار مهم است.

این غول رسانه های اجتماعی گفت Spotify یکی از شرکت‌هایی است که از Llama برای ارائه توصیه‌های سفارشی آهنگ‌ها، هنرمندان، پادکست‌ها یا کتاب‌های صوتی جدید به شنوندگان خود استفاده کرده است.

استارت‌آپ چینی هوش مصنوعی DeepSeek، که مدل‌های منبع باز ارزان آن توجه سیلیکون ولی را در ژانویه به خود جلب کرد، بنا به گزارش‌ها مجبور شد دسترسی API را به دلیل افزایش تقاضا را محدود کند. سه شرکت بزرگ ابری – AWS، Microsoft Azure و Google Cloud – همگی مدل استدلال R1 DeepSeek را برای استفاده توسط مشتریان به پلتفرم‌های خود اضافه کرده‌اند.

پس از محبوبیت DeepSeek، سام آلتمن، مدیر عامل OpenAI، در اواخر ژانویه گفت که این استارتاپ باید «استراتژی منبع باز متفاوتی را در طی یک انجمن اجتماعی با کاربران Reddit تعیین کند».

غول‌های فناوری چینی مدل‌های هوش مصنوعی را پس از DeepSeek راه‌اندازی کردند

غول‌های فناوری چینی مدل‌های هوش مصنوعی را پس از DeepSeek راه‌اندازی کردند

به دنبال محبوبیت DeepSeek، غول‌های فناوری چینی نسخه‌های به روز شده مدل‌های هوش مصنوعی خود را – همه در ماه مارس – منتشر کردند. Alibaba Cloud مدل چندوجهی Qwenb 2.5-Omni-7B خود را منتشر کرد که می‌تواند متن، تصاویر، صدا و ویدئو را پردازش کند و در عین حال متن و پاسخ‌های گفتاری طبیعی را در زمان واقعی تولید کند.

علی بابا گفت که عملکرد این مدل “بی نظیر” است و به عنوان منبع باز در Hugging Face و GitHub در دسترس است. این مدل بخشی از مدل‌های بنیادی خانواده Qwen علی بابا است.

بایدو دو مدل هوش مصنوعی جدید منتشر کرد: یک مدل بومی چند وجهی به نام Ernie 4.5 و یک مدل استدلالی «عمیق فکر» به نام Ernie X1. بایدو گفت که این مدل‌ها «قابلیت‌های پیشرفته‌تری را با قیمتی در دسترس‌تر ارائه می‌کنند». این شرکت گفت که Ernie 4.5 در ژوئن امسال به صورت متن باز عرضه خواهد شد اما برنامه‌ای برای X1 فاش نکرد.

به گزارش ساوت چاینا مورنینگ پست، تنسنت از مدل استدلالی Hunyuan T1 خود رونمایی کرد که ظاهراً از نظر عملکرد و قیمت رقیب DeepSeek است. استارت‌آپ AI Manus به دلیل عامل هوش مصنوعی خود که می‌تواند وظایف عمومی را به جای یک مهارت خاص انجام دهد، به صورت ویروسی منتشر شد. مدل پایه‌ای را معرفی نکرد، بلکه از LLM‌های دیگران مانند Anthropic’s Claude برای نیرو بخشیدن به مدل خود استفاده می‌کند.

منبع : pymnts

سایر مطالب مرتبط

فهرست مطالب