در نشست هم‌اندیشی متخصصان مدل‌های زبانی بزرگ فارسی بررسی شد

لزوم مشارکت و جایابی صحیح بازیگران حاکمیتی، خصوصی و دانشگاهی در توسعه مدل‌های زبانی فارسی

با حضور 35 شرکت‌ و استاد دانشگاه و برخی مدیران دولتی فعال در حوزه مدل‌های زبانی بزرگ(LLM)، سومین نشست هم‌اندیشی متخصصان توسعه مدل‌های زبانی بزرگ فارسی به همت کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانه‌ای و به میزبانی پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد. در این نشست وضعیت جاری توسعه مدل‌های زبانی بزرگ در کشور و خلاء‌های موجود مورد و در خصوص تعامل و همکاری میان شرکت‌ها و دانشگاه‌ها و نحوه صحیح حمایت بخش حاکمیتی و دولتی از این فعالیت‌ها بحث و تبادل نظر شد.

به گزارش روابط‌عمومی سازمان نظام صنفی رایانه‌ای استان تهران، نشست هم‌اندیشی متخصصان مدل‌های زبانی بزرگ فارسی از ساعت ۸ الی ۱۲ روز دوشنبه ۱۸ دی‌ماه ۱۴۰۲ به میزبانی پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد. این نشست به عنوان سومین نشست از مجموعه نشست‌های هم‌اندیشی در حوزه مدل‌های زبانی بزرگ (LLM) فارسی شناخته می‌شود که از سوی کمیسیون هوش مصنوعی و علم‌داده سازمان نظام صنفی رایانه‌ای برگزار شده است. در این نشست مدیران ۳۵ شرکت و اساتیدی از دانشگاه‌های تهران، شهید بهشتی، امیرکبیر و شریف به همراه رضوی‌زاده، ریاست پژوهشگاه ارتباطات و فناوری اطلاعات، بوربور ریاست مرکز فراداده مرکز ملی فضای مجازی، بکایی مدیر مرکزنوآوری و توسعه هوش مصنوعی پژوهشگاه ارتباطات و فناوری اطلاعات و معین، مشاور پژوهشگاه در حوزه هوش مصنوعی حضور داشتند.

در ابتدای این نشست محمدرضا معبودیان رئیس کمیسیون هوش مصنوعی و علم‌داده سازمان نظام صنفی رایانه‌ای استان تهران گزارشی از دو جلسه قبلی برگزار شده در این حوزه ارایه کردند و عنوان داشتند که در دو جلسه قبلی موضوعات عمومی حوزه مدل‌های زبانی بزرگ از سوی بخش زیادی از فعالین این حوزه مطرح شده است. در ادامه سید محمد محمدزاده ضیابری دبیر کمیسیون هوش مصنوعی و علم‌داده در خصوص دلیل برگزاری این نشست اظهار داشت که دو نشست قبلی بیشتر به جنبه‌های عمومی و بیان مشکلات اختصاص داشت اما در این جلسه قرار است فعالین با همدیگر صحبت فنی کنند تا مشخص شود که در کجای مسیر قرار داریم و هر تیمی چه پیشرفت‌هایی داشته و چگونه می‌توانیم هم‌افزایی کنیم.

در ادامه این نشست برخی از شرکت‌هایی که تاکنون در خصوص توسعه LLM فارسی موفقیت‌هایی داشته‌اند وضعیت توسعه خود را تشریح کردند. در این زمینه آقای بهیاد از مجموعه خودنویس عنوان داشتند که تاکنون با بهره‌گیری از حمایت‌های مادی اخذ شده از گوگل، آمازون و مایکروسافت توانسته‌اند دو مدل زبانی بزرگ فارسی و استونیایی را از ابتدا آموزش داده (From Scratch Training) و در 6 نوبت آموزش مداوم ( Continual pre-Trainedیا Fine-Tune) کرده‌اند و در همین راستا پیکره زبانی بزرگی برای فارسی به حجم ۴۵۰ گیگابایت نیز ایجاد کرده‌اند.

آقای سلطان‌علیزاده از شرکت پارت و به عنوان یکی از اعضای گروه مشارکت توسعه مدل‌های زبانی بزرگ فارسی در خصوص فعالیت‌های انجام شده، به موضوع فرایندهای طی شده و چالش‌ها پرداختند و انواع راه‌کارهای آموزش و ارزیابی مدل‌ها و موضوعات مربوط به پوشش حوزه‌های مختلف داده‌ای را مطرح کردند. در حال حاضر گروه مشارکت توسعه مدل‌های زبانی بزرگ فارسی با بهره‌گیری از پیکره‌ای به بزرگی بیش از یک ترابایت در حوزه‌های مختلف اعم از خبری، وبلاگ، ادبیات، انجمن گفتگو، شبکه‌های اجتماعی و غیره در حال آموزش چند مدل زبانی بزرگ است. ایشان در خصوص برخی ادعاها در حوزه توسعه مدل‌های زبانی بزرگ عنوان داشتند که لازم است سطح آموزش و به‌سازی مدل‌ها را مشخص کنیم و هر نوع آموزشی (تنظیم دستورالعمل -Instruction Tuning و تنظیم وظایف- Task Tuning) را نمی‌توان به عنوان آموزش مدل زبانی بزرگ(آموزش از ابتدا - From Scratch Training و آموزش مداوم- Continual pre-Trained) در نظر گرفت. ایشان در عین حال به مباحث متن‌باز اشاره کردند و عنوان داشتند که لازم است تا الزامات متن‌باز با توجه به نبود زیرساخت‌های قانونی آن در ایران را بررسی کنیم. همچنین ایشان نسبت برخی از اقدامات ساده در حوزه ارزیابی مدل‌های زبانی بزرگ که بر اساس فقط ترجمه یک مجموعه دادگان انگیسی به فارسی، انجام می‌شود، ابراز تردید کرده و خواهان انجام فرآیندهای تست و ارزیابی دقیق‌تر توسط همه ارائه‌دهندگان LLMها شدند.

بکایی از پژوهشگاه ارتباطات در خصوص خدمات آزمایشگاهی حوزه LLM و بنچمارک‌های آن به‌عنوان یکی از چالش‌های اساسی این حوزه عنوان داشتند که افراد زیادی ادعای توسعه LLM فارسی دارند اما مادام که نتوانیم ملاک‌های ارزیابی درستی را بوجود بیاوریم نمی‌توان هیچ کدام از این ادعاها را پذیرفت و حتی برخی از این ادعاها در حال ارایه بر روی ملاک‌هایی هستند که اساسا ملاک ارزیابی LLM محسوب نمی‌شوند.

آقای رحمانی از شرکت پردازشگران زبان ویرا عنوان داشت که بر روی Tune‌کردن مدل مارال به عنوان یکی از LLM‌های متن‌باز منتشرشده، کار کردند و نتیجه مناسب نگرفتند که به نظر می‌رسد دلیل آن پیکره آموزش و نحوه آموزش (فقط تنظیم دستورالعمل -Instruction Tuning) آن باشد. ایشان در عین حال به مباحث مربوط به به‌کارگیری مدل‌های زبانی در زمان استنتاج (Inference)، هزینه‌ها و پیچیدگی آن پرداختند.

خانم شمس‌فرد از دانشگاه شهید بهشتی در خصوص آزمایشگاه ارزیابی LLM و آزمایشگاه هوش مصنوعی که با حمایت معاونت علمی و فناوری ریاست جمهوری در حال ایجاد است صحبت داشتند و عنوان کردند که کیفیت دادگان آموزشی بسیار مهم است و داده‌هایی که تاکنون ایجاد شده از کیفیت مطلوبی برخوردار نیستند و لازم است تا دادگان آموزشی، حداقلی از کیفیت را داشته باشند. تیم ایشان در آزمایشگاه پیکره‌ای به بزرگی حدود ۱۵ تا ۲۰ میلیارد توکن را گردآوری کرده‌اند که در بسیاری از حوزه‌ها پوشش مناسبی دارد. در عین حال زیرساخت‌های توسعه LLM و بیش از آن زیرساخت‌های ارزیابی LLM ها را در آزمایشگاه پردازش زبان دانشگاه شهید بهشتی توسعه داده‌اند.

فیلی در تشریح فعالیت آزمایشگاه خود عنوان داشتند که دو تیم در آزمایشگاه پردازش زبان در حال کار روی LLM هستند که یک تیم در خصوص توسعه LLM فعالیت می‌کند و تیم دوم در خصوص توسعه ابزارها بر روی LLM فعالیت می کنند. ایشان اظهار داشتند که با توجه به محدودیت منابع زیرساخت پردازشی نسبت به فعالیت سایرین کارهای محدودی انجام داده‌اند و عمده فعالیت‌ها معطوف به فعالیت‌های تحقیقاتی بوده است؛ هرچند که برخی خروجی‌ها توانسته برای کاربردهای خاص نتایج مطلوبی ارایه کند. ایشان معتقد بودند که نیاز نیست در خصوص توسعه دغدغه زیرساخت داشته باشیم و مشکلات ما را تحقیقات جدید توسط خارجی‌ها برطرف خواهند کرد. دکتر فیلی در عین حال تاکید داشتند به جای فعالیت بر روی LLM ملی، باید بر روی کاربردهای آن تمرکز کنیم و خروجی تولید کنیم حتی با استفاده ازLLMهای خارجی و متن باز.

نظارات مدیرعامل شرکت رایانش سریع هزاره ایرانیان عنوان داشتند که هنوز به صورت تخصصی در حوزه LLM را شروع نکرده‌اند اما در زمینه زیرساخت‌های پردازشی فعالیت‌های خوبی داشته‌اند و سکوهایی را آماده کرده‌اند. ایشان معتقد بودند که نباید نگران تامین زیرساخت بود و زیرساخت قابل فراهم کردن است اما در عین حال گلایه داشتند که پروژه‌های تامین زیرساخت در پژوهشگاه ارتباطات متوقف شده است.

عزیزی از شرکت لایف‌وب در خصوص فعالیت‌های انجام‌شده در این شرکت عنوان داشتند که تمرکز این شرکت روی مدل‌های زبانی از خانواده BERT بوده و از زیرساخت‌های داده‌ای خودشان استفاده کردند و یک حمایت کوچک در حد ۱۰ هزار دلار هم از آمازون گرفته‌اند. مجموعه داده‌های موجود نزد لایف‌وب عمدتا از شبکه‌های اجتماعی و برنامه‌هایی نظیر دیوار و دیجی‌کالا و همینطور برخی از سایت‌های اینترنتی تشکیل شده است. حجم این داده‌ها بعد از پیش پردازش و حذف تکرارها حدود ۱۰ میلیارد توکن می‌شود.

ممتازی از دانشگاه امیرکبیر در خصوص فعالیت‌های آزمایشگاه پردازش زبان عنوان داشتند که به دلیل محدودیت منابع پردازشی عمده فعالیت‌ها معطوف به تهیه دادگان و آموزش مداوم- Fine-Tune برخی مدلها بوده است. نکته مهم در خصوص فعالیت‌های این آزمایشگاه گردآوری دادگان تاریخی و آموزشی و مقالات با حجم حدود ۱۵ میلیارد توکن بوده است.

معین از پژوهشگاه ارتباطات عنوان داشتند که وضعیت کشور در حوزه LLM نسبت به خیلی از کشورهای دیگر خوب است اما لازم است تا هم‌افزایی بین شرکت‌ها و دانشگاه‌ها شکل بگیرد و به جای کارهای پراکنده، همه با هم برای رسیدن به هدف مشترک تلاش کنند. ایشان پیشنهاد داشتند که پژوهشگاه به عنوان محور هاب توسعه LLM، و با همکاری سازمان نظام صنفی، بازیگران مختلف را گرد هم جمع کند.

شمس‌فرد در ادامه صحبت‌های معین، پیشنهاد کردند که این نشست یک بیانیه و یک جدول وضعیت به‌عنوان خروجی داشته باشد تا همگان، چه کسانی که در این جلسه حضور داشتند و چه کسانی که حضور نداشتند از وضعیت همه ارکان LLM در حوزه‌های مختلف آن آگاه شوند تا هرکس که می‌خواهد وارد این حوزه شود، بداند که کدام بخش‌ها خلاء داریم و کدام کارها به چه نتیجه‌ای رسیده است.

در ادامه نشست در خصوص میزان هزینه‌های توسعه LLM صحبت شد. در طی این صحبت‌ها آقای بهیاد از مجموعه خودنویس عنوان داشت که تاکنون در حدود ۱.۵ میلیون دلار هزینه کرده‌اند و هزینه‌های سالیانه ایشان برای آموزش مداوم(Continual pre-Trained)و آموزش از ابتدا (From Scratch Training) در حدود ۵۰۰ هزار دلار است که بخش عمده آن را از طریق حمایت‌های مادی شرکت‌های آمازون، گوگل و مایکروسافت تامین می‌کنند. او در عین حال عنوان داشتند که در این حوزه نیاز به مشاوره‌های تخصصی است که در همه حمایت‌هایی که می‌گیرند بخشی از آن صرف هزینه‌های مشاوره می‌شود.

سجادی مدیرعامل شرکت دادماتک، از دیگر اعضای گروه مشارکت توسعه مدل زبانی بزرگ فارسی در خصوص هزینه‌ها عنوان داشتند که از سوی ستاد اقتصاد دیجیتال معاونت علمی و فناوری ریاست جمهوری هزینه پردازنده برای اجاره یک کلاستر ۸تایی A100 برای مدت ۶ ماه حدود ۲.۵ میلیارد تومان هزینه شده و چهار شرکت نیز خود ماهانه حدود ۶۰۰ میلیون تومان در حال هزینه هستند. نتیجه این سرمایه‌گذاری بسیار محدود، آموزش مدل ۱۳ میلیارد پارامتر است و نسبت به سرمایه گذاری لازم، تقریبا هیچ حساب می‌شود.

سلطان‌علیزاده از شرکت پارت در ادامه موضوع بحث هزینه‌ها را به درآمدها متصل کردند و عنوان داشتند که هزینه‌های توسعه حتی با فرض بهره‌گیری از حمایت‌های مالی خارجی، بسیار بالاست و بهتر است به‌جای اینکه تیم‌های مختلف هزینه‌های مکرر و کوچک داشته باشند هزینه‌ها مدیریت شود تا مدل‌های بزرگتری توسعه یابد و شرکت‌های کوچکتر و مصرف‌کنندگان با هزینه کمتری مواجه باشند.

معبودیان عضو هیات‌مدیره شرکت مهندسی مشاور عصر فناوری دانش عنوان داشتند که محاسبه ساده نشان می‌دهد که هزینه توسعه LLM کاربردی حداقل ۵۰ میلیارد تومان در سال هزینه دارد که نیمی از آن بابت زیرساخت‌ها از سوی دولت می‌تواند تامین شود اما نیم دیگر می‌بایست توسط بخش خصوصی تامین شود و در این راستا مشارکت جمعی موجب کاهش هزینه‌ها و بهره‌گیری مناسب با درنظر گرفتن بحث بازگشت سرمایه می‌شود.

فیلی در خصوص بازگشت سرمایه LLM عنوان داشتند که فعالیت‌های تجاری زیادی هست که می‌توانند در مقیاس بالا استفاده و درآمدزایی مناسبی ایجاد کنند. ایشان معتقد بودند که یکی از مخاطرات در توسعه LLM بومی، رقابت قیمتی با نمونه‌های خارجی خواهد بود. ایشان در عین حال نسبت به اهداف نشست در تشکیل یک گروه مشارکت بزرگ برای توسعه یک LLM عمومی تشکیک کردند و عنوان داشتند که این مسیر و توسعه یک LLM مشترک مناسب نیست. در خصوص این تشکیک آقای محمدزاده ضیابری دبیر نشست عنوان داشتند که هدف توسعه یک LLM نیست بلکه هدف جلب مشارکت جمعی جهت سرشکن‌کردن هزینه‌ فعالیت‌های تکراری و بهره‌گیری از توان جمعی برای توسعه همه مدل‌های مورد نیاز است. ضیابری اظهار داشت در کشور بارها هزینه برای تکرار تکراری‌ها صورت گرفته و این روش غلط است. باید با هم‌افزایی هزینه‌های مصروفه از بیت المال به سمت درست هدایت شده و از تلفات منابع جلوگیری کنیم.

بوربور از مرکز ملی فضای مجازی در بخش اول این نشست در خصوص رسالت مرکز ملی فضای مجازی در حمایت از تیم‌ها و پاسداری از زبان فارسی توضیحاتی دادند. ایشان عنوان داشتند که بنا بر طرح فعلی قرار است یک مسابقه با همکاری دانشگاه شریف و مجموعه کوئرا برگزار شود و در طی آن سه تیم برتر مورد حمایت قرار گرفته و در نهایت ۱۲۸ دستگاه پردازنده در اختیار یک تیم قرار خواهد گرفت.

در پایان بخش اول این نشست مشخص شد که در حال حاضر تنها ۵ مجموعه در حال توسعه و کار واقعی بر روی LLM فارسی هستند و الباقی مجموعه‌ها تنها بر روی تنظیم دستورالعمل -Instruction Tuning فعالیت داشته یا هنوز کار جدی در این زمینه انجام نداده‌اند.

در بخش دوم این نشست ابتدا محمدزاده ضیابری دبیر کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانه‌ای در خصوص تاریخچه تشکیل گروه مشارکت توسعه مدل زبانی بزرگ فارسی توضیح دادند. او اظهار داشتند که پایه‌ریزی این گروه به حدود ۲.۵ سال پیش باز می‌گردد که در آن زمان پردازنده‌های گرافیکی سیمرغ دانشگاه امیرکبیر بدون مشتری مانده بود و پیشنهاد شد که در غالب یک مشارکت بخش دولتی با خصوصی دولت هزینه اجاره پردازنده‌های گرافیکی را متقبل شده و در مقابل بخش خصوصی توان اجرایی و فنی و دادگان را تامین کند تا برخی مدل‌های ملی مورد نیاز در کشور توسعه داده شده و به صورت متن‌باز در اختیار عموم قرار گیرد. پس از فراخوان عمومی تنها ۶ طرح از ۴ مجموعه برای این مدل همکاری رسید و در نهایت قرار شد سه شرکت پردازش هوشمند ترگمان، داده‌پردازان مبتکر آکام و پژوهشگاه توسعه فناوری‌های پیشرفته خواجه‌ نصیرالدین طوسی توسعه مدل زبانی فارسی نظیر Large BERT را در دستور کار قرار دهند. طولانی‌شدن فرایند تخصیص GPU ها منجر به تغییر فناوری و ورود به عرصه انقلاب LLM ها شد و در نهایت در پاییز سال جاری گروه مشارکت مشتمل بر سه شرکت پردازش هوشمند ترگمان، داده‌پردازان مبتکر آکام و مهندسی مشاور عصر فناوری دانش کار را آغاز و از همان ابتدا شرکت پردازش اطلاعات مالی پارت نیز به این گروه مشارکت افزوده شد. در عین حال این گروه فضا را برای مشارکت سایر شرکت‌ها و دانشگاه‌ها نیز باز گذاشته و اخیرا مذاکراتی با خانم دکتر شمس‌فرد داشته تا در حوزه ارزیابی به این گروه مشارکت افزوده شوند. ایشان در ادامه در خصوص دلایلی که نیاز به مشارکت وجود دارد عنوان داشتند در همین جلسه مشخص شد که در حوزه پیکره کارهای پراکنده بسیار خوبی انجام شده که باید با هم تجمیع شوند و یک گروه مشارکت قوی می‌تواند در عین حال قدرت چانه‌زنی بیشتری هم داشته باشد و بتواند هم در حوزه زیرساخت‌های پردازشی و هم در حوزه جلب دادگان از کتابخانه ملی، و مجموعه‌هایی نظیر ISC, SID به موفقیت‌های بیشتری دست یابد و در عین حال در یک گروه مشارکت، هر تیم می‌تواند به صورت تخصصی بر روی بخشی از فعالیت‌ها متمرکز شده و از پراکندگی و تلفات توان تیم‌ها در انجام کارهای تکراری جلوگیری شود. ضیابری عنوان داشت بحث اصلی ما اتحاد رقبا است و باید بتوانیم در عین رقابت در حوزه تجاری با هم مشارکت کنیم تا نفع جمعی ببریم. برای این موضوع لازم است تا در مورد فرایندها و مدل‌های همکاری صحبت کنیم و حدود و ثغور آن را تعیین کنیم.

شمس‌فرد در خصوص پیشنهادشان برای جدول وضعیت و بیانیه عنوان داشتند که لازم است تا یک هیئت رهبری (Leader Board) ایجاد شود که در آن وضعیت اجزای مختلف به دقت ثبت و به‌روزرسانی شود. ایشان عنوان داشتند که انواع مشارکت در این جدول را می‌توان به چهار نوع تقسیم کنیم گروه اول کسانی که به صورت آزاد و متن‌باز دستاوردها را ارایه می‌کنند. گروه دوم کسانی که صرفا دستاوردهای خود را در اختیار نهاد ارزیاب قرار می‌دهند، گروه سوم کسانی که حاضرند ارزیابی شوند اما خودشان با استفاده از داده‌های ارزیابی کار را انجام دهند و گروه چهارم که صرفا اطلاع می‌دهند و حاضر به راستی‌آزمایی و ارزیابی نیستند.

طباطبایی مدیر هوش مصنوعی ستاد کل نیروهای مسلح عنوان داشتند که لازم است یک درخت‌واره از فعالیت‌ها ایجاد کنیم و به ازای هر بخش گره این درخت مشخص کنیم که وضعیت به چه صورت است. بر مبنای این درخت‌واره می‌توان تقسیم کار و شکست پروژه انجام داده و از یک طرف از انجام کارهای تکراری جلوگیری کنیم و از طرف دیگر بتوانیم نتایج را تجمیع کنیم. ایشان همچنین عنوان داشت که لازم است تا این درخت‌واره در اختیار نهادهای حاکمیتی نظیر مرکز ملی هوش مصنوعی قرار گیرد تا در برنامه‌ریزی‌ها مورد استفاده باشد.

محمدزاده ضیابری اضافه کردند که ما نیاز داریم به حمایت نهاد حاکمیتی حداقل در حوزه زیرساخت‌ها و همچنین یک نهاد متولی باید باشد که فعالیت‌های بخش خصوصی را در مسیر نیازمندی‌های ملی هدایت کند. طبیعتا نهاد حاکمیتی بابت حمایت خود توقعاتی دارد و در حوزه‌هایی نظیر پاسداری از زبان فارسی و فرهنگ و دیانت دغدغه‌هایی دارد که به صورت طبیعی جزو دغدغه‌های بخش خصوصی به عنوان یک بنگاه تجاری نیست. بحث اصلی این است که صندلی‌های مناسب چیده شوند تا هرکس دقیقا سر جای خودش و به درستی نقش‌آفرینی کند.

دکتر شمس فرد در خصوص دخالت نهادهای حاکمیتی عنوان داشتند که این وظیفه متولی حاکمیتی است که بازیگران را بیابد و از آن‌ها حمایت کند نه اینکه خودمان سراغ نهادهای حاکمیتی برویم. آنچه تجربه شده بالاخص در حوزه سند ترویج زبان فارسی نشان داده که هرکسی در نزد حاکمیت خود را متولی می‌داند و نمی‌شود با همه آن‌ها وارد مذاکره شد.

معبودیان در این بخش عنوان داشتند که لازم است تا برای جایگیری صحیح بازیگران و متولیان وارد مدل‌های مشارکت دولت بخش خصوصی موسوم به PPP شویم تا بحث‌های تجاری و بازگشت سرمایه به خوبی تبیین شوند.

بوربور در خصوص فعالیت‌های مرکز ملی فضای مجازی در حوزه LLM توضیحاتی دادند و عنوان داشتند که چارچوب برگزاری یک مسابقه انتخاب شده و ایجاد پیکره هم به دکتر فیلی سپرده شده است. اما یک سوال مهم از سوی ریاست مرکز ملی فضای مجازی مطرح است و بی‌پاسخ مانده است. ما به عنوان نهاد حاکمیتی نمی‌توانیم تنها از برخی از تیم‌ها حمایت کنیم و مجبوریم همه را زیر چتر حمایتی قرار دهیم به همین دلیل هم سازوکار مسابقه را انتخاب کردیم. به فرض یک تیم در نهایت به برتری رسید و مثلا ۱۲۸ کارت گرافیک در اختیار آن‌ها قرار گرفت سوال این است که ما تا کی باید حمایت کنیم؟ ما دنبال سود نیستیم اما باید بدانیم نتیجه فعالیتمان چه خواهد شد؟

معبودیان در پاسخ به سوال بوربور عنوان داشتند آیا اساسا برگزاری مسابقه برای چنین کاری در این سطح، رویکرد درستی است؟ شرکت‌ها با نگاه تجاری در این نوع مسابقات شرکت نمی‌کنند چون هزینه به فایده آن به صرفه نیست. عملا شرکت‌کنندگان در اینگونه مسابقات، تیم‌های استارتاپی، نوپا و دانشجویی خواهند بود که شاید در ابتدا نتایج خوبی نشان دهند اما توان نهایی‌سازی خروجی‌ها و رسیدن به مدل‌هایی که در سطح ملی مورد نیاز است را ندارند. به نظر می‌رسد که مکانیزم توزیع امکانات از طریق مسابقه لزوما درست نیست.

بوربور عنوان داشتند که دغدغه‌های حاکمیتی پیچیده‌تر هستند و پیشنهادهای مختلفی بود که یکی از آن‌ها تشکیل یک پازل مشارکتی بود. در طی جلسات متعدد با بازیگران مختلف و با وجود اینکه شخصا با برگزاری مسابقه موافق نبودم، فشارهای خارج از اختیار ما موجب تصمیم برای برگزاری مسابقه شد. حالا تصمیم بر این شده که پیکره از طریق دانشگاه تهران تامین شود و بعد در اختیار همه شرکت‌کنندگان در مسابقه قرار بگیرد. قرار است به‌زودی فراخوان مسابقه را ارایه کنیم و تا پایان سال ۳ تیم برتر را انتخاب کنیم.

ضیابری عنوان داشتند نفس برگزاری مسابقه با چیزی که در این جلسه مبتنی بر گسترش فضای مشارکت تعریف شده، در تضاد است. بحث ما اتحاد رقبا است به نحوی که در عین رقابت، رفاقت و همکاری کنند. موضوعی که در هند به نحو احسن سرلوحه فعالیت‌های صنفی قرار گرفته و در چین و سایر نقاط دنیا هم به همینطور. اما مسابقه یعنی رقابت خالص و از دل رقابت رفاقت و همکاری شکل نمی‌گیرد.

دکتر بوربور معتقد بودند که با توجه به روحیه عدم همکاری ایرانی‌ها ممکن است تشکیل گروه‌های مشارکت و همکاری موفق نباشد و همواره برخی خارج از این همکاری مدعی باشند. ما به عنوان حاکمیت مجبوریم از همه حمایت کنیم تا شایبه وجود نداشته باشد.

منصوری رییس هیات مدیره ریزیکو عنوان داشتند استفاده از بحث مسابقه مانع خلاقیت است چرا که تیم‌های مختلف در سطوح مختلف تحقیق و توسعه هستند و پیشنهاد داشتند کمیسیون هوش مصنوعی سازمان نظام صنفی رایانه‌ای به عنوان بازوی مشورتی تصمیم‌گیری در این حوزه مورد استفاده قرار گیرد.

سلطان‌علیزاده در خصوص چالش‌های برگزاری مسابقه و انتخاب تیم‌های مناسب برای مراحل بعدی مطالبی مطرح کردند و عنوان داشتند که تیمی که یک مدل کوچک را به بهترین وجه پیاده‌سازی کند لزوما توانایی پیاده‌سازی مدل‌های واقعی و بزرگ و بهره‌برداری از زیرساخت‌های اساسی را نخواهد داشت. همچنین ایشان ابراز داشتند که برای مراحل اولیه مسابقه، چه منابع پردازشی برای حاضرین در مسابقه فراهم خواهد شد و بدون ارائه زیر ساخت به همه تیم ها، فرایند ارزیابی ها و داورهای دارای اشکال خواهد بود.

دکتر سجادی در خصوص اینکه قرار بود در این جلسه در خصوص مباحث حاکمیتی صحبت نشود مطالبی ایراد کردند و عنوان داشتند که لازم است تا ابتدا مسایل داخلی خودمان را در راستای همکاری حل کنیم و حواسمان باشد که وارد بازی‌های حاکمیتی نشویم. در این جلسه نتیجه گرفتیم که همه متفق‌القول هستیم که اولاً هزینه تولید LLM بسیار زیاد است، و دوماً جهت داشتن یک LLM، همکاری لاجرم است و بدون آن ادامه این نوع پروژه ممکن نیست. باید دقت کنیم که یک تا دو سال دیگر مرجعیت زبان فارسی را به LLM خواهیم سپرد در نتیجه اگر به زودی راهکار ندهیم موجب حذف ایران از متولی بودن زبان فارسی خواهیم شد. بخش خصوصی و دانشگاه باید با هم اکوسیستم LLM را شکل دهند و حاکمیت را همراه کنند نه اینکه ما وارد بازی حاکمیت شویم و او ما را هدایت کند. باید فرایندها را خودمان با اتحاد تبیین کنیم. نقش هر کس را تعیین و صندلی‌های همه بازیگران را درست بچینیم. لزومی هم ندارد که همه دانشگاه‌ها و همه شرکت‌ها مشارکت کنند اما هر تعدادی که بتوانند با هم کار کنند موجب بلوغ اکوسیستم خواهد شد.

ضیابری عنوان داشتند که نیاز است که یک هاب LLM تشکیل بدهیم که جا برای همه بازیگران دیده شده باشد و نقش هرکس معین باشد از حاکمیت تا بخش خصوصی و دانشگاهی. اما لزومی ندارد که همه بازیگران الزاما حضور داشته باشند. ممکن است برخی اساسا علاقه‌ای به مشارکت نداشته باشند و این‌ها نباید موجب خسارت به دیگرانی که می‌خواهند در مسیر درست قدم بردارند شوند.

نظارات در ادامه بحث موضوع تفاوت میان سیاست آمریکایی و اروپایی در خصوص حمایت از توسعه فناوری عنوان داشتند که آمریکایی‌ها اقتصاد کاملا خصوصی دارند و شرکت‌ها با تشکیل کنسرسیوم‌ها عملا حکمرانی فناوری را هم بر عهده می‌گیرند. این در حالی است که اروپایی‌ها که نظام حکمرانی شبیه‌تری به آن‌ها دارند از مفهومی تحت عنوان مرکز شایستگی- Center of Excellence استفاده می‌کنند که در آن ۵۰٪ حمایت مالی را اتحادیه انجام می‌دهد و ۵۰٪ را ذینفعان دیگر تامین می‌کنند. تعدادی از این مراکز ایجاد می‌کنند و برای هر مرکز قواعد، بهره‌بردار و سازمان اداره‌کننده می‌چینند و ظرف مدت چند سال پس از نتیجه گرفتن سرمایه‌گذاری‌ها اگر موفق باشد از دل آن مرکز یک یا چند شرکت تجاری ایجاد شده و خود مرکز منحل می‌شود. به این ترتیب مانع از دولتی شدن و وابستگی فناوری به دولت می‌شوند. باید سه حلقه داشته باشیم. یک حلقه وظیفه تامین زیرساخت پردازشی و داده‌ای را مبتنی بر مفاهیم ابری بر عهده بگیرد، یک حلقه توسعه پایه‌ای و حلقه سوم محصولات مبتنی بر حلقه میانی را بر عهده بگیرد. لازم است تا علاوه بر موضوع آموزش مدل‌های LLM به بحث بهره‌برداری و سرویس‌دهی هم نگاه داشته باشیم و تمامی الزامات ابری را در آن ببینیم.

ضیابری عنوان داشتند یکی از موضوعات مهم در حوزه هوش مصنوعی مباحث مهندسی هوش مصنوعی است که اکثریت شرکت‌های با ضعف دانش در آن مواجه هستند و از موضوعات بسیار مهمی است که باید در قالب کارگاه‌های آموزشی و تامین زیرساخت‌های مخندسی به آن پرداخته شود و این موضوع فراتر از نیاز بحث LLM است.

اسماعیلیان از مجموعه باسلام عنوان داشتند که الان نیاز نیست در خصوص محصولاتی که روی LLM ارائه می‌شوند صحبت کنیم و ذات مدل زبان بزرگ به حدی عمومی است که می‌توان از آن برای هر کاری استفاده کرد و اجازه دهیم شرکت‌ها خودشان در خصوص این بخش تصمیم بگیرند. ما نیاز داریم یک تعاونی ایجاد کنیم اکثریت شرکت‌های موفق دنیا در این حوزه هم در حال بهره‌گیری از الگوهای اینچنین هستند و از ابتدا روی مدل تجاری آن فکر نمی‌کنند. شرکت‌های متعدد مشارکت کنند در حوزه‌های مختلف مورد نیاز LLM به صورت عمومی و سپس هرکس محصول خودش را توسعه دهد. ایشان در عین حال با اشاره به مدل مارال پیشنهاد داشتند که فعالیت‌های حول کامونیتی متن‌باز تقویت شود.

شمس فرد عنوان داشتند که رقیب قرار دادن تیم‌های دانشجویی و استارتاپی در مقابل تیم‌های شرکتی و پر سابقه کار درستی نیست. مساله این نیست که اگر ۱۵ تیم در مسابقه شرکت کردند چه کنیم؟، مشکل اصلی این است که اگر هیچ کدام از تیم‌های با سابقه و توان در مسابقه شرکت نکردند چه کنیم؟ آیا باید تمام زیرساخت‌ها را در اختیار تیم برنده قرار دهیم صرفا به این دلیل که در یک مسابقه بی‌رقیب یا کم‌رقیب پیروز شده؟ نتیجه این نوع مسابقه برگزارکردن از پیش معلوم است. تیم دانشگاهی را تازه آموزش می‌دهیم و هیچ دانش و بینشی از چالش‌های اساسی و تجاری ندارد و صرفا در یک مسابقه دانشجویی برنده شده این مساله کشور را حل نمی‌کند. ایجاد چتر مشترک برای همه باعث اتلاف منابع و اصراف است. باید برای همکاری مدل و فرایند‌ها را تعریف کنیم و قدم اول همکاری می‌تواند همکاری اطلاعاتی باشد.

ممتازی عنوان داشتند که در تمامی جلساتی که در مرکز ملی برگزار شد مخالفت خودشان با موضوع مسابقه را عنوان کردند اما ظاهرا تصمیم برای برگزاری مسابقه از جایی خارج از اختیارات خانم بوربور گرفته شده و بهتر است جلسه‌ای با شخص رییس مرکز ملی فضای مجازی داشته باشیم و در خصوص آن رایزنی کنیم.

نظارات عنوان داشتند که نباید زمین چیده‌شده بازی را بهم بزنیم و باید با حفظ همان ذهنیت موجود حاکمیت مشکلات را برطرف کنیم. مسابقه غلط است مخصوصا اگر فقط یک تیم برنده مسابقه شود اما به عنوان یک اقدام با نتیجه فوری خوب است باید آن را به نحوی اصلاح کنیم که نظر حاکمیت و متخصصان به صورت توام تامین شود.

باغبانی از مرکز ملی فضای مجازی عنوان داشتند که ایشان هم مخالف موضوع مسابقه هستند و در جلسات مختلف سعی داشتند که این نظر را اصلاح کنند اما موفق نشدند. ایشان پیشنهاد داشتند کمیسیون جلساتی را با مرکز ملی برگزار کند و مشکلات موضوع را به درستی تبیین و مسیر بهتری را ارایه کند.

اسلامی از گروه نجوا اظهار داشتند که مدل ۱۳ میلیارد پارامتری را روی LLAMA توسعه داده‌اند و در خصوص مسابقه موافق برگزاری بودند. در این موضوع آقای دکتر معبودیان ضمن تمجید از فعالیت انجام‌شده توسط تیم نجوا عنوان داشتند کسی با اصل انجام مسابقه مخالف نیست اما در حالی که تعداد پردازنده در کشور محدود است باید منابع را به درستی مدیریت کنیم.

حسینیان از شرکت عصر گویش پرداز هم عنوان داشتند که مباحث حاکمیتی عملا بخش دوم نشست را مجددا به خود اختصاص داد. ایشان معتقد بودند که بحث مسابقه به صورت کلی خوب است مشروط بر آنکه بحث را معطوف به فرهنگ‌سازی و ترویج کنیم و شاید حتی بیش از یک مسابقه نیاز باشد اما در افق محدود و با هدف مشخص نه اینکه از طریق مسابقه بخواهیم کار جدی انجام دهیم. دکتر حسینیان افزودند که نیاز است تا همدلی و جلسات مشترک میان همه ارکان بیشتر شکل بگیرد. ابتدا وضعیت موجودی‌های کشور به صورت کامل احصا شود و سپس بر مبنای داده‌ها تصمیم بگیریم که چگونه عمل کنیم. باید به سمت متن‌باز حرکت کنیم و در سطح حاکمیت نیز این موضوع مورد قبول واقع شده.

طباطبایی عنوان داشتند که هر تصمیمی می گیریم باید صندلی حاکمیت را هم دقیق ببینیم و برایش نقش تعریف کنیم.

در پایان و به عنوان جمع‌بندی محمدزاده ضیابری عنوان داشتند آنگونه که از مجموعه نظرات در جلسه مشخص است همه اعضای نشست با موضوع اینکه باید کار به صورت مشارکتی و هم‌افزایی انجام شوند موافق هستند و باید ابعاد این مشارکت به درستی تبیین شود. قرار بود در بخش دوم نشست در مورد این ابعاد صحبت کنیم که متاسفانه بیشتر صحبت‌ها به موضوع مسابقه معطوف شد. به همین سبب نیاز است تا قبل از هر جلسه‌ای با حاکمیت جلسه دیگری با تعداد افراد محدودتری در سطح کمیسیون هوش مصنوعی نظام صنفی رایانه‌ای برگزار کنیم تا در خصوص ابعاد مشارکت، داده‌ها و ستانده‌ها و نحوه آن بحث و تبادل نظر کنیم. پس از آن می‌توانیم علاوه بر جلسه با مرکز ملی فضای مجازی جلسه‌ای را با حضور سایر بازیگران حاکمیت و بالاخص مشتریان بالقوه صنعتی و حاکمیتی داشته باشیم.

آدرس : تهران، خیابان سهروردی شمالی، خیابان خرمشهر (آپادانا)، خیابان شهید عربعلی (نوبخت)، کوچه پروین رمضانی (نهم)، شماره 13 ساختمان شادروان آزاده داننده

تلفن : ۸۷۱۵۸

فکس : ۸۸۷۶۲۰۳۷

پست الکترونیکی سازمان: info@tehrannsr.org

پست الکترونیکی بازرس هیات مدیره: bazres@tehrannsr.org

آپارات

لینکدین

فیسبوک

اینستاگرام

تلگرام

توییتر

تعرفه خدمات فناوری اطلاعات در سال 1404 (۴۷۲۳ بازدید)

سازمان نظام صنفی رایانه‌ای تهران دسترسی شرکت‌های عضو به اینترنت ... (۲۴۶۱ بازدید)

پیش‌ ثبت‌نام الکامپ 1404 از 15 تا 28 اسفند (۱۸۴۸ بازدید)

نصر تهران با «بیمه ما» قرار داد بیمه تکمیلی امضا کرد| مهلت ثبت نام تا ... (۱۲۰۱ بازدید)

سمینار آشنایی با روال صدور پروانه‌های مجوز خدمات و محصول صنعت افتا ... (۱۱۱۴ بازدید)

الکامپ 1404، 28 تا 31 خرداد برگزار می‌شود (۱۰۰۵ بازدید)

صندوق نوآوری و شکوفایی حمایت ویژه از شرکت‌های دانش‌بنیان آسیب‌دیده ... (۹۵۵ بازدید)

از سرمایه‌گذاری هوشمند تا تقویت زیرساخت‌های دیجیتال

فرصت ثبت‌نام برای خبرنگاران جامانده از نمایشگاه الکامپ تا 2 مهر

الکامپ 28؛ بستری برای سرمایه‌گذاری هوشمند و توسعه پایدار در صنعت فاوا

تحول در برگزاری «الکام‌پیچ» 1404؛ رقابت استارتاپ‌ها با داوری ...

اعضای نظام صنفی رایانه‌ای با تخفیف 15 درصدی به سومین نمایشگاه شهر ...

الکام‌تاکس؛ قلب تپنده گفتگوهای فناورانه در الکامپ 28

تعویق در برگزاری سمینار «تاب‌آوری سازمانی»؛ تاریخ جدید 9 مهر

در نشست هم‌اندیشی متخصصان مدل‌های زبانی بزرگ فارسی بررسی شد

لزوم مشارکت و جایابی صحیح بازیگران حاکمیتی، خصوصی و دانشگاهی در توسعه مدل‌های زبانی فارسی

اسناد نماتن (بازنگری شده) 1402

کتاب سال سازمان

کتاب کارنامه 3 ساله رسته سخت‌افزار و ارتباطات

مستندات پرونده سلامت الکترونیک

بخش ویژه دورکاری

همراهان سازمان

نهادهای حاکمیتی

رسانه‌های تخصصی

سایر

سازمان نظام صنفی رایانه‌ای استان تهران