به گزارش روابطعمومی سازمان نظام صنفی رایانهای استان تهران، نشست هماندیشی متخصصان مدلهای زبانی بزرگ فارسی از ساعت ۸ الی ۱۲ روز دوشنبه ۱۸ دیماه ۱۴۰۲ به میزبانی پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد. این نشست به عنوان سومین نشست از مجموعه نشستهای هماندیشی در حوزه مدلهای زبانی بزرگ (LLM) فارسی شناخته میشود که از سوی کمیسیون هوش مصنوعی و علمداده سازمان نظام صنفی رایانهای برگزار شده است. در این نشست مدیران ۳۵ شرکت و اساتیدی از دانشگاههای تهران، شهید بهشتی، امیرکبیر و شریف به همراه رضویزاده، ریاست پژوهشگاه ارتباطات و فناوری اطلاعات، بوربور ریاست مرکز فراداده مرکز ملی فضای مجازی، بکایی مدیر مرکزنوآوری و توسعه هوش مصنوعی پژوهشگاه ارتباطات و فناوری اطلاعات و معین، مشاور پژوهشگاه در حوزه هوش مصنوعی حضور داشتند.
در ابتدای این نشست محمدرضا معبودیان رئیس کمیسیون هوش مصنوعی و علمداده سازمان نظام صنفی رایانهای استان تهران گزارشی از دو جلسه قبلی برگزار شده در این حوزه ارایه کردند و عنوان داشتند که در دو جلسه قبلی موضوعات عمومی حوزه مدلهای زبانی بزرگ از سوی بخش زیادی از فعالین این حوزه مطرح شده است. در ادامه سید محمد محمدزاده ضیابری دبیر کمیسیون هوش مصنوعی و علمداده در خصوص دلیل برگزاری این نشست اظهار داشت که دو نشست قبلی بیشتر به جنبههای عمومی و بیان مشکلات اختصاص داشت اما در این جلسه قرار است فعالین با همدیگر صحبت فنی کنند تا مشخص شود که در کجای مسیر قرار داریم و هر تیمی چه پیشرفتهایی داشته و چگونه میتوانیم همافزایی کنیم.
در ادامه این نشست برخی از شرکتهایی که تاکنون در خصوص توسعه LLM فارسی موفقیتهایی داشتهاند وضعیت توسعه خود را تشریح کردند. در این زمینه آقای بهیاد از مجموعه خودنویس عنوان داشتند که تاکنون با بهرهگیری از حمایتهای مادی اخذ شده از گوگل، آمازون و مایکروسافت توانستهاند دو مدل زبانی بزرگ فارسی و استونیایی را از ابتدا آموزش داده (From Scratch Training) و در 6 نوبت آموزش مداوم ( Continual pre-Trainedیا Fine-Tune) کردهاند و در همین راستا پیکره زبانی بزرگی برای فارسی به حجم ۴۵۰ گیگابایت نیز ایجاد کردهاند.
آقای سلطانعلیزاده از شرکت پارت و به عنوان یکی از اعضای گروه مشارکت توسعه مدلهای زبانی بزرگ فارسی در خصوص فعالیتهای انجام شده، به موضوع فرایندهای طی شده و چالشها پرداختند و انواع راهکارهای آموزش و ارزیابی مدلها و موضوعات مربوط به پوشش حوزههای مختلف دادهای را مطرح کردند. در حال حاضر گروه مشارکت توسعه مدلهای زبانی بزرگ فارسی با بهرهگیری از پیکرهای به بزرگی بیش از یک ترابایت در حوزههای مختلف اعم از خبری، وبلاگ، ادبیات، انجمن گفتگو، شبکههای اجتماعی و غیره در حال آموزش چند مدل زبانی بزرگ است. ایشان در خصوص برخی ادعاها در حوزه توسعه مدلهای زبانی بزرگ عنوان داشتند که لازم است سطح آموزش و بهسازی مدلها را مشخص کنیم و هر نوع آموزشی (تنظیم دستورالعمل -Instruction Tuning و تنظیم وظایف- Task Tuning) را نمیتوان به عنوان آموزش مدل زبانی بزرگ(آموزش از ابتدا - From Scratch Training و آموزش مداوم- Continual pre-Trained) در نظر گرفت. ایشان در عین حال به مباحث متنباز اشاره کردند و عنوان داشتند که لازم است تا الزامات متنباز با توجه به نبود زیرساختهای قانونی آن در ایران را بررسی کنیم. همچنین ایشان نسبت برخی از اقدامات ساده در حوزه ارزیابی مدلهای زبانی بزرگ که بر اساس فقط ترجمه یک مجموعه دادگان انگیسی به فارسی، انجام میشود، ابراز تردید کرده و خواهان انجام فرآیندهای تست و ارزیابی دقیقتر توسط همه ارائهدهندگان LLMها شدند.
بکایی از پژوهشگاه ارتباطات در خصوص خدمات آزمایشگاهی حوزه LLM و بنچمارکهای آن بهعنوان یکی از چالشهای اساسی این حوزه عنوان داشتند که افراد زیادی ادعای توسعه LLM فارسی دارند اما مادام که نتوانیم ملاکهای ارزیابی درستی را بوجود بیاوریم نمیتوان هیچ کدام از این ادعاها را پذیرفت و حتی برخی از این ادعاها در حال ارایه بر روی ملاکهایی هستند که اساسا ملاک ارزیابی LLM محسوب نمیشوند.
آقای رحمانی از شرکت پردازشگران زبان ویرا عنوان داشت که بر روی Tuneکردن مدل مارال به عنوان یکی از LLMهای متنباز منتشرشده، کار کردند و نتیجه مناسب نگرفتند که به نظر میرسد دلیل آن پیکره آموزش و نحوه آموزش (فقط تنظیم دستورالعمل -Instruction Tuning) آن باشد. ایشان در عین حال به مباحث مربوط به بهکارگیری مدلهای زبانی در زمان استنتاج (Inference)، هزینهها و پیچیدگی آن پرداختند.
خانم شمسفرد از دانشگاه شهید بهشتی در خصوص آزمایشگاه ارزیابی LLM و آزمایشگاه هوش مصنوعی که با حمایت معاونت علمی و فناوری ریاست جمهوری در حال ایجاد است صحبت داشتند و عنوان کردند که کیفیت دادگان آموزشی بسیار مهم است و دادههایی که تاکنون ایجاد شده از کیفیت مطلوبی برخوردار نیستند و لازم است تا دادگان آموزشی، حداقلی از کیفیت را داشته باشند. تیم ایشان در آزمایشگاه پیکرهای به بزرگی حدود ۱۵ تا ۲۰ میلیارد توکن را گردآوری کردهاند که در بسیاری از حوزهها پوشش مناسبی دارد. در عین حال زیرساختهای توسعه LLM و بیش از آن زیرساختهای ارزیابی LLM ها را در آزمایشگاه پردازش زبان دانشگاه شهید بهشتی توسعه دادهاند.
فیلی در تشریح فعالیت آزمایشگاه خود عنوان داشتند که دو تیم در آزمایشگاه پردازش زبان در حال کار روی LLM هستند که یک تیم در خصوص توسعه LLM فعالیت میکند و تیم دوم در خصوص توسعه ابزارها بر روی LLM فعالیت می کنند. ایشان اظهار داشتند که با توجه به محدودیت منابع زیرساخت پردازشی نسبت به فعالیت سایرین کارهای محدودی انجام دادهاند و عمده فعالیتها معطوف به فعالیتهای تحقیقاتی بوده است؛ هرچند که برخی خروجیها توانسته برای کاربردهای خاص نتایج مطلوبی ارایه کند. ایشان معتقد بودند که نیاز نیست در خصوص توسعه دغدغه زیرساخت داشته باشیم و مشکلات ما را تحقیقات جدید توسط خارجیها برطرف خواهند کرد. دکتر فیلی در عین حال تاکید داشتند به جای فعالیت بر روی LLM ملی، باید بر روی کاربردهای آن تمرکز کنیم و خروجی تولید کنیم حتی با استفاده ازLLMهای خارجی و متن باز.
نظارات مدیرعامل شرکت رایانش سریع هزاره ایرانیان عنوان داشتند که هنوز به صورت تخصصی در حوزه LLM را شروع نکردهاند اما در زمینه زیرساختهای پردازشی فعالیتهای خوبی داشتهاند و سکوهایی را آماده کردهاند. ایشان معتقد بودند که نباید نگران تامین زیرساخت بود و زیرساخت قابل فراهم کردن است اما در عین حال گلایه داشتند که پروژههای تامین زیرساخت در پژوهشگاه ارتباطات متوقف شده است.
عزیزی از شرکت لایفوب در خصوص فعالیتهای انجامشده در این شرکت عنوان داشتند که تمرکز این شرکت روی مدلهای زبانی از خانواده BERT بوده و از زیرساختهای دادهای خودشان استفاده کردند و یک حمایت کوچک در حد ۱۰ هزار دلار هم از آمازون گرفتهاند. مجموعه دادههای موجود نزد لایفوب عمدتا از شبکههای اجتماعی و برنامههایی نظیر دیوار و دیجیکالا و همینطور برخی از سایتهای اینترنتی تشکیل شده است. حجم این دادهها بعد از پیش پردازش و حذف تکرارها حدود ۱۰ میلیارد توکن میشود.
ممتازی از دانشگاه امیرکبیر در خصوص فعالیتهای آزمایشگاه پردازش زبان عنوان داشتند که به دلیل محدودیت منابع پردازشی عمده فعالیتها معطوف به تهیه دادگان و آموزش مداوم- Fine-Tune برخی مدلها بوده است. نکته مهم در خصوص فعالیتهای این آزمایشگاه گردآوری دادگان تاریخی و آموزشی و مقالات با حجم حدود ۱۵ میلیارد توکن بوده است.
معین از پژوهشگاه ارتباطات عنوان داشتند که وضعیت کشور در حوزه LLM نسبت به خیلی از کشورهای دیگر خوب است اما لازم است تا همافزایی بین شرکتها و دانشگاهها شکل بگیرد و به جای کارهای پراکنده، همه با هم برای رسیدن به هدف مشترک تلاش کنند. ایشان پیشنهاد داشتند که پژوهشگاه به عنوان محور هاب توسعه LLM، و با همکاری سازمان نظام صنفی، بازیگران مختلف را گرد هم جمع کند.
شمسفرد در ادامه صحبتهای معین، پیشنهاد کردند که این نشست یک بیانیه و یک جدول وضعیت بهعنوان خروجی داشته باشد تا همگان، چه کسانی که در این جلسه حضور داشتند و چه کسانی که حضور نداشتند از وضعیت همه ارکان LLM در حوزههای مختلف آن آگاه شوند تا هرکس که میخواهد وارد این حوزه شود، بداند که کدام بخشها خلاء داریم و کدام کارها به چه نتیجهای رسیده است.
در ادامه نشست در خصوص میزان هزینههای توسعه LLM صحبت شد. در طی این صحبتها آقای بهیاد از مجموعه خودنویس عنوان داشت که تاکنون در حدود ۱.۵ میلیون دلار هزینه کردهاند و هزینههای سالیانه ایشان برای آموزش مداوم(Continual pre-Trained)و آموزش از ابتدا (From Scratch Training) در حدود ۵۰۰ هزار دلار است که بخش عمده آن را از طریق حمایتهای مادی شرکتهای آمازون، گوگل و مایکروسافت تامین میکنند. او در عین حال عنوان داشتند که در این حوزه نیاز به مشاورههای تخصصی است که در همه حمایتهایی که میگیرند بخشی از آن صرف هزینههای مشاوره میشود.
سجادی مدیرعامل شرکت دادماتک، از دیگر اعضای گروه مشارکت توسعه مدل زبانی بزرگ فارسی در خصوص هزینهها عنوان داشتند که از سوی ستاد اقتصاد دیجیتال معاونت علمی و فناوری ریاست جمهوری هزینه پردازنده برای اجاره یک کلاستر ۸تایی A100 برای مدت ۶ ماه حدود ۲.۵ میلیارد تومان هزینه شده و چهار شرکت نیز خود ماهانه حدود ۶۰۰ میلیون تومان در حال هزینه هستند. نتیجه این سرمایهگذاری بسیار محدود، آموزش مدل ۱۳ میلیارد پارامتر است و نسبت به سرمایه گذاری لازم، تقریبا هیچ حساب میشود.
سلطانعلیزاده از شرکت پارت در ادامه موضوع بحث هزینهها را به درآمدها متصل کردند و عنوان داشتند که هزینههای توسعه حتی با فرض بهرهگیری از حمایتهای مالی خارجی، بسیار بالاست و بهتر است بهجای اینکه تیمهای مختلف هزینههای مکرر و کوچک داشته باشند هزینهها مدیریت شود تا مدلهای بزرگتری توسعه یابد و شرکتهای کوچکتر و مصرفکنندگان با هزینه کمتری مواجه باشند.
معبودیان عضو هیاتمدیره شرکت مهندسی مشاور عصر فناوری دانش عنوان داشتند که محاسبه ساده نشان میدهد که هزینه توسعه LLM کاربردی حداقل ۵۰ میلیارد تومان در سال هزینه دارد که نیمی از آن بابت زیرساختها از سوی دولت میتواند تامین شود اما نیم دیگر میبایست توسط بخش خصوصی تامین شود و در این راستا مشارکت جمعی موجب کاهش هزینهها و بهرهگیری مناسب با درنظر گرفتن بحث بازگشت سرمایه میشود.
فیلی در خصوص بازگشت سرمایه LLM عنوان داشتند که فعالیتهای تجاری زیادی هست که میتوانند در مقیاس بالا استفاده و درآمدزایی مناسبی ایجاد کنند. ایشان معتقد بودند که یکی از مخاطرات در توسعه LLM بومی، رقابت قیمتی با نمونههای خارجی خواهد بود. ایشان در عین حال نسبت به اهداف نشست در تشکیل یک گروه مشارکت بزرگ برای توسعه یک LLM عمومی تشکیک کردند و عنوان داشتند که این مسیر و توسعه یک LLM مشترک مناسب نیست. در خصوص این تشکیک آقای محمدزاده ضیابری دبیر نشست عنوان داشتند که هدف توسعه یک LLM نیست بلکه هدف جلب مشارکت جمعی جهت سرشکنکردن هزینه فعالیتهای تکراری و بهرهگیری از توان جمعی برای توسعه همه مدلهای مورد نیاز است. ضیابری اظهار داشت در کشور بارها هزینه برای تکرار تکراریها صورت گرفته و این روش غلط است. باید با همافزایی هزینههای مصروفه از بیت المال به سمت درست هدایت شده و از تلفات منابع جلوگیری کنیم.
بوربور از مرکز ملی فضای مجازی در بخش اول این نشست در خصوص رسالت مرکز ملی فضای مجازی در حمایت از تیمها و پاسداری از زبان فارسی توضیحاتی دادند. ایشان عنوان داشتند که بنا بر طرح فعلی قرار است یک مسابقه با همکاری دانشگاه شریف و مجموعه کوئرا برگزار شود و در طی آن سه تیم برتر مورد حمایت قرار گرفته و در نهایت ۱۲۸ دستگاه پردازنده در اختیار یک تیم قرار خواهد گرفت.
در پایان بخش اول این نشست مشخص شد که در حال حاضر تنها ۵ مجموعه در حال توسعه و کار واقعی بر روی LLM فارسی هستند و الباقی مجموعهها تنها بر روی تنظیم دستورالعمل -Instruction Tuning فعالیت داشته یا هنوز کار جدی در این زمینه انجام ندادهاند.
در بخش دوم این نشست ابتدا محمدزاده ضیابری دبیر کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانهای در خصوص تاریخچه تشکیل گروه مشارکت توسعه مدل زبانی بزرگ فارسی توضیح دادند. او اظهار داشتند که پایهریزی این گروه به حدود ۲.۵ سال پیش باز میگردد که در آن زمان پردازندههای گرافیکی سیمرغ دانشگاه امیرکبیر بدون مشتری مانده بود و پیشنهاد شد که در غالب یک مشارکت بخش دولتی با خصوصی دولت هزینه اجاره پردازندههای گرافیکی را متقبل شده و در مقابل بخش خصوصی توان اجرایی و فنی و دادگان را تامین کند تا برخی مدلهای ملی مورد نیاز در کشور توسعه داده شده و به صورت متنباز در اختیار عموم قرار گیرد. پس از فراخوان عمومی تنها ۶ طرح از ۴ مجموعه برای این مدل همکاری رسید و در نهایت قرار شد سه شرکت پردازش هوشمند ترگمان، دادهپردازان مبتکر آکام و پژوهشگاه توسعه فناوریهای پیشرفته خواجه نصیرالدین طوسی توسعه مدل زبانی فارسی نظیر Large BERT را در دستور کار قرار دهند. طولانیشدن فرایند تخصیص GPU ها منجر به تغییر فناوری و ورود به عرصه انقلاب LLM ها شد و در نهایت در پاییز سال جاری گروه مشارکت مشتمل بر سه شرکت پردازش هوشمند ترگمان، دادهپردازان مبتکر آکام و مهندسی مشاور عصر فناوری دانش کار را آغاز و از همان ابتدا شرکت پردازش اطلاعات مالی پارت نیز به این گروه مشارکت افزوده شد. در عین حال این گروه فضا را برای مشارکت سایر شرکتها و دانشگاهها نیز باز گذاشته و اخیرا مذاکراتی با خانم دکتر شمسفرد داشته تا در حوزه ارزیابی به این گروه مشارکت افزوده شوند. ایشان در ادامه در خصوص دلایلی که نیاز به مشارکت وجود دارد عنوان داشتند در همین جلسه مشخص شد که در حوزه پیکره کارهای پراکنده بسیار خوبی انجام شده که باید با هم تجمیع شوند و یک گروه مشارکت قوی میتواند در عین حال قدرت چانهزنی بیشتری هم داشته باشد و بتواند هم در حوزه زیرساختهای پردازشی و هم در حوزه جلب دادگان از کتابخانه ملی، و مجموعههایی نظیر ISC, SID به موفقیتهای بیشتری دست یابد و در عین حال در یک گروه مشارکت، هر تیم میتواند به صورت تخصصی بر روی بخشی از فعالیتها متمرکز شده و از پراکندگی و تلفات توان تیمها در انجام کارهای تکراری جلوگیری شود. ضیابری عنوان داشت بحث اصلی ما اتحاد رقبا است و باید بتوانیم در عین رقابت در حوزه تجاری با هم مشارکت کنیم تا نفع جمعی ببریم. برای این موضوع لازم است تا در مورد فرایندها و مدلهای همکاری صحبت کنیم و حدود و ثغور آن را تعیین کنیم.
شمسفرد در خصوص پیشنهادشان برای جدول وضعیت و بیانیه عنوان داشتند که لازم است تا یک هیئت رهبری (Leader Board) ایجاد شود که در آن وضعیت اجزای مختلف به دقت ثبت و بهروزرسانی شود. ایشان عنوان داشتند که انواع مشارکت در این جدول را میتوان به چهار نوع تقسیم کنیم گروه اول کسانی که به صورت آزاد و متنباز دستاوردها را ارایه میکنند. گروه دوم کسانی که صرفا دستاوردهای خود را در اختیار نهاد ارزیاب قرار میدهند، گروه سوم کسانی که حاضرند ارزیابی شوند اما خودشان با استفاده از دادههای ارزیابی کار را انجام دهند و گروه چهارم که صرفا اطلاع میدهند و حاضر به راستیآزمایی و ارزیابی نیستند.
طباطبایی مدیر هوش مصنوعی ستاد کل نیروهای مسلح عنوان داشتند که لازم است یک درختواره از فعالیتها ایجاد کنیم و به ازای هر بخش گره این درخت مشخص کنیم که وضعیت به چه صورت است. بر مبنای این درختواره میتوان تقسیم کار و شکست پروژه انجام داده و از یک طرف از انجام کارهای تکراری جلوگیری کنیم و از طرف دیگر بتوانیم نتایج را تجمیع کنیم. ایشان همچنین عنوان داشت که لازم است تا این درختواره در اختیار نهادهای حاکمیتی نظیر مرکز ملی هوش مصنوعی قرار گیرد تا در برنامهریزیها مورد استفاده باشد.
محمدزاده ضیابری اضافه کردند که ما نیاز داریم به حمایت نهاد حاکمیتی حداقل در حوزه زیرساختها و همچنین یک نهاد متولی باید باشد که فعالیتهای بخش خصوصی را در مسیر نیازمندیهای ملی هدایت کند. طبیعتا نهاد حاکمیتی بابت حمایت خود توقعاتی دارد و در حوزههایی نظیر پاسداری از زبان فارسی و فرهنگ و دیانت دغدغههایی دارد که به صورت طبیعی جزو دغدغههای بخش خصوصی به عنوان یک بنگاه تجاری نیست. بحث اصلی این است که صندلیهای مناسب چیده شوند تا هرکس دقیقا سر جای خودش و به درستی نقشآفرینی کند.
دکتر شمس فرد در خصوص دخالت نهادهای حاکمیتی عنوان داشتند که این وظیفه متولی حاکمیتی است که بازیگران را بیابد و از آنها حمایت کند نه اینکه خودمان سراغ نهادهای حاکمیتی برویم. آنچه تجربه شده بالاخص در حوزه سند ترویج زبان فارسی نشان داده که هرکسی در نزد حاکمیت خود را متولی میداند و نمیشود با همه آنها وارد مذاکره شد.
معبودیان در این بخش عنوان داشتند که لازم است تا برای جایگیری صحیح بازیگران و متولیان وارد مدلهای مشارکت دولت بخش خصوصی موسوم به PPP شویم تا بحثهای تجاری و بازگشت سرمایه به خوبی تبیین شوند.
بوربور در خصوص فعالیتهای مرکز ملی فضای مجازی در حوزه LLM توضیحاتی دادند و عنوان داشتند که چارچوب برگزاری یک مسابقه انتخاب شده و ایجاد پیکره هم به دکتر فیلی سپرده شده است. اما یک سوال مهم از سوی ریاست مرکز ملی فضای مجازی مطرح است و بیپاسخ مانده است. ما به عنوان نهاد حاکمیتی نمیتوانیم تنها از برخی از تیمها حمایت کنیم و مجبوریم همه را زیر چتر حمایتی قرار دهیم به همین دلیل هم سازوکار مسابقه را انتخاب کردیم. به فرض یک تیم در نهایت به برتری رسید و مثلا ۱۲۸ کارت گرافیک در اختیار آنها قرار گرفت سوال این است که ما تا کی باید حمایت کنیم؟ ما دنبال سود نیستیم اما باید بدانیم نتیجه فعالیتمان چه خواهد شد؟
معبودیان در پاسخ به سوال بوربور عنوان داشتند آیا اساسا برگزاری مسابقه برای چنین کاری در این سطح، رویکرد درستی است؟ شرکتها با نگاه تجاری در این نوع مسابقات شرکت نمیکنند چون هزینه به فایده آن به صرفه نیست. عملا شرکتکنندگان در اینگونه مسابقات، تیمهای استارتاپی، نوپا و دانشجویی خواهند بود که شاید در ابتدا نتایج خوبی نشان دهند اما توان نهاییسازی خروجیها و رسیدن به مدلهایی که در سطح ملی مورد نیاز است را ندارند. به نظر میرسد که مکانیزم توزیع امکانات از طریق مسابقه لزوما درست نیست.
بوربور عنوان داشتند که دغدغههای حاکمیتی پیچیدهتر هستند و پیشنهادهای مختلفی بود که یکی از آنها تشکیل یک پازل مشارکتی بود. در طی جلسات متعدد با بازیگران مختلف و با وجود اینکه شخصا با برگزاری مسابقه موافق نبودم، فشارهای خارج از اختیار ما موجب تصمیم برای برگزاری مسابقه شد. حالا تصمیم بر این شده که پیکره از طریق دانشگاه تهران تامین شود و بعد در اختیار همه شرکتکنندگان در مسابقه قرار بگیرد. قرار است بهزودی فراخوان مسابقه را ارایه کنیم و تا پایان سال ۳ تیم برتر را انتخاب کنیم.
ضیابری عنوان داشتند نفس برگزاری مسابقه با چیزی که در این جلسه مبتنی بر گسترش فضای مشارکت تعریف شده، در تضاد است. بحث ما اتحاد رقبا است به نحوی که در عین رقابت، رفاقت و همکاری کنند. موضوعی که در هند به نحو احسن سرلوحه فعالیتهای صنفی قرار گرفته و در چین و سایر نقاط دنیا هم به همینطور. اما مسابقه یعنی رقابت خالص و از دل رقابت رفاقت و همکاری شکل نمیگیرد.
دکتر بوربور معتقد بودند که با توجه به روحیه عدم همکاری ایرانیها ممکن است تشکیل گروههای مشارکت و همکاری موفق نباشد و همواره برخی خارج از این همکاری مدعی باشند. ما به عنوان حاکمیت مجبوریم از همه حمایت کنیم تا شایبه وجود نداشته باشد.
منصوری رییس هیات مدیره ریزیکو عنوان داشتند استفاده از بحث مسابقه مانع خلاقیت است چرا که تیمهای مختلف در سطوح مختلف تحقیق و توسعه هستند و پیشنهاد داشتند کمیسیون هوش مصنوعی سازمان نظام صنفی رایانهای به عنوان بازوی مشورتی تصمیمگیری در این حوزه مورد استفاده قرار گیرد.
سلطانعلیزاده در خصوص چالشهای برگزاری مسابقه و انتخاب تیمهای مناسب برای مراحل بعدی مطالبی مطرح کردند و عنوان داشتند که تیمی که یک مدل کوچک را به بهترین وجه پیادهسازی کند لزوما توانایی پیادهسازی مدلهای واقعی و بزرگ و بهرهبرداری از زیرساختهای اساسی را نخواهد داشت. همچنین ایشان ابراز داشتند که برای مراحل اولیه مسابقه، چه منابع پردازشی برای حاضرین در مسابقه فراهم خواهد شد و بدون ارائه زیر ساخت به همه تیم ها، فرایند ارزیابی ها و داورهای دارای اشکال خواهد بود.
دکتر سجادی در خصوص اینکه قرار بود در این جلسه در خصوص مباحث حاکمیتی صحبت نشود مطالبی ایراد کردند و عنوان داشتند که لازم است تا ابتدا مسایل داخلی خودمان را در راستای همکاری حل کنیم و حواسمان باشد که وارد بازیهای حاکمیتی نشویم. در این جلسه نتیجه گرفتیم که همه متفقالقول هستیم که اولاً هزینه تولید LLM بسیار زیاد است، و دوماً جهت داشتن یک LLM، همکاری لاجرم است و بدون آن ادامه این نوع پروژه ممکن نیست. باید دقت کنیم که یک تا دو سال دیگر مرجعیت زبان فارسی را به LLM خواهیم سپرد در نتیجه اگر به زودی راهکار ندهیم موجب حذف ایران از متولی بودن زبان فارسی خواهیم شد. بخش خصوصی و دانشگاه باید با هم اکوسیستم LLM را شکل دهند و حاکمیت را همراه کنند نه اینکه ما وارد بازی حاکمیت شویم و او ما را هدایت کند. باید فرایندها را خودمان با اتحاد تبیین کنیم. نقش هر کس را تعیین و صندلیهای همه بازیگران را درست بچینیم. لزومی هم ندارد که همه دانشگاهها و همه شرکتها مشارکت کنند اما هر تعدادی که بتوانند با هم کار کنند موجب بلوغ اکوسیستم خواهد شد.
ضیابری عنوان داشتند که نیاز است که یک هاب LLM تشکیل بدهیم که جا برای همه بازیگران دیده شده باشد و نقش هرکس معین باشد از حاکمیت تا بخش خصوصی و دانشگاهی. اما لزومی ندارد که همه بازیگران الزاما حضور داشته باشند. ممکن است برخی اساسا علاقهای به مشارکت نداشته باشند و اینها نباید موجب خسارت به دیگرانی که میخواهند در مسیر درست قدم بردارند شوند.
نظارات در ادامه بحث موضوع تفاوت میان سیاست آمریکایی و اروپایی در خصوص حمایت از توسعه فناوری عنوان داشتند که آمریکاییها اقتصاد کاملا خصوصی دارند و شرکتها با تشکیل کنسرسیومها عملا حکمرانی فناوری را هم بر عهده میگیرند. این در حالی است که اروپاییها که نظام حکمرانی شبیهتری به آنها دارند از مفهومی تحت عنوان مرکز شایستگی- Center of Excellence استفاده میکنند که در آن ۵۰٪ حمایت مالی را اتحادیه انجام میدهد و ۵۰٪ را ذینفعان دیگر تامین میکنند. تعدادی از این مراکز ایجاد میکنند و برای هر مرکز قواعد، بهرهبردار و سازمان ادارهکننده میچینند و ظرف مدت چند سال پس از نتیجه گرفتن سرمایهگذاریها اگر موفق باشد از دل آن مرکز یک یا چند شرکت تجاری ایجاد شده و خود مرکز منحل میشود. به این ترتیب مانع از دولتی شدن و وابستگی فناوری به دولت میشوند. باید سه حلقه داشته باشیم. یک حلقه وظیفه تامین زیرساخت پردازشی و دادهای را مبتنی بر مفاهیم ابری بر عهده بگیرد، یک حلقه توسعه پایهای و حلقه سوم محصولات مبتنی بر حلقه میانی را بر عهده بگیرد. لازم است تا علاوه بر موضوع آموزش مدلهای LLM به بحث بهرهبرداری و سرویسدهی هم نگاه داشته باشیم و تمامی الزامات ابری را در آن ببینیم.
ضیابری عنوان داشتند یکی از موضوعات مهم در حوزه هوش مصنوعی مباحث مهندسی هوش مصنوعی است که اکثریت شرکتهای با ضعف دانش در آن مواجه هستند و از موضوعات بسیار مهمی است که باید در قالب کارگاههای آموزشی و تامین زیرساختهای مخندسی به آن پرداخته شود و این موضوع فراتر از نیاز بحث LLM است.
اسماعیلیان از مجموعه باسلام عنوان داشتند که الان نیاز نیست در خصوص محصولاتی که روی LLM ارائه میشوند صحبت کنیم و ذات مدل زبان بزرگ به حدی عمومی است که میتوان از آن برای هر کاری استفاده کرد و اجازه دهیم شرکتها خودشان در خصوص این بخش تصمیم بگیرند. ما نیاز داریم یک تعاونی ایجاد کنیم اکثریت شرکتهای موفق دنیا در این حوزه هم در حال بهرهگیری از الگوهای اینچنین هستند و از ابتدا روی مدل تجاری آن فکر نمیکنند. شرکتهای متعدد مشارکت کنند در حوزههای مختلف مورد نیاز LLM به صورت عمومی و سپس هرکس محصول خودش را توسعه دهد. ایشان در عین حال با اشاره به مدل مارال پیشنهاد داشتند که فعالیتهای حول کامونیتی متنباز تقویت شود.
شمس فرد عنوان داشتند که رقیب قرار دادن تیمهای دانشجویی و استارتاپی در مقابل تیمهای شرکتی و پر سابقه کار درستی نیست. مساله این نیست که اگر ۱۵ تیم در مسابقه شرکت کردند چه کنیم؟، مشکل اصلی این است که اگر هیچ کدام از تیمهای با سابقه و توان در مسابقه شرکت نکردند چه کنیم؟ آیا باید تمام زیرساختها را در اختیار تیم برنده قرار دهیم صرفا به این دلیل که در یک مسابقه بیرقیب یا کمرقیب پیروز شده؟ نتیجه این نوع مسابقه برگزارکردن از پیش معلوم است. تیم دانشگاهی را تازه آموزش میدهیم و هیچ دانش و بینشی از چالشهای اساسی و تجاری ندارد و صرفا در یک مسابقه دانشجویی برنده شده این مساله کشور را حل نمیکند. ایجاد چتر مشترک برای همه باعث اتلاف منابع و اصراف است. باید برای همکاری مدل و فرایندها را تعریف کنیم و قدم اول همکاری میتواند همکاری اطلاعاتی باشد.
ممتازی عنوان داشتند که در تمامی جلساتی که در مرکز ملی برگزار شد مخالفت خودشان با موضوع مسابقه را عنوان کردند اما ظاهرا تصمیم برای برگزاری مسابقه از جایی خارج از اختیارات خانم بوربور گرفته شده و بهتر است جلسهای با شخص رییس مرکز ملی فضای مجازی داشته باشیم و در خصوص آن رایزنی کنیم.
نظارات عنوان داشتند که نباید زمین چیدهشده بازی را بهم بزنیم و باید با حفظ همان ذهنیت موجود حاکمیت مشکلات را برطرف کنیم. مسابقه غلط است مخصوصا اگر فقط یک تیم برنده مسابقه شود اما به عنوان یک اقدام با نتیجه فوری خوب است باید آن را به نحوی اصلاح کنیم که نظر حاکمیت و متخصصان به صورت توام تامین شود.
باغبانی از مرکز ملی فضای مجازی عنوان داشتند که ایشان هم مخالف موضوع مسابقه هستند و در جلسات مختلف سعی داشتند که این نظر را اصلاح کنند اما موفق نشدند. ایشان پیشنهاد داشتند کمیسیون جلساتی را با مرکز ملی برگزار کند و مشکلات موضوع را به درستی تبیین و مسیر بهتری را ارایه کند.
اسلامی از گروه نجوا اظهار داشتند که مدل ۱۳ میلیارد پارامتری را روی LLAMA توسعه دادهاند و در خصوص مسابقه موافق برگزاری بودند. در این موضوع آقای دکتر معبودیان ضمن تمجید از فعالیت انجامشده توسط تیم نجوا عنوان داشتند کسی با اصل انجام مسابقه مخالف نیست اما در حالی که تعداد پردازنده در کشور محدود است باید منابع را به درستی مدیریت کنیم.
حسینیان از شرکت عصر گویش پرداز هم عنوان داشتند که مباحث حاکمیتی عملا بخش دوم نشست را مجددا به خود اختصاص داد. ایشان معتقد بودند که بحث مسابقه به صورت کلی خوب است مشروط بر آنکه بحث را معطوف به فرهنگسازی و ترویج کنیم و شاید حتی بیش از یک مسابقه نیاز باشد اما در افق محدود و با هدف مشخص نه اینکه از طریق مسابقه بخواهیم کار جدی انجام دهیم. دکتر حسینیان افزودند که نیاز است تا همدلی و جلسات مشترک میان همه ارکان بیشتر شکل بگیرد. ابتدا وضعیت موجودیهای کشور به صورت کامل احصا شود و سپس بر مبنای دادهها تصمیم بگیریم که چگونه عمل کنیم. باید به سمت متنباز حرکت کنیم و در سطح حاکمیت نیز این موضوع مورد قبول واقع شده.
طباطبایی عنوان داشتند که هر تصمیمی می گیریم باید صندلی حاکمیت را هم دقیق ببینیم و برایش نقش تعریف کنیم.
در پایان و به عنوان جمعبندی محمدزاده ضیابری عنوان داشتند آنگونه که از مجموعه نظرات در جلسه مشخص است همه اعضای نشست با موضوع اینکه باید کار به صورت مشارکتی و همافزایی انجام شوند موافق هستند و باید ابعاد این مشارکت به درستی تبیین شود. قرار بود در بخش دوم نشست در مورد این ابعاد صحبت کنیم که متاسفانه بیشتر صحبتها به موضوع مسابقه معطوف شد. به همین سبب نیاز است تا قبل از هر جلسهای با حاکمیت جلسه دیگری با تعداد افراد محدودتری در سطح کمیسیون هوش مصنوعی نظام صنفی رایانهای برگزار کنیم تا در خصوص ابعاد مشارکت، دادهها و ستاندهها و نحوه آن بحث و تبادل نظر کنیم. پس از آن میتوانیم علاوه بر جلسه با مرکز ملی فضای مجازی جلسهای را با حضور سایر بازیگران حاکمیت و بالاخص مشتریان بالقوه صنعتی و حاکمیتی داشته باشیم.