گامی رو به جلو برای زبان فارسی؛ دریافت تأییدیه دانش‌بنیان توسط یک پروژه متن‌باز

مدیرکل ارتباطات و فناوری اطلاعات استان کرمان،گفت: یک پروژه متن‌باز که متعلق به یک شرکت ایرانی در شهر رفسنجان استان کرمان است، به‌عنوان یک محصول دانش‌بنیان، نخستین معماری‌های بومی و متن‌باز برای پردازش، مدل‌سازی و تولید زبان فارسی معرفی شده است که مسیر کاملی از پیش‌پردازش، ساختاردهی و تحلیل متن تا یادگیری عمیق و تولید برای زبان فارسی را در یک چارچوب مستقل و یکپارچه ارائه می‌دهد.

به گزارش سیتنا، آزاده تاج‌الدینی، مدیرکل ارتباطات و فناوری اطلاعات استان کرمان اعلام کرد: یک شرکت دانش بنیان در شهر رفسنجان استان کرمان با تکیه بر معماری‌ها و روش‌های گراف‌محور، متن فارسی را از حالت صرفاً خطی و توالی‌محور خارج کرده و به ساختاری رابطه‌مند تبدیل می‌کند؛ ساختاری که می‌تواند برای تحلیل متن، طبقه‌بندی، خلاصه‌سازی، توصیه‌گر محتوا و توسعه مدل‌های هوش مصنوعی فارسی به‌کار رود. معماری‌ها و روش‌های گراف‌محور، از رویکردهای مدرن در هوش مصنوعی و پردازش زبان طبیعی هستند.

وی، گفت: برای درک ساده‌تر این محصول، می‌توان متن فارسی را مثل یک شهر تصور کرد. در یک شهر، خانه‌ها، خیابان‌ها، میدان‌ها و مسیرهای ارتباطی وجود دارند. اگر فقط خانه‌ها را جداگانه ببینیم، تصویر کاملی از شهر نداریم؛ اما وقتی مسیرها و ارتباط میان آن‌ها را هم ببینیم، می‌توانیم بفهمیم هر بخش چه نقشی دارد و چگونه به بخش‌های دیگر وصل می‌شود.

تاج الدینی، افزود: در پردازش متن هم همین اتفاق می‌افتد. بسیاری از سامانه‌های هوش مصنوعی، متن را فقط به‌صورت یک ردیف از کلمات پشت سر هم می‌بینند. اما این محصول تلاش می‌کند علاوه بر خود کلمات، رابطه میان آن‌ها را هم در نظر بگیرد؛ مثلاً اینکه کدام واژه‌ها به هم نزدیک‌ترند، کدام جمله‌ها با هم ارتباط معنایی دارند، کدام اسناد به یک موضوع مشترک اشاره می‌کنند و چه مفاهیمی در متن به هم وصل شده‌اند.

مدیرکل ارتباطات و فناوری اطلاعات استان کرمان، گفت: به زبان ساده، این محصول متن فارسی را از حالت یک نوشته ساده به یک نقشه ارتباطی تبدیل می‌کند. این نقشه به مدل‌های هوش مصنوعی کمک می‌کند متن را بهتر تحلیل کنند، موضوع آن را تشخیص دهند، آن را دسته‌بندی کنند، خلاصه بسازند، محتوای مرتبط پیشنهاد دهند یا حتی در مسیر تولید متن فارسی از روابط پنهان میان واژه‌ها و مفاهیم استفاده کنند.

وی، گفت: اهمیت این موضوع برای زبان فارسی بیشتر است، چون فارسی ویژگی‌های خاصی مانند نیم‌فاصله، افعال مرکب، تفاوت شکل نوشتاری برخی حروف، و رابطه‌های معنایی پیچیده دارد. این محصول با تمرکز بر همین ویژگی‌ها طراحی شده تا پردازش زبان فارسی فقط وابسته به ابزارهای عمومی نباشد و یک مسیر بومی، قابل توسعه و شفاف برای هوش مصنوعی فارسی فراهم شود.

وی، افزود: بنابراین، دانش‌بنیان شدن این محصول فقط به معنای دریافت یک تأییدیه اداری نیست؛ بلکه نشان می‌دهد یک محصول فناورانه ایرانی در حال ساخت زیرساختی برای فهم بهتر، تحلیل دقیق‌تر و توسعه پیشرفته‌تر زبان فارسی در حوزه هوش مصنوعی است.

انتهای پیام