کد مطلب: 

184070
مجری طرح جویشگر بومی در گفت‌وگو با ماهنامه نسل چهارم:

سرمایه گذاری دولت در جویشگر بومی بدون حمایت مردم بی فایده است/ به دنبال راه‌اندازی جویشگر ملی با مالکیت دولتی نیستیم

نظر به تلاش های چندین ساله متخصصان داخلی، هم‌اکنون دو موتور جستجوی بومی با نام‌های پارسی‌جو و یوز در حال فعالیت هستند که به اعتقاد کارشناسان وضعیت فنی مطلوبی دارند و با مراجعه هر چه بیشتر کاربران ایرانی به جایگاه واقعی خود خواهند رسید. با توجه به اهمیت و جایگاه جویشگرهای بومی، در بخش کنکاش شماره چهارم ماهنامه نسل چهارم با نگاهی تحلیلی و کارشناسانه، با مجری طرح جویشگر بومی در پژوهشگاه ارتباطات و فناوری اطلاعات گفت‌وگو شده است.
سرمایه گذاری دولت در جویشگر بومی بدون حمایت مردم بی فایده است/ به دنبال راه‌اندازی جویشگر ملی با مالکیت دولتی نیستیم

به گزارش سیتنا، گفت‌وگوی ماهنامه نسل چهارم با دکتر علیرضا یاری، رئیس پژوهشکده فناوری اطلاعات پژوهشگاه ارتباطات و فناوری اطلاعات و مجری طرح جویشگر بومی را بخوانید.

سوال: به عنوان سؤال نخست، در خصوص لزوم طراحی موتور جستجوگر بومی توضیح فرمایید.

جواب: راه‌اندازی جویشگر بومی صرفاً به این علت نیست که ما بخواهیم یک خدمت یا نرم‌افزار را تولید کنیم و در اختیار مردم قرار دهیم. طراحی و راه‌اندازی این سیستم از ابعاد مختلف اقتصادی، سیاسی، فرهنگی و اجتماعی بسیار حائز اهمیت است. پس ما که به دنبال راه‌اندازی جویشگر بومی هستیم هدفمان این است که گردش اطلاعات و تأثیر آن بر ابعاد مختلف را تقویت کنیم. در حال حاضر حدود 40 تا 50 موتور جویشگر داخلی وجود دارند که البته برخی از آن‌ها غیرفعال هستند. به هر حال با ابعاد کوچکی شروع ‌شده‌اند و بعضاً نتوانسته‌اند منابع مورد نیازشان را تأمین کنند یا به مدل کسب‌وکار مناسبی برسند و نهایتاً متوقف‌شده‌اند. برخی هم فراجویشگر هستند یعنی جویشگرهای گوگل، یاهو و سایرین را استفاده می‌کنند و امکان جستجوی همزمان از این جویشگرها را برای کاربران فراهم می‌کنند؛ به عبارت دیگر خود این خدمات جویشگر نیستند و امکان سایر جویشگرها را استفاده می‌کنند و برای کاربران امکان جستجوی همزمان در چند جویشگر را فراهم می‌کنند.
در کنار این جویشگرهای موجود در کشور، دو جویشگر دیگر داریم که وزارت ارتباطات و فناوری اطلاعات از چند سال پیش به شکل پژوهشی با دانشگاه‌های کشور شروع کرده است. یکی از آن‌ها یوز و دیگری پارسی جو است. لزوم راه‌اندازی این جویشگرها از آنجا اتفاق افتاد که جویشگرها علاوه بر ابعاد تحقیقاتی، به منابع زیاد سخت‌افزاری نیاز دارند و این باعث می‌شود که بخش خصوصی نتواند به شکل قابل ‌قبول در این بخش وارد شود و در ابتدا حمایت‌های دولت مورد نیاز است. این حمایت‌ها مشتمل بر پهنای باند، سرور و موارد مرتبط با تحقیق و پژوهش است که در این دو پروژه این موارد پوشش داده شد و در حال حاضر به مقطعی رسیده است که ما می‌خواهیم خدمات دیگر جویشگرها مانند ترجمه، نقشه، پست الکترونیک و شبکه اجتماعی را با این‌ها ترکیب کنیم و سکوی خدمات پایه‌ای مانند گوگل را فراهم کنیم. از سوی دیگر قصد نداریم که تنها یک جویشگر بومی داشته باشیم؛ چرا که وابستگی به یک جویشگر باعث از بین رفتن رقابت شده و به کیفیت خدمات مورد انتظار کاربران نیز لطمه وارد می‌شود.

سوال: بفرمایید آیا نمونه‌های موفق دنیا در حوزه موتورهای جستجوگر نیز چند موتور جستجو را به صورت همزمان در دستور کار دارند و نحوه فعالیت این موتورها چگونه است؟

جواب: طی فراخوان ما علاوه بر دو موتور جویشگر نامبرده، از بخش خصوصی هم شرکت‌هایی ورود کرده که در میان آن‌ها یک سکوی جویش هم پیشنهاد شده است که اگر شرایط فراهم شود موتور سوم نیز در کنار دو موتور قبلی مورد حمایت قرار می‌گیرد، ولی مسلماً هدف این نیست که تا انتها هر سه جویشگر مورد حمایت ما باشد چون در این بخش نیاز به تمرکز است و هزینه سه جویشگر بسیار بالاست. کشوری مانند امریکا نیز دو جویشگر بینگ و گوگل را دارد، که بینگ حدود 30 درصد سهم بازار کشور آمریکا را دارد. در چین نیز سه جویشگر غالب مشتمل بر دو جویشگر بومی و گوگل مشغول به فعالیت است، که دو جویشگر داخلی بیش از 80 درصد بازار را در اختیار دارند. در روسیه نیز جویشگر بومی حدود 70 درصد بازار را در اختیار دارد و گوگل 30 درصد باقی‌مانده را تصاحب کرده است. پس چند جویشگر داشتن بستگی به شرایط بازار آن کشور دارد. ولی نکته قابل‌توجه این است که ما به دنبال ارائه خدمات گوگل نیستیم؛ چرا که پایه خدمات گوگل مبتنی بر وب است، ولی ما در جویشگرهای بومی به دنبال ارائه خدماتی هستیم که مردم کشورمان نیاز دارند و گوگل به آن نپرداخته است. به عنوان مثال فردی در خیابان امیرآباد تهران به دنبال انتخاب مدرسه‌ای خوب است که گوگل نمی‌تواند پیشنهاد مناسبی به او ارائه دهد، در صورتی که موتورهای بومی می‌توانند از اطلاعات داخل کشور استفاده کرده و بهترین گزینه را به شما ارائه دهند. 
به هر حال توصیه ما به بخش خصوصی این است که اگر می‌خواهند در طرح جویشگر فعالیت کنند در حوزه خدمات ارزش افزوده وارد شوند که به دو محور محتوای بومی و حوزه منطقه‌ای بستگی دارد و در واقع خدمات محلی بر پایه مدل مناسب کسب‌وکار ارائه دهند که می‌تواند هم برای کاربران جذاب باشد و هم درآمد اقتصادی برای جویشگرها به همراه داشته باشد.

سوال: نحوه حمایت دولت ها از موتورهای جستجوگر داخلی در کشورهای پیشرو چگونه است؟

جواب: اگر شروع گوگل را بررسی کنید شرکت‌های استارت آپ کوچکی بودند. در آن زمان خیلی هنوز فرهنگ جستجو نبود و به راحتی امکان تأمین نیازهای کاربران وجود داشت؛ در واقع با رشد نیاز مردم رشد کردند و توانستند بازار را در اختیار بگیرند. حمایت دولت از این موتورها هم در ابتدا بسیار کم بود، ولی الآن از گوگل حمایت می‌شود، به دلیل اینکه گوگل موتور اطلاعاتی دولت است و در واقع به مدیریت اطلاعات در آمریکا کمک می‌کند. در اصل تبلیغات و خلق دانش دو منبع اصلی تأمین درآمد جویشگرها هستند. مدیریت دانش از ضبط گردش اطلاعات و همچنین انباشت آن‌ها شکل می‌گیرد. به عنوان مثال در کدام نقطه از دنیا چه بحثی جستجو می‌شود و این اطلاعات با ارزش و مهم تلقی می‌شود؛ یا اینکه در کدام نقطه از دنیا چه پرسش‌هایی به عنوان پرسش اصلی مردم به شمار می رود و این اطلاعات بر اساس نیاز بخش‌های مختلف ارائه‌شده و کسب درآمد می‌شود.

سوال: نحوه تعامل شرکت‌های دانش بنیان با پروژه‌هایی مانند موتور جستجوی ملی چگونه است؟

جواب: ما به دنبال راه‌اندازی جویشگر ملی با مالکیت دولتی نیستیم و همواره خواسته شده است که این طرح، جویشگر بومی خطاب شود نه جویشگر ملی.  در این طرح سعی می‌شود تا شرکت‌های دانش بنیان در جهت مرتفع ساختن نیازهای منابع انسانی و منابع تجهیزاتی و سرمایه‌ای حمایت شوند. البته این حمایت را در جهتی باید هدایت کنیم تا در اختیار شرکت‌های فعال و پیشرو در این حوزه قرار گیرد که بتوانند ضمن افزایش توانمندی، از سایر فعالین این بخش نیز حمایت کنند. در نهایت ما به دنبال راه‌اندازی جویشگرهای بومی در قالب بخش خصوصی هستیم که این مهم در قالب مشارکت شرکت‌های دانش بنیان اجرایی شکل خواهد گرفت.

سوال: بفرمایید تا کنون رقم حمایت وزارت ارتباطات از موتور جستجوی بومی چه میزان بوده است؟

جواب: ما از سال 86 در دو بخش زیرمجموعه وزارت ارتباطات یعنی مرکز تحقیقات مخابرات و سازمان فناوری اطلاعات در قالب دو پروژه پژوهشی با دانشگاه یزد و دانشگاه امام حسین عقد قرارداد کردیم که قالب پروژه‌ها بسیار کوچک بود، اما رقمی که اخیراً اعلام‌شده یعنی 170 میلیارد تومان، هزینه‌ای بوده است که دولت طی 5 سال آینده در این بخش سرمایه‌گذاری می‌کند و این رقم ممکن است افزایش هم پیدا کند، اما در سال جاری حدود 20 میلیارد تومان از بودجه توسط وزارت خانه تخصیص داده شده است. هزینه‌های فعلی طرح در بخش تجهیزات برای جویشگرهای بومی و خدمات جانبی آن‌ها، اجاره پهنای باند و نگهداری خدمات جویشگرهای بومی است، اما در نهایت بیشترین هزینه در این بخش در زیرساخت بوده است که خریداری سرور و تجهیز مرکز داده انجام ‌شده است.

سوال: آیا پایه‌ریزی برای راه‌اندازی و توسعه موتور جستجوی بومی بر اساس فرهنگ و نیاز کشور بوده است؟

جواب: جایی که سخن از جویشگرهای بومی است، منظور این نیست که از ابتدا کلیه ابزارهای مورد نیاز در جویشگرها طراحی و راه اندازی شوند بلکه جمع‌آوری اطلاعات وب فارسی، نمایه‌سازی و مباحث مرتبط با خط و زبان فارسی که خاص کشور ماست بیشتر اهمیت پیدا می‌کند. در ابتدا که ما شروع کردیم گوگل در این بخش خدمات ضعیفی ارائه می‌کرد و هیچ‌گونه پردازشی روی خط و زبان فارسی انجام نمی‌داد حتی حروف با قلم های عربی و فارسی را تشخیص نمی‌داد، ولی به مرور گوگل در این حوزه سرمایه‌گذاری کرد و در حال حاضر در این بخش از دقت بسیار مناسبی برخوردار است. بنابراین جویشگرهای بومی نیاز به دانش روز دنیا دارند تا بتوانند با دقت و کیفیت مناسب کاربران خود را راضی نمایند. خوشبختانه در حال حاضر جویشگرهای بومی از علم روز دنیا استفاده می‌کنند، ضمن اینکه موضوعات مرتبط با خط و زبان نیز دارای اهمیت بوده و در جویشگرهای بومی به صورت خاص پژوهش می‌شود و این مستلزم نیروی بالای پژوهشی است.

سوال: در خصوص تعامل موتورهای جستجوی بومی با سایر موتورهای جستجو در دنیا توضیح بفرمایید.

جواب: ما بحث همکاری با سایر جویشگرها را در دستور کار داریم و به دنبال مدل همکاری مناسب هستیم. تجربه ما در خط و زبان فارسی طبیعتاً در شرایط بهتری از جویشگرهای خارجی است، ولی تجربه جهانی آن‌ها بیشتر از ماست و ابزارهای آن‌ها از ویژگی‌های بهتری برخوردار است. در نهایت در این بخش می‌توان همکاری مشترکی بین طرفین ایجاد کرد تا ما بتوانیم نیازهای آن‌ها در خط و زبان فارسی را برآورده کنیم و آن‌ها نیز در حوزه زیرساختی و پایه‌ای به ما کمک کنند، که این مورد در کارگروه فنی در حال بررسی است که کشورهای روسیه، چین و کره در دستور کار است. در حال حاضر اکثر سهم بازار ما در اختیار گوگل است و با گوگل هم می‌توانیم نمونه همکاری مناسبی تعریف کنیم، اما تا کنون صحبتی نشده است.

سوال: با توجـــه به فعالیــت جستجوگرهای فعلی که توضیح فرمودید، پیشنهاد شما به سایر فعالان حوزه موتور جستجوی بومی که علاقه‌مند به فعالیت در این حوزه هستند چیست؟

جواب: در طرح جویشگر با توجه به حمایت‌های وزارت ارتباطات و همچنین فعالیت بخش خصوصی سرمایه‌گذاری اولیه در توسعه سکوی خدمات جویشگر متنی شده است و طرح برنامه‌ای برای هزینه جدید در این حوزه ندارد؛ ضمن اینکه از سوی فعالان نیز در این حوزه پیشنهادی دریافت نشده است. همانطوری که قبلاً هم اشاره شد امکان حمایت بیش از سه جویشگر به طور همزمان فراهم نبوده و طبق برنامه طرح این حمایت‌ها باید به تدریج در دو و نهایتاً یک جویشگر متمرکز شود. مسلماً کمبود منابع انسانی و همچنین منابع زیرساختی مهم‌ترین دلیلی است که ما را به سمت محدود کردن حمایت از این جویشگرها و هدایت آن‌ها به سمت اتحاد می‌برد. عقیده بر این است که اگر این شرکت‌ها با الحاق به همدیگر تبدیل به شرکت دانش بنیان بزرگی شوند، مسلماً موفق تر خواهند بود.

سوال: در خصوص جزییات موتورهای جستجوگر فعلی و سهم این موتورها در جستجوی فارسی در اینترنت توضیح فرمایید؟

جواب: به هر حال این خدمات هم اکنون روی وب در دسترس هستند و کاربران هم از داخل شبکه ملی اطلاعات و هم از شبکه اینترنت به این جویشگرها مراجعه می‌کنند. سایر کاربران نیز از مناطق مختلف دنیا وارد یوز و پارسی جو می‌شوند، ولی نکته آن که بازار این موتورها روی اینترنت نخواهد بود. بیشتر بازار آن‌ها باید بر بازار بومی متمرکز باشد؛ یعنی جویشگرهای بومی دنبال خدمات مشابه گوگل نیستند و نباید هم سعی کنند با گوگل رقابت کنند. بلکه باید با ارائه خدمات بومی جذاب رفته‌رفته کاربران را به سمت خود جذب کنند. در حال حاضر جویشگرهای بومی در حوزه فارسی تمرکز دارند ولی ممکن است که بسته به راهبردهای خود در حوزه زبان‌های انگلیسی و عربی هم ورود کنند.

سوال: لطفاً در خصوص پارسی جو و یوز توضیحات تکمیلی ارائه دهید.

جواب: شما وقتی وارد جویشگرها می‌شوید شاید تصوری از ابعاد گسترده این خدمت به ذهن شما نرسد. این جویشگرها واقعاً دنیای عظیمی از منابع پردازشی در پشت سر خوددارند که قادر هستند میلیاردها صفحه را پردازش کرده و پرسش‌های انجام‌شده را در دنیای وب جستجو و نمایش دهند. 
اولین قدم در جویشگرها  یافتن و جمع‌آوری صفحات وب است که اصطلاحاً خزش می‌نامیم. در هنگام خزش نکات زیادی است که باید رعایت شود که با محدودیت منابع و پهنای باند مواجه نشویم. همچنین سرورهای وب نباید از مراجعه زیاد و بی‌موقع ما دچار عصبانیت شده و دسترسی جویشگر را سد کنند. بنابراین سیاست‌ها متفاوت است. یک موتور ممکن است با تعداد کمتری صفحه تمرکز بر کیفیت محتوا داشته باشد. پس خزش جویشگرها بسته به الگوریتم‌ها و سیاست‌ها از یک جویشگر به جویشگر دیگر متفاوت است؛ یعنی خزشی که پارسی جو دارد با یوز متفاوت است. 
مرحله بعد بحث نمایه‌سازی است. اینکه چه کلمات و کلید واژه‌هایی به عنوان نمایه در هر متنی انتخاب شود؟ باز این الگوریتم‌های خاص خودش را دارد و مسائل خط و زبان فارسی نیز مطرح است. در واقع قابلیت جویشگرها با هم متفاوت است که کلید واژه ها را چگونه کنار هم قرار دهند و بتوانند نیاز کاربران را برآورده کنند. در مرحله آخر که اهمیت زیادی دارد، مرحله رتبه بندی است. ممکن است مستندات زیادی باشند که مرتبط با پرسش کاربر باشند. حالا هنر جویشگر این است که این صفحات را به چه ترتیبی نمایش دهد؛ مسلماً پارسی جو و یوز در نمایه‌سازی و رتبه بندی شان با هم متفاوت هستند. اینکه کدام بهتر است؟ طبیعتاً کاربران هستند که تعیین می‌کنند کدام مناسب‌تر هست. 
در خدمات جانبی هم مثل تصویر، ویدئو، خبر و ترجمه ماشینی، این‌ها کاملاً با هم متفاوت‌اند. یعنی یوز روی جستجوی وب، وبلاگ، تصویر و خبر تاکید بیشتری دارد و پارسی جو روی جستجوی وب، تصویر، آوا، نقشه، ویدئو و نهایتاً خبر تاکید دارد. پارسی جو همزمان با نسخه پنجمش هم بحث بازار، کافه کجا و خدمات جدید دانلود را نیز راه‌اندازی کرد که شما می‌توانید روی وب‌گاه آن ملاحظه کنید.
علی‌رغم همه این موارد، موتورهای یوز و پارسی جو خیلی نتوانستند بازار جویش را مقابل گوگل داشته باشند. علتش هم این است که هنوز خدمات بومی و داخلی‌شان به صورت قوی شکل نگرفته است. در نهایت ما به دنبال این هستیم تا با برقراری ارتباط با دارندگان محتوای داخلی و با کمک به ایده‌هایی که می‌تواند به خدمات داخلی منجر شود، جویشگرهای داخلی را در کنار شرکت‌های دانش بنیان قرار دهیم، که حتماً در مراحل بعد اجرایی خواهیم کرد. در نهایت کاربران هستند که باید در استفاده و توسعه این جویشگرها یاری رسانند و تا وقتی که مورد اقبال کاربران قرار نگیرد رشد چندانی نخواهد داشت.

سوال: در رابطه با تولید محتوا توسط این جویشگرها و آغاز مراحل تجاری‌سازی توضیح بفرمایید.

جواب: یکی از موارد با اهمیت همین بحث محتوا و بروز آوری محتواست که از اولویت‌های اصلی طرح است، ولی اینجا چالشی هم وجود دارد؛ چرا که برای بحث محتوا متولیان زیادی داریم. از طرفی به ما گفته می‌شود که در واقع خروجی اصلی طرح جویشگر، محتوا نیست و توسعه محتوا باید در پروژه‌های دیگری دنبال شود، ولی می‌گوییم که اگر محتوای بومی نداشته باشیم در واقع جویشگر بومی خیلی توجیه ندارد و خیلی‌ها هم می‌گویند ما اصلاً گوگل داریم چرا باید جویشگر بومی داشته باشیم؟ آنجاست که آن‌ها درست می‌گویند. پس ما برای اینکه بحث جویشگر بومی را هویت بدهیم باید در واقع محتوای بومی را تقویت کنیم. پس این موضوع بسیار اهمیت دارد و استقبال هم می‌شود اگر هر کسی در واقع پیشنهاد مناسبی در این حوزه داشته باشد مطرح کند. ما در حال حاضر بحث کنسرسیوم ملی محتوا را داریم که می‌تواند راهگشا باشد یا بحث‌های مشابه ای که می‌تواند در سطح ملی یا سطح کوچک تری مطرح شود.

سوال: برای رفع معایب و نقایص جویشگرهای بومی، نحوه انتقال پیشنهادهای مردم به شما چگونه است؟

جواب: این موضوع را سایر مسئولین هم چندین بار تاکید کردند که مردم باید این جویشگرها را استفاده کنند. اگر مردم استفاده نکنند هیچ بهبودی در جویشگرها اتفاق نمی‌افتد. بهبود هم زمانی اتفاق می‌افتد که از سوی مردم پاسخ مناسب دریافت کند. در همین راستا جویشگرها برای جذب کاربران بیشتر، به دقت بازخوردهای کاربران را مطالعه می‌کنند و با توجه به پیشنهادهایی که از کاربران می‌گیرد برنامه‌ریزی توسعه را انجام می‌دهند. در جویشگرها علاوه بر لاگ کاربران، امکان اخذ بازخورد مستقیم در بخش تماس با ما وجود دارد. به عنوان مثال سامانه ترجمه ماشینی ترگمان در پارسی جو قرار داده شده است که اندازه‌گیری ما نشان می‌دهد دقت این ترجمه ماشینی از ترجمه گوگل بهتر است. مسلماً اگر کاربران از این خدمت استفاده کرده و بازخورد خود را ارسال کنند دقت این ترجمه رفته‌رفته بهتر خواهد شد. در کره جنوبی به دلیل استقبال مردمی از جویشگرهای داخلی سهم گوگل بسیار اندک شده و اولویت با جویشگرهای داخلی است که خود باعث بهبود کیفیت خدمات شده است. پس مردم ما هم باید استفاده از جویشگرهای داخلی را در اولویت قرار دهند وگرنه دولت هر چقدر هم سرمایه‌گذاری کند بی‌فایده است.

سوال: در پایان اگر نکته خاصی مطرح نشده است بفرمایید.

جواب: یکی از موارد بنده شفاف‌سازی بودجه بود که شما سؤال کردید. یکی هم بحث افتتاح چند باره پارسی جو بود. ما تا کنون هیچ وقت پارسی جو را افتتاح نکرده بودیم. نسخه‌های قبلی این پروژه از سال 1391 بر روی وب رفته بود و تا کنون هم خدمت دهی در قالب جویشگر متنی را هم داشت، ولی به دلیل نداشتن زیرساخت‌های لازم در پژوهشگاه اقدامی به افتتاح رسمی آن نشده بود. در سال 93 بعد از تخصیص اعتبار به خرید سرورها و اجاره پهنای باند مناسب در مرکز داده پژوهشگاه امکان اعلان عمومی و افتتاح رسمی آن فراهم شد که همزمان با بهره‌برداری از نسخه 5 پارسی جو شد. این پروژه تا به حال تنها از طریق پژوهشگاه تأمین اعتبار شده است و تأمین اعتبار آن از محل طرح، منوط به تأیید شورای راهبری است که در دست بررسی این شورا قرار گرفته است. در خصوص بودجه‌های پژوهشی طرح جویشگر باید بگویم که ما هنوز بودجه‌ای را هزینه نکرده‌ایم. به زودی نتیجه فراخوان اولین دسته پروژه‌ها هم اعلام می‌شود که پارسی جو و یوز و سایرین را شامل می‌شود و رسماً اعلام می‌شود. آن بخشی هم که تاکنون هزینه شده است همانطوریکه توضیح دادم برای خرید تجهیزات مرکز داده و نگهداری موقت خدمات بوده است.

انتهای پیام

به این محتوا امتیاز دهید: 

هنوز رأی ندارید
سیتنا 5
2016-01-25 13:57

افزودن دیدگاه جدید