موتور جست و جو گر تصاویر بومی هم آمد
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی از راهاندازی آزمایشی نخستین موتور جستوجوی تصویری ایرانی با نام «کاوش» خبر داد.
علی احمدی که درباره این حرکت علمی با «ایران» گفت وگو می کرد، افزود: جستوجو در این موتور، هم بر اساس کلید واژه و هم بر اساس تصویر و هم ترکیبی از این دو صورت میگیرد که در داخل کشور بینظیر بوده و در صورت توسعه، قابلیت رقابت با موتورهای جستوجوی بینالمللی را دارد.
«کاوش» یک نام ایرانی
سالهاست که به موازات راهاندازی موتورهای جستوجوی خارجی در اینترنت، مهندسان ایرانی هم به فکر راهاندازی نمونههای داخلی آن بودهاند که بر همین اساس موتورهای جستوجوی ایرانی نظیر «پارسی جو» و «جس جو» ثمره نخستین اقدامها برای راهاندازی موتور جستوجوی بومی است که اگر چه همه آنها امکاناتی نظیر جستوجوی وب را به کاربر ارائه میدهند اما قابلیت لازم برای جستوجوی تصاویر مشابه در آنها وجود ندارد.
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی در گفتوگو با ایران با بیان اینکه جستوجو در «کاوش»، هم بر اساس کلید واژه و هم بر اساس تصویر و هم ترکیبی از این دو صورت میگیرد درباره دلایل راهاندازی آن در کشور گفت: در ابتدای سال 1391 پیشنهاد راهاندازی موتور جستوجو که مبتنی بر محتوای تصویر باشد را در قالب یک طرح پژوهشی به سازمان فناوری اطلاعات زیر مجموعه وزارت ارتباطات و فناوری اطلاعات ارائه کردیم و آنها با توجه به اینکه این موتور جستوجو میتوانست در طرح شبکه ملی اطلاعات مورد استفاده قرار گیرد، استقبال کردند و بر این اساس، اجرای پروژه طراحی و راهاندازی موتور جستوجوی کاوش از تیرماه همان سال آغاز شد. وی افزود: حدود یک سال و سه ماه بعد، راهاندازی آزمایشی موتور جستوجوی «کاوش» روی دامنه فارسی (ir.) و برای حدود یک میلیون صفحه وب فارسی، در مراسمی ویژه و با حضور مسئولان وقت سازمان فناوری اطلاعات صورت گرفت و از آن زمان تاکنون عملیات توسعه سیستم با امکانات دانشگاه ادامه دارد.
احمدی درباره علت نامگذاری این موتور جستوجوی ایرانی به نام «کاوش» خاطر نشان کرد: معنای «کاوش» جستوجو کردن است که یک اسم کاملاً ایرانی بوده و تا به امروز هم از آن استفاده نشده است.
مدیر پروژه جستوجوگر بومی «کاوش» در ادامه به ویژگیهای اصلی این موتور جستوجو اشاره کرد و گفت: ویژگی اصلی این موتور جستوجو که هم در آن مقطع زمانی جدید بود و هم در حال حاضر جزو نیازهای جدی کاربران وب است، این است که ما بتوانیم روی محتوای تصاویر، جستوجو کنیم. در فضای پویایی مانند وب که دائم در حال تغییر و افزایش است، جستوجوی تصویر کار دشواری است و با جستوجو در یک پایگاه تصویری ایستا که یک تعداد مشخصی داده در آن وجود دارد متفاوت است و کار وقتی سختتر میشود که جستوجوی تصاویر بر اساس محتوا یا مشابهتهای تصویری و نه فقط شاخصهای متنی که برای هر تصویر موجود است و اصطلاحاً به آن برچسبهای روی تصویر گفته میشود، صورت گیرد.
وی ادامه داد: در طول اجرای پروژه ترکیبی از سه تیم نرم افزار، پردازش متن و پردازش تصویر روی پروژه کار کردهاند و در نتیجه توانستیم بر اساس حوزههای تعریف شده، در زمان مقرر کار را به سرانجام برسانیم.
احمدی خاطر نشان کرد: راهاندازی اولیه موتور جستوجوی «کاوش» بر مبنای پوشش یک میلیون صفحه وب فارسی انجام شد و برای توسعه سیستم به منظور پوشش صفحات بیشتر نیاز به تجهیزات سخت افزاری و منابع مالی است که سازمان فناوری اطلاعات به عنوان کارفرمای پروژه تلاشهایی را در جهت جذب منابع از بخش دولتی و خصوصی به عمل آورد که با تغییر دولت، این موضوع دچار وقفه شد.
کاوش در رقابت با نمونههای خارجی
«ما تا ماههای اخیر سعی کردیم با سرورها و امکانات سخت افزاری دانشگاه، موتور جستوجو را در فضای وب بالا نگهداریم ولی برای اینکه کاربر هنگام مراجعه بتواند جستوجوی کاملی را انجام بدهد لازم است که پوشش لازم روی تمامی صفحات وب (هم فارسی و هم غیر فارسی) صورت بگیرد تا کاربر احساس ناکارآمدی و بیدقتی نسبت به نتایج جستوجو نداشته باشد و این مستلزم منابع سخت افزاری فراتری است و بر همین اساس ترجیح دادیم که موتور جستوجوی «کاوش» را موقتاً به شبکه داخلی دانشگاه منتقل کنیم تا کار روی پروژه ادامه پیدا کند.»
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی در ادامه گفتوگو با ایران با بیان مطلب فوق و با ذکر اینکه با حمایت مالی در قالب سرمایه گذاری، توانایی این را داریم که موتور جستوجو را از محیط آزمایشی وارد محیط واقعی وب و کاربران واقعی بکنیم گفت: هدف اصلی ما، تمرکز و توجه بیشتر روی ویژگیهای صفحات وب فارسی و همچنین موضوعات مورد علاقه کاربران فارسی زبان در جستوجوهایشان برای بالا بردن دقت و سرعت جستوجوست. احمدی با تأکید بر اینکه در صورت تأمین تجهیزات سخت افزاری و امکانات مالی، موتور جستوجوی «کاوش» میتواند با موتورهای جستوجوی بزرگ رقابت کند تصریح کرد: در الگوریتمهای جستوجوی موتور جستوجوگر «کاوش» امتیازاتی نظیر شناسایی زبان شناسانه ویژگیهای زبان فارسی، سرعت بیشتر در جستوجوی عبارات، حضور سرورها در داخل کشور و در نتیجه سرعت بالای تبادل اطلاعات وجود دارد که کاربر فارسی زبان به مرور ترجیح خواهد داد از آن استفاده کند. وی افزود: اگر چه گوگل مدتی است که جستوجوی تصویریاش را رونمایی کرده است اما اگر این سرویس را تست کرده باشید متوجه خواهید شد که دقت مورد انتظار را ندارد و این حوزه، هنوز فضای کار زیادی دارد.
تلاش یک ساله برای راهاندازی «کاوش»
«موتور جستوجوی «کاوش» حاصل تلاش بیش از یک سال تیمی متشکل از 20 نفر از استادان و اعضای هیأت علمی دانشگاه خواجه نصیرالدین طوسی و دانشجویان مقاطع دکترا، کارشناسی ارشد و کارشناسی گرایشهای نرم افزار و هوش مصنوعی از این دانشگاه و سایر دانشگاههای کشور است. از چالشهای اصلی این پروژه کار کردن با دادههای حجم بالا (Big Data)، مقیاس پذیر کردن پروژه، استفاده از پایگاه دادههای غیر رابطهای (No SQL) و استفاده از الگوریتمهای پردازش موازی بوده است.
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی در بخش دیگری از گفتوگو با ایران با بیان مطلب فوق و با اشاره به ویژگی دیگر موتور جستوجوی «کاوش» گفت: در موتور جستوجوی «کاوش» این امکان وجود دارد که کاربر یک تصویر دلخواه را بارگذاری کرده و موتور بر اساس جستوجو در نمایههای تصویری، تمام تصاویر مشابه آن را برایش استخراج و نمایش دهد. امکان دوم هم که معمولاً بیشتر کاربرد دارد، آن است که کاربر به عنوان مثال کلید واژه «دانشگاه خواجه نصیرالدین طوسی» را وارد میکند و بر همین اساس، موتور جستوجو تمام تصاویر مرتبط با آن را در تمامی صفحاتی که تصاویر دانشگاه خواجه نصیرالدین طوسی قرار دارد، شناسایی و نمایش میدهد تا کاربر بتواند جستوجویش را با انتخاب یکی از این تصاویر و جستوجوی دقیقتر برای تصاویر مشابه آن، تکمیل کند.
احمدی در ادامه با طرح گلایه از متولیان فناوری اطلاعات کشور به خاطر حمایت نکردن جدی از پروژهای با این درجه از اهمیت اظهار داشت: این موتور جستوجو، جزو کارهای ماندگار برای کشور است که در حال حاضر جای آن در فضای وب فارسی بشدت خالی است و گامهای اصلی برای راهاندازی آن تاکنون برداشته شده است و تنها یک اراده ملی لازم است تا کار به نتیجه نهایی برسد. بیش از اینکه بحث بودجه مطرح باشد، خواستن و اراده جدی برای عملیاتی کردن این موتور جستوجوی ملی مطرح است. میتوان گفت این خواست، در حال حاضر در میان متولیان فناوری اطلاعات کشور وجود دارد ولی اراده جدی و قاطع برای اینکه کار جنبه ملی بیابد، هنوز شکل نگرفته است.
مدیر پروژه جستوجوگر بومی «کاوش» در پایان با تأکید بر اینکه در صورت حمایت متولیان فناوری اطلاعات و سرمایهگذاری بخش خصوصی، در یک بازه زمانی 8 ماهه این موتور جستوجوی ملی عملیاتی شده و وارد فضای وب کشور خواهد شد تصریح کرد: ما نباید به یک موتور جستوجو بسنده کنیم و موتورهای دیگر هم باید کارشان را شروع کنند تا از میان آنها یک یا دو موتور که کارآمدتر هستند، مورد اقبال عموم قرار گیرند. من آرزو میکنم قبل از اینکه خیلی دیر شود، موتور جستوجوی «کاوش» عملیاتی شود و زحمتی که دوستان کشیدهاند بیثمر نماند.
اگر چه تاکنون چندین موتور جستوجوی متنی در فضای وب فارسی کار خود را آغاز کرده و برخی هم محکوم به شکست شدهاند اما به نظر میرسد با راهاندازی شبکه ملی اطلاعات تا سال آینده، ضرورت راهاندازی موتورهای جستوجوی ملی در حوزه متن و تصویر همچنان بیشتر از گذشته احساس میشود.