نكات كليدي جستجو به زبان فارسي
براي جستجوي مطالب فارسي طبق گفته‌هاي پيشين چنانچه آدرس سايت به خصوصي كه در زمينه موضوعي مورد نظر ما فعاليت مي‌كند را داشته باشيم؛ مي‌توان مستقيماً به آن سايت رفته و از مطالب آن استفاده نمود. به عنوان مثال سايت تخصصي برنامه‌نويس مطالب مفيدي در زمينه رايانه و علوم وابسته، به ما ارائه مي‌دهد و يا سايت عمران در زمينه موضوعي عمران فعاليت مي‌نمايد و نيز سايت‌هاي انجمن رياضي در زمينه رياضي، سايت انجمن فيزيك ايران در زمينه فيزيك، سايت انجمن روانشناسي ايران در زمينه روانشناسي و علوم تربيتي فعاليت مي‌نمايند، مركز اطلاعات و مدارك علمي ايران با دارا بودن پايگاه‌هاي اطلاعاتي مختلف مخصوصا پايگاه پايان‌نامه‌ها مي‌تواند مورد استفاده متخصصين تمام رشته‌ها گردد. ولي چنانچه امكان استفاده از اين سايت‌ها نباشد و يا آدرس اين سايت‌ها را نداشته باشيم بايستي مطلب مورد نظر خود را بوسيله يكي از موتورهاي جستجو پيدا بكنيم.
انتخاب موتور جستجو عامل مهمي در فرايند جستجو است. در حال حاضر ابزارهاي كاوش مختلفي در ايران ظهور پيدا كرده اند. ليكن ابزارهاي جستجويي كه امكان جستجوي اطلاعات به زبان فارسي را در اختيار قرار مي‌دهند، محدودند. از طرف ديگر، امكانات و قابليت‌هاي‌ آن‌ها براي بازيابي موثر و مناسب اطلاعات متغير هستند. برخي از ابزارهاي كاوش با امكانات جستجوي فارسي عبارتند از: ان.پي. ايرانNPiran ، ايران‌هوIranhoo ، ايران‌مهرIranMehre ، پارسيك Parseek ، گوگل Google.
در بين ابزارهاي كاوش فوق ، تنها موتور كاوش گوگل داراي برنامه روبات به منظور شناسايي و نمايه سازي صفحات يا سايت هاي وب به زبان فارسي و نمايه سازي خودكار ميباشد و قادر است صفحات فارسي را در قالب يوني‌كد شناسايي و در پايگاه خود نمايه كند و سايت پارسيك نيز از پايگاه گوگل براي جستجو و بازيابي اطلاعات استفاده ميكند. به تعبير ديگر، چهار ابزار كاوش ديگر توسط نمايه‌سازي انساني اداره مي‌شوند و از اين لحاظ راهنماي موضوعي تلقي مي‌شوند و انسان، فرآيند شناسايي، بررسي و نمايه‌سازي سايت‌ها يا صفحات وب را بر عهده دارد.[19]
معمولاً به جهت دامنه وسيع موضوعي و نيز صفحه به زبان فارسي گوگل اكثر كاربران از اين موتور جستجو استفاده مي‌نمايند. براي جستجوي بهتر توجه به نكات زير ضروري به نظر مي‌رسد:
- با تركيب چند واژه كليدي مهم خيلي سريع مي‌توانيم مطلب مورد نظر خود را بدست بياوريم.
- دقت در انتخاب كليد واژه‌ها به طوري‌كه واژه‌هاي انتخابي بطور دقيق نماينده نياز اطلاعاتي ما باشند كمك خواهد كرد تا از نتايج جستجوي گسترده‌اي كه در اكثر موارد بار اطلاعاتي مفيد ندارند دوري گزينيم.
- استفاده از تكنيك جستجوي عبارتي كه در آن عبارت جستجوي مورد نظر خود را داخل گيومه مي‌گذاريم و به اين ترتيب به موتور جستجو مي‌گوييم كه مطلب مورد نظر ما بايستي عين اين عبارت باشد، نيز در محدود كردن نتايج جستجو كمك فراوان مي‌كند.
- استفاده از انواع محدودگرهاي زباني، زماني، مكاني، شكلي، و موضوعي و ... در جستجوي پيشرفته گوگل به ما در رسيدن سريعتر به مطلب مورد نظر كمك فراواني مي‌كند.
- به علت اين كه منابع و اطلاعات موجود در اينترنت بوسيله افراد مختلف و بدون كنترل در شيوه‌هاي رسم‌الخط و بدون ويرايش صاحب‌نظران منتشر مي‌گردد آشنايي با گونه‌هاي مختلف نوشتاري و املاهاي مختلف يك واژه و يا يك مفهوم در زبان فارسي به ما كمك مي‌كند كه با جستجوي گونه‌هاي مختلف نوشتاري يك واژه يا يك مفهوم و استفاده از واژه‌هاي مترادف و متشابه و شكل‌هاي ديگر نوشتاري آن واژه و نيز استفاده از انواع شكل‌هاي جمع و مفرد يك واژه جامعيت جستجوي خود را بالا ببريم . به عنوان مثال براي جستجوي مطلبي در زمينه بتن بايستي آنرا به دو صورت «بتون» و « بتن» جستجو نمائيم تا به تمام مطالبي كه در زمينه بتن مي‌باشد دسترسي داشته باشيم و يا به عنوان مثال دوم براي جستجوي مطلبي در باره «آبگرمكن» براي دستيابي به همه اطلاعات موجود بايستي آن را به چهار شكل زير بنويسيم «آب گرم كن، آب گرمكن، آبگرم كن، آبگرمكن» واضح است كه هر كدام از اين كلمات نتايج متفاوتي را در موتور جستجو بدست مي‌دهد. «استاد، اساتيد، استادان، استادها» «آمريكا، امريكا» «ئيدروژن، هيدروژن» «آنلاين، پيوسته، درون خطي» از مثالهاي ديگري هستند كه جستجو به تمام اين شكل‌ها جامعيت جستجوي ما را زياد مي‌كند و به ما در از دست ندادن مطالب مفيد كمك مي‌كند .
- با استفاده از عملگرهاي بولي، دقت جستجو را بالا برده و نتايج جستجوي كم و مفيدي را بدست بياوريم.
- مترادفات: با استفاده از شكل‌هاي مختلف مترادفات موجود براي يك مفهوم و هم چنين شبه مترادفات و يا حتي گاهي كلمات متضاد مثل بي‌سوادي و سوادآموزي در جستجو مي‌توان جامعيت جستجو را بالا برد.
- اسامي مشهور و اسامي علمي: آگاهي از شكل‌هاي مختلف اسامي علمي و مشهور عاميانه و اسامي تجاري يك پديده و يا وسيله و ... و استفاده از آن‌ها مي‌تواند جامعيت جستجو را بالا ببرد.
- با توجه به اين كه در اكثر وب‌ها از واژه خارجي يك كلمه به همان صورت و با همان الفبا استفاده مي‌شود استفاده از شكل خارجي اين لغات و واژه‌ها نيز مي‌تواند جامعيت جستجوي ما را بالاتر ببرد.
- با توجه به اين كه در برخي از سايت‌ها و نيز وبلاگ‌ها روش خاصي براي رفع مشكلات فارسي پيشنهاد كرده‌اند و واضح است كه خودشان نيز از آن رسم‌الخط استفاده مي‌كنند، آگاهي از اين شكل‌هاي مختلف و جستجو به اين شكل‌ها مي‌تواند باعث جامعيت جستجو گردد. از اين موارد مي‌توان به حذف واو معدوله در برخي سايت‌ها و وبلاگ‌ها اشاره كرد كه به عنوان مثال «خواهر» را به صورت «خاهر» مي‌نويسند و يا حذف تنوين در برخي منابع كه به عنوان مثال «عملاً» را به صورت «عملن» مي‌نويسند.
در نهايت اين كه «در تشكيل صفحات وب فارسي ، جاي يك استاندارد حاكم بر عملكرد تاليف نويسندگان وب، خالي است. استانداردي كه انتخاب بعضي كلمات داراي چندين رسم‌الخط و حتي انتخاب بعضي كلمات كه بر مفاهيم متنوعي دلالت دارند را منحصر به فرد نمايد و مولفان را از طرفي ترغيب به انتخاب گونه زباني مناسب، براي تضمين كيفيت ارتباط و انتقال مؤثر پيام و از طرف ديگر موظف به حفظ سلامت زبان و رعايت استانداردهاي آن به‌عنوان يك وظيفه رسانه‌اي نمايد. ايجاد و گسترش چنين استانداردي به عهده فرهنگستان زبان و ادب فارسي و با هماهنگي انجمن‌ها و شوراهاي علمي يا صنفي انفورماتيك در ايران است. تعويق در تنظيم اين استاندارد ، با توجه به رشد روز افزون وب‌هاي فارسي زبان ، هزينه‌هاي جبران ناپذيري در بر خواهد داشت.