ترفندهاي جستجو در گوگل قسمت اول
مباني جستجوي گوگل:
وقتي شما چند کيورد (Keywords) را با هم جستجو مي کنيد، يک موتور جستجو يک استراتژي از پيش تعيين شده اي براي بررسي و ترکيب کيوردهاي شما دارد. آيا هر يک از کيوردها مي توانند به تنهايي در هر جاي صفحه وجود داشته باشند يا بايد کنار هم قرار گرفته باشند؟ آيا موتور جستجو کلمات کليدي را با هم جستجو مي کند يا تک تک؟
جستجوي يک عبارت:
گوگل به صورت پيش فرض، کلمات کليدي شما را در هر کجاي صفحه، چه کنار هم باشند و چه به صورت پراکنده، جستجو مي کند. براي تغيير نتايج صفحات با کلمات مرتب شده موردنظر ما، آنها را در بين دو کوتيشن قرار مي دهيم.
براي جستجوي کيوردهاي زير:
to be or not to be
گوگل کيوردها را در هر جاي صفحه که آمده باشند، پيدا خواهد کرد. اگر شما مي خواهيد تنها نتايجي را ببينيد که کيوردها با هم و به عنوان يک عبارت در صفحه آمده اند، آنها را در بين دو کوتيشن قرار دهيد:
"to be or not to be"
گوگل در اين حالت تنها نتايجي را نشان مي دهد که کيوردها با هم ظاهر شده اند. البته گوگل کلماتي مثل «or» و «to» را در اين حالت جستجو نميکند.
جستجوي عبارت به اين روش همچنين زماني مفيد است که شما مي خواهيد عبارتي را بيابيد، اما مطمئن نيستيد که جمله بندي عبارت مورد نظر شما درست باشد که اين مطلب که مکمل اين قسمت است در بخش Full-Word Wildcards شرح داده شده است.
اساس بول
يک موتور همه کيوردها يا هر يک از آنها را جستجو مي کند که بر اساس پيش فرض بولي صورت مي گيرد. موتورهاي جستجو مي توانند از AND براي جستجوي همه کيوردها يا OR براي جستجوي هر کلمه استفاده کنند.
در نتيجه حتي اگر موتو جستجو به صورت پيش فرض همه کيوردها را جستجو کند شما مي توانيد معمولا به آن يک دستور خاصي بدهيد تا آن را براي يافتن هر کيورد راهنمايي کنيد.
پيش فرض بولي گوگل AND است، يعني اگر شما کلماتي را بدون اصلاح کننده ها جستجو نماييد همه کلمات شما را با هم جستجو مي نمايد.
به عنوان مثال اگر شما براي کلمات زير جستجو کنيد:
snowblower Honda "Green Bay"
موتور، جستجو را براي همه کيوردها باهم انجام مي دهد. اگر شما مايليد که مشخص کنيد که هر کدام از کلمه ها يا عبارات قابل قبول است يک OR بين هر کدام قرار دهيد:
snowblower OR snowmobile OR "Green Bay"
اگر شما اصطلاحي را به همراه يک يا دو اصطلاح ديگر ميخواهيد، آنها را در پرانتز قرار دهيد مثل:
snowblower (snowmobile OR "Green Bay")
ميتوانيد جستجو براي کلمه snowmobile يا عبارت "Green Bay" به همراه کلمه Snowblower را با پايپ که معادل OR است به صورت زير جستجو کنيد که علامت | پايپ ناميده ميشود:
snowblower (snowmobile | "Green Bay")
خنثي سازي:
اگر شما مايليد که آيتمي در جستجوي شما ظاهر نشود قبل از آن قرار دهيد:
snowblower snowmobile -"Green Bay"
موتور در اين حالت صفحاتي را که شامل snowblower snowmobile هستند و "Green Bay" را در بر ندارند خواهد يافت. نکته اي که بايد به آن توجه کرد، علامت بايد درست قبل از کلمه اي که شما آن را در نتايج نمي خواهيد، بايد قرار بگيرد اگر از فاصله نيز استفاده شود ديگر اين دستور جواب نميدهد.
25 نکته کلیدی جستجوی کلمات فارسی در اینترنت
روشهای معمول جستجو با موتورهای جستجوگر
جستجوي اطلاعات در اينترنت به دو روش ميتواند صورت گيرد يكي استفاده از جملات زبان محاورهاي است و ديگري بكارگيري كلمات كليدي.
استفاده از جملات زبان محاورهاي
در روش استفاده از جملات زبان محاورهاي كه اغلب به كاربران تازهكار پيشنهاد ميشود. يكي از عيبهاي بزرگ اين روش تعداد نتايج جستجوي زيادي است كه بازگردانده ميشود. به همين دليل اين روش توسط كاربران حرفهاي و حتي توسط همه، كمتر استفاده ميشود.
بكارگيري كلمات كليدي
يكي از كاراترين و مقتدرترين روشهاي جستجوي اطلاعات در دنياي وب استفاده از واژههايي است كه اصطلاحاً كلمات كليدي ناميده ميشوند. اغلب كاربران حرفهاي و جستجوگران ورزيده دنياي اينترنت ميتوانند با طرح بهترين كلمات كليدي و بكار بستن قوانين تركيب آنها با هم براي نيازهاي اطلاعاتي خود پاسخي در خور بيابند. در اين روش توصيههاي زير براي انتخاب كلمات كليدي و نيز جستجوي دقيق و مفيد پيشنهاد ميشود كه بشرح ذيل است:
توصیه هایی برای جستجو بهتر در موتورهای جستجو
١- حتيالمقدور سعي شود كلمات كليدي از ميان اصطلاحات منحصر به فرد و اسامي خاص انتخاب شود.
٢- حتيالمقدور از آوردن كلمات عمومي كه عناوين بسياري را در زير مجموعه خود شامل ميشوند، جداً خودداري كنيد.
٣ – هميشه اسم شخص يا نام شي يا هر چيز ديگري را كه مد نظر داريد بهطور كامل وارد كنيد.
٤ – دقت كنيد كه اگر موتور جستجو ميان حروف بزرگ و كوچك تفاوتي ميگذارد، اين مسأله را در طرح كلمات كليدي خود مدنظر داشته باشيد.
٥ – در نظر داشته باشيد اگر نتيجه جستجو صفر بود به احتمال زياد ميتواند از يك اشتباه تايپي باشد.
٦ – اگر املاي صحيح و كامل كلمهاي را نميدانيد از كاركتر جانشين كه اغلب * و يا ؟ است استفاده كنيد.
٧ – اگر يك كلمه كليدي را براي طرح دقيق و تمام و كمال يك مورد جستجو كفايت نميكند، از تكنيكهاي جستجوي عبارتي، استفاده از اپراتورهاي جبر بولين (AND, OR, NOT) استفاده كنيد. جستجوي عبارتي يكي از مهمترين و قدرتمندترين امكانات جستجو در اغلب موتورهاي جستجو ميباشد و ميتوان يك عبارت يا جمله مشخص را به همان ترتيبي كه كلمات وارد شدهاند مورد جستجو قرار داد. براي اين روش جستجو عبارت مورد نظر را داخل گيومه"" بگذاريد.
٨ - استفاده از عملگر AND : and به مفهوم "و" براي محدود كردن دامنه جستجو از طريق تركيب كليد واژههاي مختلف به كار ميرود و براي تركيب كليدهاي جستجو زماني كه براي شما مهم است كه دو يا چند كلمه كليدي حتماً وجود داشته باشد و علامت آن در پايگاههاي مختلف به صورت استفاده از عبارت and، استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت (match on all words and) بهوسيله كليك كردن بر روي دكمههاي راديويي است.
٩– استفاده از عملگر OR: اپراتور OR به مفهوم "يا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازيابي اطلاعات بيشتر شده براي تركيب كليد واژههاي جستجو زماني كه انتظار داريد تنها يك، دو يا چند كلمه كليدي حضور داشته باشند و علامت آن استفاده از عبارت or، نحوهي اجراي ساده و معمولي آن، انتخاب عبارت any of the words از منو، انتخاب عبارت (match on any words or) با كليك بر روي دكمههاي راديويي ميباشد. يكي از كاربردهاي مهم اين عملگر پوشش مفاهيم يا اصطلاحات مترادف، مرتبط يا با املاهاي متفاوت است.
١٠ – استفاده از عملگر NOT: اپراتور Not به مفهوم "نه" و يا به جز كه در اين صورت تمامي جوابهاي بازگشتي كه حاوي عبارت يا كلمه كليدي هستند حذف خواهند گرديد و براي اجراي آن تنها كافيست كه not را قبل از عبارت يا كلمه كليدي مورد نظرتان با يك فاصله بياوريد.
١١ – استفاده از كوتاهسازي كليد واژهها: اين تكنيك به ما امكان ميدهد كه با وارد كردن بخشي از يك كليد واژه بتوانيم مشتقات مختلف آن را نيز در فرآيند جستجو بازيابي كنيم. اكثر موتورهاي جستجو اين تكنيك را با استفاده از علامت ستاره (*) ارايه ميدهند. يكي از مشكلات استفاده از اين تكنيك اين است كه باعث بازيابي اطلاعات غيرمرتبط و ناخواسته زيادي ميشود.
١٢ – استفاده از عملگر نزديكيابي: در بسياري از موارد استفاده از عملگر and باعث بازيابي اطلاعاتي ميشود كه براي ما مفيد نيست. به اين دليل كه اين عملگر كليد واژهها را در هر كجاي متن كه باشند بازيابي ميكند. در اين موارد استفاده از تكنيك نزديكيابي ميتواند از ريزش كاذب اطلاعات و يا بازيابي اطلاعات غيرمرتبط جلوگيري نمايد. همه موتورهاي جستجو قابليت استفاده از اين تكنيك را ندارند ولي به عنوان مثال در موتور جستجوي آلتاويستا ميتوان با استفاده از عملگر NEAR از اين تكنيك استفاده نمود.
١2+1 – جستجوي تركيبي با استفاده از پرانتز: اين تكنيك يكي از مهمترين تكنيكهاي جستجو ميباشد كه به وسيله آن ميتوان تا حدود زيادي از بازيابي موارد غيرمرتبط در محيط وب جلوگيري كرد. در اين روش ميتوان از همه عملگرهاي جستجو كه در بالا گفته شده يكجا استفاده كرد و آنها را با همديگر تركيب نمود.
١٤ – جستجوي كليدواژه در عنوان صفحات وب: اين تكنيك با اين پيش فرض كه عنوان يك صفحه وب تا حدود زيادي نمايانگر محتواي اطلاعات موجود در آن است به جستجوي واژههاي كليدي در عنوان سايتها ميپردازد. علامت آن در موتورهاي جستجو متفاوت است ولي اغلب موتورهاي جستجو از طريق فهرست انتخابي و يا گزينههاي ديگر اين امكان را فراهم ميآورند.
١٥ – جستجوي حوزه سايتها: با توجه به اين كه به صورت قراردادي هر كشوري حوزه خاصي در محيط وب دارد، قابليت جستجوي حوزه سايتها به ما اين امكان را ميدهد كه فرايند جستجو را به حوزه خاصي نظير سايتهاي وب ايران (ir) و يا سايتهاي وب سازمانهاي غير انتفاعي (org) محدود كنيم. دستورات استفاده از اين تكنيك در موتورهاي جستجو مختلف ميباشد.
١٦ – محدود كردن جستجو به زبانهاي مختلف باعث ميشود نتايج جستجو به زبانهاي ديگر آورده نشود و انتخاب مطلب مورد نظر آسانتر است.
١٧ – محدود كردن جستجو به تاريخ انتشار منابع در وب: تاريخ انتشار يا به اصطلاح روزآمدي مطلب به خصوص در منابع علمي اصل مهمي است و اينگونه محدوديت باعث ميشود بنا به نياز كاربر جديدترين و يا قديميترين منبع بازيابي بشود.
١٨ – جستجوي رسانههاي مختلف؛ موسيقي، عكس، ويدئو: زماني كه فقط نوع خاصي از رسانه مورد نياز است به عنوان مثال زماني كه به عكس يك شخصيت نياز داريم، جستجو در ميان عكسها باعث ميشود نتيجه جستجو شامل اطلاعات ديگري در مورد آن شخصيت نباشد.
١٩ – جستجوي صفحات با فرمتهاي مختلف: PDF, Word, MP3, MPEG, ….: زماني كه فرمت خاصي مورد نظر است ميتوان از اين تكنيك استفاده كرد . به عنوان مثال اگر مايل باشيم منبع بازيابي شده در فرمت PDF باشد، اين تكنيك ميتواند مفيد باشد.
٢٠ – آگاهي از پيشفرضهاي جستجو در موتور جستجو: با توجه به اين كه هر موتور جستجو براي تركيب واژهها يك پيشفرض دارد و اگر از هيچ گونه عملگري استفاده نشود، كليد واژهها را به صورت پيشفرض با يكي از عملگرهاي جبر بولي تركيب ميكند؛ آگاهي از اين پيشفرض موتورهاي جستجوي مختلف مهارت ما را در جستجو بالا ميبرد.
٢١ – وب نامريي: وب نامرئي به دو دليل كمي و كيفي اهميت دارد كمي از اين نظر كه موتورهاي جستجو فقط قادر هستند حدود ١٦ درصد از اطلاعات موجود در اينترنت را بازيابي كنند و اندازه وب نامريي تقريبا ٥٠٠ برابر وب مريي است و كيفي از اين نظر كه منابع اطلاعاتي موجود در وب عميق معمولا ارزشمند و مفيد هستند و در بسياري از موارد پاسخگوي نياز كاربران ميباشند. آشنايي با ابزارهايي كه براي شناسايي منابع وب نامريي به وجود آمدهاند و كاربران را به سايتهاي مناسب راهنمايي ميكنند، باعث دسترسي به اين بخش عظيم از اطلاعات مفيد و ارزشمند ميشود. مثل سايت Invisibleweb كه فهرستي از منابع نامريي را و سايت Completeplaset كه فهرستي از تقريبا ٤٠٠٠٠ پايگاه اطلاعاتي وب نامريي را ارايه ميدهد.
22 – اما بدنیست که اشتباهات رایج و متدوال در جستجوگرها و موتورهای جستجو را بدانیم تا از آن گریز کنیم
اشتباهات متداول موتورهای جستجو در یافتن کلمات
موتورهاي جستجو به عنوان يكي از اساسيترين دروازههاي ورود به منابع اينترنتي داراي ضعفهايي هستند كه ميتوان به اين موارد اشاره كرد:
- در يك مجموعه از يافتههاي بازيابي شده مدخلهاي تكراري فراواني ملاحظه ميشود.
- نتايج غير قابل پيشبيني هستند.
- نتايج چه بسا گمراه كننده باشند؛ ممكن است جستجويي در يك موتور كاوش نتيجهاي نداشته، ولي در موتور ديگر داراي يافتههاي فراوان باشد.
- موتورهاي كاوش محتويات پايگاههاي اطلاعاتي خودشان را نشان نميدهند و از معيارهايي كه براي گنجاندن يك مدرك در فايلهايشان دارند حتي شرحي ارايه نميكنند.
- مهار واژگاني وجود ندارد و قواعد نقطهگذاري و بزرگنويسي نيز استاندارد نيست.
- بدون بررسي عملي هر عنصر، اغلب نميتوان ميزان ربط و رابطهها را تحليل كرد. يعني اطلاعات كافي در مدخل نمايه نيست تا فرد بتواند دست به انتخاب بزند.
- عدم توان موتورهاي جستجو در تمايز ميان مداركي كه توسط فرد الف نوشته شده و مداركي كه درباره فرد الف نوشته شده است.
- منابع قابل توجهي در شبكه وب وجود دارند كه توسط موتورهاي جستجو نمايه نميشوند. به اين بخش از وب اصطلاحاً وب نامريي ميگويند. «وب نامريي بخش بزرگي از وب است كه موتورهاي جستجو آنها را نميتوانند نمايه كنند و عبارتند از: سايتهاي داراي رمز عبور، فايلهاي پي.دي.اف از متون آرشيو شده، ابزارهاي تعاملي نظير ماشين حسابها و برخي از واژهنامهها و همچنين بعضي از پايگاههاي اطلاعاتي، منابع محافظت شده از طريق اسم كاربر و گذر واژه، منابع و صفحات وب بدون پيوند و صفحات افزون بر حداكثر تعداد صفحات قابل مرور.»
23- مشکلات خاص فارسی زبانان و ایرانیان در دنیای اینترنت
نبود استاندارد ثابت رسمالخط فارسي موجب اين شده است كه به تعداد صفحات وب فارسي سبك و سياق نگارش به كار رفته باشد، لذا ميتوان چنين ارزيابي كرد كه اكثر وبهاي فارسي در برخي خصوصيات مشترك ميباشند از جمله اين كه نگارش برخي از آنها زبان غيررسمي و محاورهاي است و به خصوص در متون علمي اغلب واژههاي بيگانه به دفعات استفاده ميشود. رسمالخط مورد استفاده نيز متفاوت و سليقهاي است و برخي از آنها غلطهاي تايپي و نگارشي فراواني دارند و اين خصوصيات، اغلب به جهت محدوديتهاي محيط الكترونيكي و عدم تطابق رسمالخط فارسي با آن ميباشد كه نمايهسازي و سپس جستجو به اين زبان را با دشواريهايي رو به رو ميسازد.
24- مشکل عدم اندیکس و نمایه جستجوهای به زبان فارسی
هرچند در حال حاضر راهنمايهايي براي منابع اينترنتي تهيه شده است كه براساس فايلهاي مقلوب ساخته شدهِ توسط موتورهاي جستجو و با استفاده از قابليتهاي مختلف اين موتورها از جمله؛ استفاده از عملگرهاي بولي، جستجوي دقيق عبارت، محدود كردن يك جستجو به بخش خاصي از ركورد (مانند عنوان، آدرس) كوتاهسازي كلمات، جستجوي نزديكيابي واژهها، ايجاد محدوديت زماني و منطقهاي و زباني و .... به جستجوي اطلاعات كمك ميكند اما بايد تاكيد كرد كه در امر بازيابي اطلاعات از اينترنت بدون نمايهسازي نظام يافته نميتوان انتظار بازيابي مفيد و مؤثر را داشت. هرچند بيشترين اطلاعات موجود بر روي اينترنت به زبان انگليسي است، ولي حجم اطلاعات به زبان فارسي نيز با سرعت در حال افزايش است و كاربران به دلايل مختلفي علاقه زيادي به اطلاعات فارسي نشان ميدهند و از آن جايي كه زبان غالب در اينترنت انگليسي است، جستجو به زبانهاي غيرانگليسي از جمله فارسي، مسايل و مشكلات مختلفي را جداي از مشكلات عمومي اينترنت دارد.
25- سخن آخر به همه اهالی دنیای مجازی به فارسی بیاندیشیم
اينترنت به عنوان يك محمل اطلاعاتي عظيم، منابع اطلاعاتي را در مقياسي وسيع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسي به منابع اطلاعاتي اعم از متن و ساير رسانهها عمدهترين مزيت اينترنت محسوب ميشود. اين توانايي كه هر كس ناشر آثار خود باشد عواقب ناخواستهاي را نيز در پي خواهد داشت و آشكارترين معضل، آن است كه انبوهي از منابع بسيار متنوع و غيرقابل مديريت را فراهم ميآورد. افزايش سريع منابع اينترنتي نيازمند يك سازماندهي مفيد و مؤثر است