PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : ترفندهاي جستجو در گوگل قسمت اول



sorna
09-19-2011, 10:11 PM
مباني جستجوي گوگل:
وقتي شما چند کيورد (Keywords) را با هم جستجو مي کنيد، يک موتور جستجو يک استراتژي از پيش تعيين شده اي براي بررسي و ترکيب کيوردهاي شما دارد. آيا هر يک از کيوردها مي توانند به تنهايي در هر جاي صفحه وجود داشته باشند يا بايد کنار هم قرار گرفته باشند؟ آيا موتور جستجو کلمات کليدي را با هم جستجو مي کند يا تک تک؟


جستجوي يک عبارت:
گوگل به صورت پيش فرض، کلمات کليدي شما را در هر کجاي صفحه، چه کنار هم باشند و چه به صورت پراکنده، جستجو مي کند. براي تغيير نتايج صفحات با کلمات مرتب شده موردنظر ما، آنها را در بين دو کوتيشن قرار مي دهيم.

براي جستجوي کيوردهاي زير:
to be or not to be

گوگل کيوردها را در هر جاي صفحه که آمده باشند، پيدا خواهد کرد. اگر شما مي خواهيد تنها نتايجي را ببينيد که کيوردها با هم و به عنوان يک عبارت در صفحه آمده اند، آنها را در بين دو کوتيشن قرار دهيد:
"to be or not to be"

گوگل در اين حالت تنها نتايجي را نشان مي دهد که کيوردها با هم ظاهر شده اند. البته گوگل کلماتي مثل «or» و «to» را در اين حالت جستجو نميکند.
جستجوي عبارت به اين روش همچنين زماني مفيد است که شما مي خواهيد عبارتي را بيابيد، اما مطمئن نيستيد که جمله بندي عبارت مورد نظر شما درست باشد که اين مطلب که مکمل اين قسمت است در بخش Full-Word Wildcards شرح داده شده است.


اساس بول
يک موتور همه کيوردها يا هر يک از آنها را جستجو مي کند که بر اساس پيش فرض بولي صورت مي گيرد. موتورهاي جستجو مي توانند از AND براي جستجوي همه کيوردها يا OR براي جستجوي هر کلمه استفاده کنند.
در نتيجه حتي اگر موتو جستجو به صورت پيش فرض همه کيوردها را جستجو کند شما مي توانيد معمولا به آن يک دستور خاصي بدهيد تا آن را براي يافتن هر کيورد راهنمايي کنيد.

پيش فرض بولي گوگل AND است، يعني اگر شما کلماتي را بدون اصلاح کننده ها جستجو نماييد همه کلمات شما را با هم جستجو مي نمايد.
به عنوان مثال اگر شما براي کلمات زير جستجو کنيد:
snowblower Honda "Green Bay"

موتور، جستجو را براي همه کيوردها باهم انجام مي دهد. اگر شما مايليد که مشخص کنيد که هر کدام از کلمه ها يا عبارات قابل قبول است يک OR بين هر کدام قرار دهيد:
snowblower OR snowmobile OR "Green Bay"

اگر شما اصطلاحي را به همراه يک يا دو اصطلاح ديگر ميخواهيد، آنها را در پرانتز قرار دهيد مثل:
snowblower (snowmobile OR "Green Bay")


ميتوانيد جستجو براي کلمه snowmobile يا عبارت "Green Bay" به همراه کلمه Snowblower را با پايپ که معادل OR است به صورت زير جستجو کنيد که علامت | پايپ ناميده ميشود:
snowblower (snowmobile | "Green Bay")


خنثي سازي:
اگر شما مايليد که آيتمي در جستجوي شما ظاهر نشود قبل از آن قرار دهيد:
snowblower snowmobile -"Green Bay"

موتور در اين حالت صفحاتي را که شامل snowblower snowmobile هستند و "Green Bay" را در بر ندارند خواهد يافت. نکته اي که بايد به آن توجه کرد، علامت بايد درست قبل از کلمه اي که شما آن را در نتايج نمي خواهيد، بايد قرار بگيرد اگر از فاصله نيز استفاده شود ديگر اين دستور جواب نميدهد.

sorna
09-19-2011, 10:11 PM
دخالت آشکار:
روي هم رفته گوگل براي تمام کيوردها و عباراتي که شما مشخص مي کنيد، جستجو را انجام خواهد داد (به جز آنهايي که شما با علامت آن ها را ناديده گرفته ايد) گرچه کلمات معيني وجود دارد که گوگل آنها را به دليل رواج زياد در جستجو ناديده مي گيرد. اين لغات به شرح زير هستند که لغات توقف ناميده مي شوند.
"I", "a", "the", "of"

شما مي توانيد با اضافه کردن کاراکتر + گوگل را وادار کنيد که کلمات توقف را نيز در نظر بگيرد:
+the king

همچنين کلمات توقفي که داخل عبارت کوتيشن دار نوشته مي شوند، ناديده گرفته نمي شوند مثل:
"the move" glam

که نتايجي دقيقتر از نتيجه زير دارد:
the move glam

طبعا به خاطر اينکه گوگل کلمه the را در جستجوي اول در نظر گرفته است، اما در دومي آن را ناديده گرفته است.


مترادف ها:
گاهي اوقات شما احساس مي کنيد که شما از بعضي نتايج مفيد بي بهره مانده ايد، زيرا کيورد يا کيوردهايي که شما انتخاب کرده ايد، تنها راه بيان آنچه که به دنبالش هستيد، نيستند. اپراتور مترادف گوگل کاراکتر ~ است که زماني که هر تعداد کيورد در جستجوي شما بيايد از گوگل مي خواهد که تنها معادل هاي دقيق را در نظر نگيرد، بلکه آنچه گوگل فکر مي کند که هم معني و مترادف کيوردها هستند را نيز، در بر گيرد.
مثل جستجو براي:
~ape

که نتايجي را با کلماتي از قبيل ميمون، گوريل، شانپانزه و ... (چه به صورت مفرد و چه به صورت جمع) در بر خواهد داشت که ميمون يا خويشاوندان متناسب با او را در بر دارد چنانکه گويا شما سرچ کرده ايد براي:
monkey gorilla chimpanzee

که حتي شامل بعضي چيزها است که حتي فکرش را هم نمي کرديد. گوگل به صورت الگوريتمي مترادف ها را مي شناسد بنابراين شما از يافتن نتايجي از کلماتي نزديک، که حتي گنجينه لغات شما آنها را در بر ندارد، شگفت زده خواهيد شد. (مترادفات به صورت حروف ضخيم که نزديک کلمه مورد نظر شما در صفحه نتايج است، نشان داده مي شوند. بنابراين به راحتي قابل تشخيص اند.)


رنج عددي:
يکي از مشکل ترين چيزها براي نشان دادن در يک جستجوي اينترنتي مقادير تاريخ و پول و اندازه و وزن و ارتفاع يا هر جفت ارزش اختياري است.
اپراتور مقادير عددي که .. است نتايجي را که در مقادير عددي معين شده جستجو مي نمايد. آيا به دنبال يک جفت پمپ پرادا با سايز 5 يا 6 هستيد؟ اين يکي را براي سايز امتحان کنيد:
prada pumps size 5..6

شايد شما به دنبال هزينه کرئن 800 تا 1000 دلار براي يک دوربين ديجيتال قشنگ اس ال آر هستيد، سرچ کنيد براي:
slr digital camera 3..5 megapixel $800..1000


يک چيزي که بايد به خاطر داشت اين است که هميشه يکسري راهنما را به عنوان معني مقادير تامين نماييد، مثل سايز يا مگاپيکسل يا کيلوگرم و ... شما هم چنين مي توانيد دستور مقدار عددي را فقط با يک عدد به کار ببريد که آن را به مينيمم يا ماکزيمم عبارت تبديل مي کند. آيا شما مي خواهيد خشکي مانتانا که حداقل 500 زمين است بيابيد؟ مشکلي نيست:
acres Montana land 500..


جستجوي آسان و جست و جوي با بخت و اقبال:
کليد جستجوي با بخت و اقبال چيز قشنگي است. در برابر دادن يک ليست نتايج جستجو که انتخاب مي شوند و به شما داده مي شوند. شما با جاروب آنچه گوگل فکر مي کند که بيشتر براي داده جستجو شده شما متناسبند، مواجه خواهيد بود. کلمه واشنگتن پست را تايپ کنيد و دکمه جستجو با بخت و اقبال را بزنيد که شما را مستقيم به washingtonpost.com مي برد و اگر کلمه پريزيدنت را تايپ کنيد شما را مستقيم به سايت whitehouse.gov مي برد.


حساسيت به وضعيت:
بعضي موتورهاي جستجو نسبت به وضعيت حروف حساس هستند، اما گوگل حساس به آن نيست و حروف زير همگي براي گوگل يکسانند:
Three, three, ThrEE, ThrEE

sorna
09-19-2011, 10:11 PM
بعضي از موتورهاي جستجو تكنيكي به نام Stemming را پشتيباني مي كنند كه تكنيكي است كه معمولا با اضافه كردن * يا گاهي ؟ به عبارت موردنظر از موتور جستجو درخواست مي كند كه به جاي اين علامت، مشتقات آن را جستجو كند.

به عنوان مثال جستجوي moon* نتايجي مثل moons, moonlight, moonshot را در برخواهد داشت.
گوگل از اين ويژگي به طور صريح استفاده نمي كند. ولي زماني كه شما جاي يك كلمه را در عبارتي نمي دانيد، مي توانيد از * استفاده كنيد كه از اين ستاره به معناي جانشين يك كلمه كامل در گوگل، برداشت مي شود. بنابراين طبق گفته هاي بالا جستجو براي "three * mice" موارد زير را در نتايج خواهد داشت:
finds three blind mice, three blue mice, three green mice,

چقدر اين ويژگي گوگل بدرد مي خورد؛ مطمئنا به اندازه ويژگي stemming مفيد نيست ولي بازهم موجب گيج شدن مبتديان نمي شود. يك * يك جانشين براي يك كلمه است، دو * به معناي دو كلمه و ...


اين ويژگي در موارد زير قابل استفاده است:


1- فائق آمدن بر محدوديت 10 كلمه گوگل ( در گوگل عبارت هايي كه بين دو كوتيشن قرار مي گيرد، نبايد بيش از 10 كلمه باشد) شما اين مثال ها را (مثلا عبارت Fourscore and seven years ago, our fathers brought forth on this continent) كه زياد براي پيدا كردن يك شعر يا نقل قول تكرار مي شوند را، اگر امتحان كنيد، گوگل تنها تا كلمه on عمل جستجو را انجام خواهد داد و همه آنچه بعد از آن مي آيد، توسط گوگل ناديده گرفته مي شود.


2-بررسي تكرار يك عبارت معين يا مشتق عبارت مثل: (درباره دستور اين تايتل بعدا توضيح داده خواهد شد)
intitle:"methinks the * doth protest too much"

و يا
intitle: "the * of Seville"


3- پر كردن جاهاي خالي حافظه يك آدم حواس پرت! شايد شما فقط يك قسمت كوتاه يك ترانه را به ياد بياوريد كه جستجو تنها از آنچه شما به يا مي آوريد، به جاي بازسازي تصادفي استفاده مي كند.
بياييد يك مثالي را مرور كنيم، سرود "Good Times" كه توسط چيك سروده شده است، كه خط زير را بيان ميكند:
"You silly fool, you can't change your fate."

شايد شما يك ترانه را گوش كرده ايد، اما شما يادتان نمي ايد كه كلمه fool درست است يا چيز ديگري بوده، اگر شما اشتباه كرده باشيد ( اگر درستش به عنوان مثال "You silly child, you can't change your fate" باشد) شما هيچ جوابي نخواهيد يافت.


راه حل استفاده از ويژگي گوگل است كه به جاي آن كلمه سرچ كنيم:
"You silly *, you can't change your fate"

شما اين تكنيك را مي توانيد براي نقل قول ها و شعرهاي غنايي و ... به كار ببريد، شما بايد حواستان را جمع كنيد که به اندازه كافي از متن نقل قول را سرچ كنيد تا به يك نتيجه واحد برسيد. مثلا عبارت زير كه قسمتي از مثال بالاست نتايج زيادي در بر خواهد داشت:
"you * fool"

sorna
09-19-2011, 10:12 PM
دستورات و المان هاي خاص: علاوه بر OR و AND و جستجو هاي عبارتي، Google دستورهاي خاص زيادي را براي محدود نمودن جستجوي شما فراهم نموده است.
همانند همه موتورهاي جستجوي Full Text، در گوگل به جاي اينکه صفحات وب تنها بر اساس عنوان و توضيحات انها ايندکس شوند، صفحات وب کلا ايندکس مي گردند. دستورهاي خاص به کاربران گوگل اجازه مي دهند که جاهاي معيني از صفحات وب را براي اطلاعات به خصوصي، جستجو
نمايند، و اين اجازه را به کاربران گوگل مي دهند که بتوانند جاهاي معيني از صفحات وب را براي اطلاعات به خصوصي، جستجو نمايند (که آن ها اپراتورهاي پيشرفته نيز ناميده مي شوند). اين ويژگي (دستورات و المانهاي خاص) خيلي چاره ساز است مخصوصا زماني که شما با بيش از 8 بيليون صفحه وب مواجهيد و مي خواهيد دامنه جستجوي خود را محدودتر نماييد!


مثلا ذکر اينکه اينکه کلمات عبارت مورد نظر شما تنها بايستي در عنوان يا URL صفحات وب باشد، مي تواند کمک شاياني به شما براي به دست
اوردن نتايج بسيار خاص داشته باشد. در ادامه مطلب به شرح برخي از المان هاي دستوري معمول خواهيم پرداخت:


intitle:
اين المان جستجوي شما را به عنوان صفحات وب محدود مي کند و متغير allintitle: صفحاتي که عنوانشان تمام کلمات ذکر شده جستجو را دربردارد را پيدا مي کند و هر دو دستور، قبل کيوردها استفاده مي شوند.
intitle:"windows xp"
allintitle:"windows xp" microsoft


همچنين ممکن است شما ترجيح دهيد از دستور allintitle: استفاده نکنيد، چون در ترکيب با دستورات ديگر ممکن است خوب کار نکند.


site:
اين دستور به کاربر اجازه مي دهد که جستجوي خود را به يک سايت محدود نمايد.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us

نکته اي که تذکرش لازم است اين است که اين دستور، دستور خوبي براي يک وب سايتي که شامل زيرشاخه هايي (مثل /~sam/album/ ) است، نمي باشد. مثلا شما نميتوانيد با دستور site: همه صفحات را در http://www.geocities.com/test/test1/6485 بيابيد و گوگل هيچ
نتيجه اي براي جستجوي شما نخواهد يافت. به جاي اين دستور، دستور inurl: پيشنهاد مي شود.


inurl:
اين دستور جستجوي شما را به URL صفحات وب محدود مي کند. اين دستور براي يافتن صفحات help بسيار خوب کار مي کند، زيرا آن ها نسبتا در
ساختار خود منظم اند و allinurl: متغيري است که همه کلمات ليست شده در URL را پيدا مي کند ولي در ترکيب با دستورت ديگر خوب کار نمي کند.
inurl:help
allinurl:search help


همانطور که مي بينيد استفاده inurl: به جاي site: يک مزيت ضروري دارد و آن اينست که شما مي توانيد از آن براي جستجوي ساب دايرکتوري ها (زيرفهرست ها) نيز استفاده نماييد.


تذکر: در استفاده از دستور inurl: براي داشتن نتايج بيشتر از //:http استفاده نکنيد.


همچنين شما مي توانيد inurl: را در ترکيب با site: به کار بريد تا بتوانيد اطلاعات ساب دامين ها (زيردامنه ها) را استخراج نماييد. براي مثال opensource.org چند تا ساب دامين دارد؟ يک جستار سريع به شما کمک مي کند تا به پاسخ اين جواب برسيد:


site:opensource.org -inurl:www.opensource.org


اين جستجو از گوگل ميخواهد تا تمام صفحات دامنه opensource.org را ليست کند، اما صفحاتي را که از زير دامنه معمول www هستند و شما آن ها را قبلا ديده بوديد، ناديده بگيريد.


link:
اين دستور فهرستي از صفحاتي که به URL تعيين شده لينک داده اند را، مي يابد. اگر link: را وارد کنيد شما به فهرستي از صفحاتي که به
صفحه گوگل لينک داده اند، دست مي يابد ( نه در هر جاي دامنه google.com ) نگران نباشيد اگر ادرس شما با //:http همراه نباشد، شما
به آن نيازي نداريد. بنابراين اگر ادرس شما //:http هم داشت، باز گوگل آن را ناديده مي گيرد. اين دستور به خوبي با هر URL با محتواي بزرگ کار
مي کند. مثلا سرعت جستجويش در http://www.opensource.org/test/test1 فرقي با بالاترين مرتبه سايت، مثل opensource.org ندارد.


cache:
اين دستور يک کپي از صفحه اي که در گوگل ايندکس گذاري شده است را، مي يابد. حتي اگر آن صفحه ديگر در URL اصلي در دسترس نباشد يا
محتوايش به کلي تغيير کرده باشد.
cache:www.yahoo.com

catch گوگل مخصوصا براي باز يافتن نگارش قبلي يک صفحه که بارها تغيير مي کند، مناسب است.


daterange:
اين دستور جستجوي شما را به تاريخ به خصوصي يا يک محدوده تاريخي که صفحه در گوگل ايندکس گذاري شده، محدود مي نمايد. بايد در نظر داشت که اين جستجو، کاري به تاريخي که يک صفحه ساخته شده است، ندارد و تنها بر مبناي تاريخ ايندکس گذاري در گوگل، عمل مي کند.
"Microsoft" "Windows XP" daterange:2450958-2450968

borhan_3010
01-17-2012, 01:27 AM
روشهای معمول جستجو با موتورهای جستجوگر

جستجوي اطلاعات در اينترنت به دو روش مي‌تواند صورت گيرد يكي استفاده از جملات زبان محاوره‌اي است و ديگري بكارگيري كلمات كليدي.

استفاده از جملات زبان محاوره‌اي

در روش استفاده از جملات زبان محاوره‌اي كه اغلب به كاربران تازه‌كار پيشنهاد مي‌شود. يكي از عيب‌هاي بزرگ اين روش تعداد نتايج جستجوي زيادي است كه بازگردانده مي‌شود. به همين دليل اين روش توسط كاربران حرفه‌اي و حتي توسط همه، كم‌تر استفاده مي‌شود.

بكارگيري كلمات كليدي

يكي از كاراترين و مقتدرترين روش‌هاي جستجوي اطلاعات در دنياي وب استفاده از واژه‌هايي است كه اصطلاحاً كلمات كليدي ناميده مي‌شوند. اغلب كاربران حرفه‌اي و جستجوگران ورزيده دنياي اينترنت مي‌توانند با طرح بهترين كلمات كليدي و بكار بستن قوانين تركيب آن‌ها با هم براي نيازهاي اطلاعاتي خود پاسخي در خور بيابند. در اين روش توصيه‌هاي زير براي انتخاب كلمات كليدي و نيز جستجوي دقيق و مفيد پيشنهاد مي‌شود كه بشرح ذيل است:

توصیه هایی برای جستجو بهتر در موتورهای جستجو

‌١- حتي‌المقدور سعي شود كلمات كليدي از ميان اصطلاحات منحصر به فرد و اسامي خاص انتخاب شود.

‌٢- حتي‌المقدور از آوردن كلمات عمومي كه عناوين بسياري را در زير مجموعه خود شامل مي‌شوند، جداً خودداري كنيد.

‌٣ – هميشه اسم شخص يا نام شي يا هر چيز ديگري را كه مد نظر داريد به‌طور كامل وارد كنيد.

‌٤ – دقت كنيد كه اگر موتور جستجو ميان حروف بزرگ و كوچك تفاوتي مي‌گذارد، اين مسأله را در طرح كلمات كليدي خود مدنظر داشته باشيد.

‌٥ – در نظر داشته باشيد اگر نتيجه جستجو صفر بود به احتمال زياد مي‌تواند از يك اشتباه تايپي باشد.

‌٦ – اگر املاي صحيح و كامل كلمه‌اي را نمي‌دانيد از كاركتر جانشين كه اغلب * و يا ؟ است استفاده كنيد.

‌٧ – اگر يك كلمه كليدي را براي طرح دقيق و تمام و كمال يك مورد جستجو كفايت نمي‌كند، از تكنيك‌هاي جستجوي عبارتي، استفاده از اپراتورهاي جبر بولين (AND, OR, NOT) استفاده كنيد. جستجوي عبارتي يكي از مهم‌ترين و قدرتمندترين امكانات جستجو در اغلب موتورهاي جستجو مي‌باشد و مي‌توان يك عبارت يا جمله مشخص را به همان ترتيبي كه كلمات وارد شده‌اند مورد جستجو قرار داد. براي اين روش جستجو عبارت مورد نظر را داخل گيومه"" بگذاريد.

‌٨ - استفاده از عملگر AND : and به مفهوم "و" براي محدود كردن دامنه جستجو از طريق تركيب كليد واژه‌هاي مختلف به كار مي‌رود و براي تركيب كليدهاي جستجو زماني ‌كه براي شما مهم است كه دو يا چند كلمه كليدي حتماً وجود داشته باشد و علامت آن در پايگاه‌هاي مختلف به صورت استفاده از عبارت and، استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت (match on all words and) به‌وسيله كليك كردن بر روي دكمه‌هاي راديويي است.

‌٩– استفاده از عملگر OR: اپراتور OR به مفهوم "يا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازيابي اطلاعات بيش‌تر شده براي تركيب كليد واژه‌هاي جستجو زماني كه انتظار داريد تنها يك، دو يا چند كلمه كليدي حضور داشته باشند و علامت آن استفاده از عبارت or، نحوه‌ي اجراي ساده و معمولي آن، انتخاب عبارت any of the words از منو، انتخاب عبارت (match on any words or) با كليك بر روي دكمه‌هاي راديويي مي‌باشد. يكي از كاربردهاي مهم اين عملگر پوشش مفاهيم يا اصطلاحات مترادف، مرتبط يا با املاهاي متفاوت است.

‌١٠ – استفاده از عملگر NOT: اپراتور Not به مفهوم "نه" و يا به جز كه در اين صورت تمامي جواب‌هاي بازگشتي كه حاوي عبارت يا كلمه كليدي هستند حذف خواهند گرديد و براي اجراي آن تنها كافيست كه not را قبل از عبارت يا كلمه كليدي مورد نظرتان با يك فاصله بياوريد.

‌١١ – استفاده از كوتاه‌سازي كليد واژه‌ها: اين تكنيك به ما امكان مي‌دهد كه با وارد كردن بخشي از يك كليد واژه بتوانيم مشتقات مختلف آن را نيز در فرآيند جستجو بازيابي كنيم. اكثر موتورهاي جستجو اين تكنيك را با استفاده از علامت ستاره (*) ارايه مي‌دهند. يكي از مشكلات استفاده از اين تكنيك اين است كه باعث بازيابي اطلاعات غيرمرتبط و ناخواسته زيادي مي‌شود.

‌١٢ – استفاده از عملگر نزديك‌يابي: در بسياري از موارد استفاده از عملگر and باعث بازيابي اطلاعاتي مي‌شود كه براي ما مفيد نيست. به اين دليل كه اين عملگر كليد واژه‌ها را در هر كجاي متن كه باشند بازيابي مي‌كند. در اين موارد استفاده از تكنيك نزديك‌يابي مي‌تواند از ريزش كاذب اطلاعات و يا بازيابي اطلاعات غيرمرتبط جلوگيري نمايد. همه موتورهاي جستجو قابليت استفاده از اين تكنيك را ندارند ولي به عنوان مثال در موتور جستجوي آلتاويستا مي‌توان با استفاده از عملگر NEAR از اين تكنيك استفاده نمود.

‌١2+1 – جستجوي تركيبي با استفاده از پرانتز: اين تكنيك يكي از مهم‌ترين تكنيك‌هاي جستجو مي‌باشد كه به وسيله آن مي‌توان تا حدود زيادي از بازيابي موارد غيرمرتبط در محيط وب جلوگيري كرد. در اين روش مي‌توان از همه عملگرهاي جستجو كه در بالا گفته شده يك‌جا استفاده كرد و آن‌ها را با هم‌ديگر تركيب نمود.

‌١٤ – جستجوي كليدواژه در عنوان صفحات وب: اين تكنيك با اين پيش فرض كه عنوان يك صفحه وب تا حدود زيادي نمايان‌گر محتواي اطلاعات موجود در آن است به جستجوي واژه‌هاي كليدي در عنوان سايت‌ها مي‌پردازد. علامت آن در موتورهاي جستجو متفاوت است ولي اغلب موتورهاي جستجو از طريق فهرست انتخابي و يا گزينه‌هاي ديگر اين امكان را فراهم مي‌آورند.

‌١٥ – جستجوي حوزه سايت‌ها: با توجه به اين‌ كه به صورت قراردادي هر كشوري حوزه خاصي در محيط وب دارد، قابليت جستجوي حوزه سايت‌ها به ما اين امكان را مي‌دهد كه فرايند جستجو را به حوزه خاصي نظير سايت‌هاي وب ايران (ir) و يا سايت‌هاي وب سازمان‌هاي غير انتفاعي (org) محدود كنيم. دستورات استفاده از اين تكنيك در موتورهاي جستجو مختلف مي‌باشد.

‌١٦ – محدود كردن جستجو به زبان‌هاي مختلف باعث مي‌شود نتايج جستجو به زبان‌هاي ديگر آورده نشود و انتخاب مطلب مورد نظر آسان‌تر است.

‌١٧ – محدود كردن جستجو به تاريخ انتشار منابع در وب: تاريخ انتشار يا به اصطلاح روزآمدي مطلب به خصوص در منابع علمي اصل مهمي است و اين‌گونه محدوديت باعث مي‌شود بنا به نياز كاربر جديدترين و يا قديمي‌ترين منبع بازيابي بشود.

‌١٨ – جستجوي رسانه‌هاي مختلف؛ موسيقي، عكس، ويدئو: زماني‌ كه فقط نوع خاصي از رسانه مورد نياز است به عنوان مثال زماني كه به عكس يك شخصيت نياز داريم، جستجو در ميان عكس‌ها باعث مي‌شود نتيجه جستجو شامل اطلاعات ديگري در مورد آن شخصيت نباشد.

‌١٩ – جستجوي صفحات با فرمت‌هاي مختلف: PDF, Word, MP3, MPEG, ….: زماني كه فرمت خاصي مورد نظر است مي‌توان از اين تكنيك استفاده كرد . به عنوان مثال اگر مايل باشيم منبع بازيابي شده در فرمت PDF باشد، اين تكنيك مي‌تواند مفيد باشد.

‌٢٠ – آگاهي از پيش‌فرض‌هاي جستجو در موتور جستجو: با توجه به اين كه هر موتور جستجو براي تركيب واژه‌ها يك پيش‌فرض دارد و اگر از هيچ گونه عملگري استفاده نشود، كليد واژه‌ها را به صورت پيش‌فرض با يكي از عملگرهاي جبر بولي تركيب مي‌كند؛ آگاهي از اين پيش‌فرض‌ موتورهاي جستجوي مختلف مهارت ما را در جستجو بالا مي‌برد.

‌٢١ – وب نامريي: وب نامرئي به دو دليل كمي و كيفي اهميت دارد كمي از اين نظر كه موتورهاي جستجو فقط قادر هستند حدود ‌١٦ درصد از اطلاعات موجود در اينترنت را بازيابي كنند و اندازه وب نامريي تقريبا ‌٥٠٠ برابر وب مريي است و كيفي از اين نظر كه منابع اطلاعاتي موجود در وب عميق معمولا ارزشمند و مفيد هستند و در بسياري از موارد پاسخ‌گوي نياز كاربران مي‌باشند. آشنايي با ابزارهايي كه براي شناسايي منابع وب نامريي به وجود آمده‌اند و كاربران را به سايت‌هاي مناسب راهنمايي مي‌كنند، باعث دسترسي به اين بخش عظيم از اطلاعات مفيد و ارزشمند مي‌شود. مثل سايت Invisibleweb كه فهرستي از منابع نامريي را و سايت Completeplaset كه فهرستي از تقريبا ‌٤٠٠٠٠ پايگاه اطلاعاتي وب نامريي را ارايه مي‌دهد.

22 – اما بدنیست که اشتباهات رایج و متدوال در جستجوگرها و موتورهای جستجو را بدانیم تا از آن گریز کنیم

اشتباهات متداول موتورهای جستجو در یافتن کلمات

موتورهاي جستجو به عنوان يكي از اساسي‌ترين دروازه‌هاي ورود به منابع اينترنتي داراي ضعف‌هايي هستند كه مي‌توان به اين موارد اشاره كرد:

- در يك مجموعه از يافته‌هاي بازيابي شده مدخل‌هاي تكراري فراواني ملاحظه مي‌شود.

- نتايج غير قابل پيش‌بيني هستند.

- نتايج چه بسا گمراه كننده باشند؛ ممكن است جستجويي در يك موتور كاوش نتيجه‌اي نداشته، ولي در موتور ديگر داراي يافته‌هاي فراوان باشد.

- موتورهاي كاوش محتويات پايگاه‌هاي اطلاعاتي خودشان را نشان نمي‌دهند و از معيارهايي كه براي گنجاندن يك مدرك در فايل‌هايشان دارند حتي شرحي ارايه نمي‌كنند.

- مهار واژگاني وجود ندارد و قواعد نقطه‌گذاري و بزرگ‌نويسي نيز استاندارد نيست.

- بدون بررسي عملي هر عنصر، اغلب نمي‌توان ميزان ربط و رابطه‌ها را تحليل كرد. يعني اطلاعات كافي در مدخل نمايه نيست تا فرد بتواند دست به انتخاب بزند.

- عدم توان موتورهاي جستجو در تمايز ميان مداركي كه توسط فرد الف نوشته شده و مداركي كه درباره فرد الف نوشته شده است.

- منابع قابل توجهي در شبكه وب وجود دارند كه توسط موتورهاي جستجو نمايه نمي‌شوند. به اين بخش از وب اصطلاحاً وب نامريي مي‌گويند. «وب نامريي بخش بزرگي از وب است كه موتورهاي جستجو آن‌ها را نمي‌توانند نمايه كنند و عبارتند از: سايت‌هاي داراي رمز عبور، فايل‌هاي پي.دي.اف از متون آرشيو شده، ابزارهاي تعاملي نظير ماشين حساب‌ها و برخي از واژه‌نامه‌ها و هم‌چنين بعضي از پايگاه‌هاي اطلاعاتي، منابع محافظت شده از طريق اسم كاربر و گذر واژه، منابع و صفحات وب بدون پيوند و صفحات افزون بر حداكثر تعداد صفحات قابل مرور.»

23- مشکلات خاص فارسی زبانان و ایرانیان در دنیای اینترنت

نبود استاندارد ثابت رسم‌الخط فارسي موجب اين شده است كه به تعداد صفحات وب فارسي سبك و سياق نگارش به كار رفته باشد، لذا مي‌توان چنين ارزيابي كرد كه اكثر وب‌هاي فارسي در برخي خصوصيات مشترك مي‌باشند از جمله اين كه نگارش برخي از آن‌ها زبان غيررسمي و محاوره‌اي است و به خصوص در متون علمي اغلب واژه‌هاي بيگانه به دفعات استفاده مي‌شود. رسم‌الخط مورد استفاده نيز متفاوت و سليقه‌اي است و برخي از آن‌ها غلط‌هاي تايپي و نگارشي فراواني دارند و اين خصوصيات، اغلب به جهت محدوديت‌هاي محيط الكترونيكي و عدم تطابق رسم‌الخط فارسي با آن مي‌باشد كه نمايه‌سازي و سپس جستجو به اين زبان را با دشواري‌هايي رو به رو مي‌سازد.

24- مشکل عدم اندیکس و نمایه جستجوهای به زبان فارسی

هرچند در حال حاضر راهنماي‌هايي براي منابع اينترنتي تهيه شده است كه براساس فايل‌هاي مقلوب ساخته شدهِ توسط موتورهاي جستجو و با استفاده از قابليت‌هاي مختلف اين موتورها از جمله؛ استفاده از عملگرهاي بولي، جستجوي دقيق عبارت، محدود كردن يك جستجو به بخش خاصي از ركورد (مانند عنوان، آدرس) كوتاه‌سازي كلمات، جستجوي نزديك‌يابي واژه‌ها، ايجاد محدوديت زماني و منطقه‌اي و زباني و .... به جستجوي اطلاعات كمك مي‌كند اما بايد تاكيد كرد كه در امر بازيابي اطلاعات از اينترنت بدون نمايه‌سازي نظام يافته نمي‌توان انتظار بازيابي مفيد و مؤثر را داشت. هرچند بيشترين اطلاعات موجود بر روي اينترنت به زبان انگليسي است، ولي حجم اطلاعات به زبان فارسي نيز با سرعت در حال افزايش است و كاربران به دلايل مختلفي علاقه زيادي به اطلاعات فارسي نشان مي‌دهند و از آن جايي كه زبان غالب در اينترنت انگليسي است، جستجو به زبان‌هاي غيرانگليسي از جمله فارسي، مسايل و مشكلات مختلفي را جداي از مشكلات عمومي اينترنت دارد.

25- سخن آخر به همه اهالی دنیای مجازی به فارسی بیاندیشیم

اينترنت به عنوان يك محمل اطلاعاتي عظيم، منابع اطلاعاتي را در مقياسي وسيع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسي به منابع اطلاعاتي اعم از متن و ساير رسانه‌ها عمده‌ترين مزيت اينترنت محسوب مي‌شود. اين توانايي كه هر كس ناشر آثار خود باشد عواقب ناخواسته‌اي را نيز در پي خواهد داشت و آشكارترين معضل، آن است كه انبوهي از منابع بسيار متنوع و غيرقابل مديريت را فراهم مي‌آورد. افزايش سريع منابع اينترنتي نيازمند يك سازمان‌دهي مفيد و مؤثر است