PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : همه چیز در مورد موتورهای جستجو به زبان جس جو



Mohamad
06-30-2010, 07:25 PM
جستجوگر واسطه ای است میان کاربران و وب سایت ها و وبلاگ ها تا کاربران بتوانند به کمک آن به اطلاعات مورد نیاز خود دسترسی پیدا کنند.
برای این کار نیاز به فهرست کردن اطلاعات مورد نیاز کاربران می باشد. به طور کلی این امر به دو صورت متفاوت در وب دایرکتوری ها و جستجوگرها صورت می گیرد. هر کدام از آنها، ویژگی های خود را دارند.
دایرکتوری ها شامل فهرستی از نیازمندی های کاربران می باشند که داده های آن توسط خود کاربران (انسانها) وارد شده است و جستجو تنها در میان اطلاعات وارد شده در سیستم آنها صورت می گیرد.
اما جستجو در موتورهای جستجو (جستجوگرها) که انواع مختلفی دارند، به وسیله اسپایدرها (نرم افزار) انجام می شود و اگر چه جستجو تنها در پایگاه داده آن صورت می گیرد اما حجم داده های آن به مراتب از دایرکتوری ها بیشتر می باشد.
انواع موتورهای جستجو به قرار زیر می باشد:
• موتورهای جستجو
• ابر جستجوگرها
• موتورهای جستجوي خاص
موتورهای جستجو
همانطور که پیش از این اشاره شد، حجم اطلاعات و داده های اینترنتی آنقدر زیاد و رو به افزایش است که کاربران برای یافتن اطلاعات دلخواه خود، نیازمند به وب سایت هایی (موتورهای جستجوگر) هستند که به آنها در پیدا کردن اطلاعات کمک کنند؛ موتورهای جستجوگر به یاری کاربران وب آمده اند.
موتورهای جستجو با ارائه خدمات جستجو علاوه بر تسهیل کار کاربران، رقابتی میان وب سایتها و وبلاگها ایجاد کرده اند. مدیران سایتها، وب سایتها و وبلاگهای خود را بر اساس عملکرد موتورهای جستجوگر بهینه سازی می کنند.
از معروف ترین نمونه های خارجی این نوع موتور جستجو می توان به گوگل و یاهو اشاره کرد و از نمونه های داخلی، که برای فارسی زبانان برنامه ریزی شده است، می توان جس جو را نام برد.
از نمونه های دیگر می توان به موارد زیر اشاره کرد:
• Ask.com
• Baidu
• Bing
• Cuil
• Duck Duck Go
• Kosmix
• Sogou
• Yodao
• Yandex
• Yebol
برای درک بهتر، در ادامه مقاله، به طور خلاصه نحوه کار موتورهای جستجو بیان شده است.
ابر جستجوگرها
این جستجوگرها به هنگام دریافت درخواست کاربر، نتایج موتورهای جستجوي مختلف را برای آن موضوع بررسی می کنند و بهترین نتایج را در اختیار کاربر قرار می دهد.
نام چند مورد در اینجا ذکر شده است:
• Brainboost
• !ChunkIt
• Clusty
• Dogpile
• Excite
• Harvester42
• HotBot
• Info.com
• Ixquick
• Kayak
• LeapFish
• Mamma
• Metacrawler
• MetaLib
• Mobissimo
• Myriad Search
• SideStep
• Turbo10
• WebCrawler
• DeeperWeb
Mamma از قدیمی ترین ابرجستجوگرها می باشد.
موتورهای جستجوي خاص
این نوع موتورهای جستجو بر موضوعی خاص تمرکز دارند و تنها به جستجو به وب سایتها و وبلاگ های مرتبط با آن موضوع می پردازند.
یکی از نمونه های این نوع موتور جستجو Chemical Search می باشد.
نحوه کار موتورهای جستجو
زمانی که کاربر کلمه و یا عبارتی را وارد جعبه جستجوي یک موتور جستجو می کند، موتور جستجو، وب سایتهایی را به عنوان نتایج جستجو به او ارائه می دهد که بر حسب میزان ارتباط با عبارت جستجو شده به ترتیب نزولی فهرست شده است.
نکته ای که پیش از هر چیز باید به آن توجه کرد این است که موتورهای جستجوگر، در میان پایگاه داده ای که دارند به جستجو می پردازند و نه در تمام وب.
همچنین، هر چه این نتایج دقیقتر و مرتبط تر باشند، موتور جستجو محبوب تر خواهد بود. تفاوت نمایش نتایج جستجوها ناشی از تفاوت در الگوریتم و شیوه بایگانی داده های یک موتور جستجو می باشد. این الگوریتم برای هر موتور جستجو منحصر به فرد می باشد.
یک موتور جستجوگر به طور کلی از پنج بخش تشکیل شده است:
1. عنکبوت (Spider)
2. خزنده (Crawler)
3. بایگانی کننده (Indexer)
4. پایگاه داده (Database)
5. سیستم رتبه بندی (Ranker)
عنکبوت (Spider)
اسپایدر یا روبوت، کار جمع آوری اطلاعات مورد نیاز یک موتور جستجوگر را به عهده دارد. اسپایدر به صفحات مختلف سر می زند، محتوای آن را می خواند و لینکها را دنبال می کند.
اسپایدر مانند یک کاربر وب، از صفحات مختلف بازدید می کند اما اسپایدر کدهای صفحات را می بیند، در حالیکه کاربران نتیجه حاصل از قرار گرفتن کدها در کنار هم را می بینند.
خزنده (Crawler)
کراولر، مشخص می کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد، کدام لینکها را دنبال کند و یا نکند. به زبان ساده نقش فرمانده آن را دارد.
بایگانی کننده (Indexer)
ایندکسر، اطلاعات صفحات جمع آوری شده توسط اسپایدرها را به پارامترهای عددی تبدیل می کند تا توسط سیستم رتبه بندی قابل شناسایی و مقایسه باشد.
در واقع، در این بخش، اطلاعات مورد تجزیه و تحلیل قرار می گیرند و بررسی می شوند که آنها از کدام صفحه ارسال شده، به کجاها ارتباط دارد، کلمات موجود در آن کدامند، کلمات چند بار تکرار شده اند، کلمات در کجای صفحه قرار دادند و...
پایگاه داده (Database)
پایگاه داده یک موتور جستجو محل ذخیره و گروه بندی داده های تجزیه و تحلیل شده توسط ایندکسر می باشد. البته در این بخش فشرده سازی داده ها نیز صورت می گیرد تا حجم کمی از پایگاه داده اشغال شود.
نکته قابل توجه این است که بزرگی و به روز بودن پایگاه داده از امتیازهای یک موتور جستجو محسوب می شود.
سیستم رتبه بندی (Ranker)
برای پاسخگویی به درخواست کاربر، مبنی بر جستجوی کلمه و یا عبارتی، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستجو شده، مرتبط هستند، مشخص می شوند، سپس سیستم رتبه بندی وارد عمل می شود. این سیستم آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب می کند و به عنوان نتایج به کاربر نمایش می دهد.
سیستم رتبه بندی یکی از مهمترین بخش های یک موتور جستجو محسوب می شود، چرا که اگر یک موتور جستجوگر بهترین و کاملترین پایگاه داده را داشته باشد اما نتواند پاسخ های مرتبطی را به کاربران ارائه کند، یک موتور جستجوی ضعیف خواهد بود.
معرفی مرجع و جستجوگر فارسی جس جو
با در نظر گرفتن این موضوع که بیشترین فعالیت کاربران اینترنتی بعد از ارسال و دریافت نامه های الکترونیکی، جستجو کردن و کار با موتورهای جستجوگر شناخته شده است، کاربران فارسی زبان نیز سهمی در استفاده از جستجوگرها و ارائه این فناوری در دنیای وب دارند.
از این رو در ایران نیز برای تولید و تهیه انواع موتورهای جستجو فعالیت هایی صورت گرفته است. از جمله می توان به ارائه سرویس های جستجو خاص اشاره کرد که در وب سایتهای شرکت ها ارائه می شود، البته تاکنون این جستجوگرها نه به عنوان یک موتور جستجو مستقل بلکه به عنوان بخشی از وب سایت های بزرگ در نظر گرفته شده است.
جس جو، موتور جستجو و وب دایرکتوری مستقلی است که برای فارسی زبانان تولید شده و سرویس های خود را بر اساس فرهنگ ایرانی ها بومی سازی کرده است.
این سرویس ها به صورت رایگان در مجموعه های جستجو، سرگرمی، کتابخانه، امروز، سلامتی و خانواده در اختیار کاربران قرار داده شده است.
موتور جستجوي جس جو مانند سایر موتورهای جستجوي دنیا دارای پایگاه داده منحصر به فرد خود می باشد و بر اساس الگوریتم تعریف شده خود به رتبه بندی وب سایت ها به هنگام درخواست جستجو می پردازد.
از ویژگی های مهم این موتور جستجو، قابلیت جستجو در میان وب سایت ها و وبلاگ های فارسی در کنار جستجو در تمام وب می باشد. همچنین این وب سایت به تولید نرم افزارهای تحت وب و ارائه آن به صورتیکه به سادگی برای کاربران فارسی زبان قابل استفاده باشد، پرداخته است.
در بخش وب دایرکتوری جس جو، فهرستی از اماکن و مشاغل ایرانی و لینک وب سایت ها و وبلاگ های فارسی زبان را مشاهده می کنید.
برای جستجو در جس جو به آدرس www.jasjoo.com مراجعه کنید.