PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : همکاری آنلاین ، بررسی پروژه ReCAPTCHA



mehraboOon
05-19-2012, 04:15 PM
همکاری آنلاین ، بررسی پروژه ReCAPTCHA

http://www.gooyait.com/uploads/logo2-new.gif

چند نفر از شما تاکنون فرمهای اینترنتی رو پر کردید وقتی که از شما خواسته میشه کاراکترهای بهم ریخته ای را بخوانید؟ چه تعداد از شما ان را ناراحت کننده می دانید؟
این کاراکترهای به هم ریخته که با نام فایل کپچا (CAPTCHA) می شناسیم برای آن است که سایت ها مطمئن شوند کسی که فرم رو پر می کند واقعا یک انسان است نه یک نوع برنامه کامپیوتری.
پروژه کپچا چیری است که ما در دانشگاه کارنگی ملون شروع کردیم و اکنون چندین سال است که در همه جا استفاده می شود.
حالا اجازه بدهید در مورد پروژه ای توضیح دهم که در چند سال گذشته شروع کردیم که نوعی انقلاب در کپچا به حساب می اید. این پروژه ری کپچا ( ReCAPTCHA) نام دارد که ما در کارنگی ملون شروع کردیم و چند سال بعد شرکت گوگل مالک آن شد

http://www.gooyait.com/uploads/captcha.jpg

این پروژه چگونه شروع شد ؟
به نظر می رسد که روزانه حدود ۲۰۰ میلیون کپچا توسط مردم نوشته می شوند.
هر زمان که شما یک کپچا رو می نویسید حداقل ۱۰ ثانیه زمان صرف می کنید و اگه شما ان را ضرب در ۲۰۰ میلیون کنید ۵۰۰۰۰۰ ساعت نفر در روز زمان از دست رفته داریم تایپ این کپچای آزار دهنده است بنابر این من حس خوبی نداشتم. و شروع به فکر کردن کردم .
خوب ، البته ، ما نمی توانیم از شر کپچا خلاص شویم برای اینکه امنیت بخشی از وب سایت به ان بستگی دارد. پس با این وجود آیا راهی وجود دارد که بتوانیم از این حرکت استفاده کنیم چیری که برای بشریت مفید باشد ؟
زمانی که شما یک فایل کپچا را می نویسید در زمان ۱۰ ثانیه مغز شما کار جالبی انجام می دهد که هنوز هیچ رایانه ای قادر به انجام ان نیست پس ما کاری میکنیم که درون این ۱۰ ثانیه کار مفیدی انجام بشود.

http://www.gooyait.com/uploads/Captcha..1.jpg

بنابر این ان چیزی که ممکن است شما تا حالا ندانید این است که زمانی شما کپچا رو می نویسید فقط خودتان را به عنوان یک انسان معرفی نمی کنید بلکه شما کمک می کنید تا ما کتابها را الکترونیکی کنیم .
تا حالا پروژه های زیادی جهت الکترونیکی کردن کتابها وجود داشته ( از جمله آمازو ن با کیندل ) . روش کار به این صورت است که شما با یک کتاب قدیمی شروع می کنید ،و شما ان را اسکن می کنید که شبیه یک عکس دیجیتالی از هر صفحه از کتاب است .
مرحله بعد پردازش داده ها است که به یک کامپیوتر جهت تشخیص کلمه ها از میان صفحات اسکن شده کتاب نیاز دارد، که به این تکنولوژی ocr می گویند . حالا مشکل این است که ocr ها عالی عمل نمی کنند خصوصا برای کتابهای قدیمی.
جایی که جوهر کمرنگ شده و صفحات زرد است ocr نمی تواند خیلی از این کلمات را تشخیص بدهد پس ما باید چکار کنیم ؟ آیا غیر از این است که ما می توانیم کلماتی را تشخیص بدهیم که کامپیوتر نمی تواند. بنابراین ما از انسانها استفاده می کنیم تا انها را برای ما بخوانند، زمانی که انها یک فایل کپچا را در اینترنت می نویسند.
پس زمانی که شما یک فایل کپچا را می نویسید، این کلمه که شما می نویسید واقعا بخشی از یک کتاب هستند که در حال الکترونیکی شدن است و کامپیوترها هم قادر به تشخیص ان نیستند.
http://www.gooyait.com/uploads/4d05f24139ca42.jpg
دلیل اینکه ما دو کلمه را کنار هم به جای یک کلمه قرار می دهیم این است که، همانطور که می دانید، یک کلمه کلمه ای است که کامپیوتر از کتاب بدست آورده و نمی داند که آن کلمه چیست (کلمه کلیدی) و به شما ارائه کرده است و کلمه دیگر که ما در اختیار شما قرار می دهیم کلمه ای که سیستم جواب ان را می داند (کلمه مبهم مورد نظر). ما از شما می خواهیم هر دو کلمه را بنویسید.
اگر کاربر کلمه کلیدی را درست وارد کند ، به احتمال فراوان کلمه نامعلوم دیگری را نیز درست وارد کرده است. و اگر ما این را برای ۱۰ شخص دیگر بفرستیم و تمامی انها توافق داشته باشند بر روی اینکه ان کلمه چیست پس ما توانستیم به طور صحیحی یک کتاب رو دیجیتالی کنیم .

http://www.gooyait.com/uploads/picture.jpg

این روشی است که سیستم کار می کند و زمانی که ما ان را از سه یا چهار سال پیش عرضه کردیم خیلی از وبسایتها کپچای خود را به این سیستم تغییر دادند.
از کپچایی قدیمی که مردم وقت خود را بیهوده صرف می کردند به کپچای جدیدی که مردم به الکترونیکی کردن کتابها کمک می کنند.
اکنون حدود ۳۵۰۰۰۰ از سایتهای دیگر در حال استفاده از ری کپچا هستند در واقع تعداد سایتهای که از ری کپچا استفاده میکنند بسیار بالاست و تعداد کلماتی که ما در حال دیجیتالی کردن هستیم هر روز بیشتر می شود، چیزی در حدود ۱۰۰ میلیون کلمه در روز یا دو ونیم میلیون کتاب در سال . و تمامی این موارد زمانی انجام می شود که شما یک کپچا را در اینترنت تایپ می کنید .