مفهوم داده کاوی :

عبارت داده کاوی مترادف با یکی از عبارت های استخراج دانش، برداشت اطلاعات، وارسی داده ها و حتی لایروبی کردن داده هاست که در حقیقت کشف دانش در پایگاه داده ها[1][1] (KDD ) را توصیف می کند. بنابراین ایده ای که مبنای داده کاوی است یک فرآیند با اهمیت از شناخت الگوهای بالقوه مفید، تازه و درنهایت قابل درک در داده هاست. واژه کشف دانش در پایگاه داده ها در اوایل دهه 80 در مراجعه به مفهوم کلی، گسترده، سطح بالا و به دنبال جستجوی دانش در اطلاعات شکل گرفته است. داده كاوی كاربرد سطح بالای فنون و ابزار بكار برده شده برای معرفی و تحلیل داده ها ی تصمیم گیرندگان است. اصطلاح داده کاوی را آمار شناسان، تحلیل گران داده ها و انجمن سیستم های اطلاعات مدیریت به کار برده اند در حالی که پژوهشگران یادگیری ماشین و هوش مصنوعی از KDD بیشتر استفاده می کنند. در ادامه چند تعریف از داده کاوی ارائه می شود.

1- «داده کاوی یا به تعبیر دیگر کشف دانش در پایگاه داده ها، استخراج غیـــــر بدیهی اطلاعات بالقـوه مفید از روی داده هایی است که قبلاً، ناشناخته مانده اند. این مطلب برخی از روش های فنی مانند خوشه بنـدی، خلاصه سازی داده ها، فراگیری قاعده های رده بنــدی، یافتن ارتباط شبکه ها، تحلیــــــل تغییرات و کشف بی قاعدگی را شامل می شود » (پیاتتسکی شاپیرو، ماتئوس کریستوفر)

2 - « داده کاوی در حقیقت کشف ساختارهای جالب توجه، غیر منتظره و با ارزش از داخل مجمــــوعه وسیعی از داده هامی باشد و فعالیتی است که اساساً با آمار و تحلیل دقیق داده ها منطبق است» هند (1998)

3- « داده کاوی فرآیند کشف رابطه ها، الگوها و روندهای جدید معنی داری است که به بررسی حجم وسیعی از اطلاعات ذخیره شده در انبارهای داده با فناوری های تشخیص الگو ( مانند ریاضی و آمار ) می پردازد». ( سایت کشف دانش در پایگاه داده ها در جهت کشف اطلاعات مفید از مجموعه بزرگ داده هاست. دانش کشف شده می تواند قاعده ای باشد تا ویژگی های داده ها، الگوهایی که به طور متناسب رخ می دهند، خوشه بندی موضوع های درون پایگاه داده ها و غیره را توصیف می کند.

یک کاربر سیستم KDD بایستی درک بالایی از قلمرو داده ها به منظور انتخاب زیر مجموعه صحیحی از داده ها، رده مناسبی از الگوها و معیار خوبی برای الگوهای جالب داشته باشد. بنابراین سیستم KDD باید ابزارهایی با اثر تعاملی داشته باشد نه سیستم های تجزیه و تحلیل خودکار. لذا کشف دانش از پایگاه داده ها باید مثل یک فرآیند شامل گام های زیر باشد:

1- درک قلمرو 3- کشف الگوها (داده کاوی)

2- آماده کردن مجموعه داده ها 4- پردازش بعد از کشف الگو

حمل و نقل و جابجائی كالا و مسافر، بعنوان یكی از اساسی ترین نیازهای بشر، همواره به عنوان شاخصی مطرح بسیار مهم در برنامه‌ریزی‌های كلان هر جامعه، ‌مورد توجه ویژه قرار گرفته است.

درعصری كه به آن ”عصر انفجار اطلاعات“ اطلاق می‌گردد، فن‌آوری اطلاعات و ارتباطات بعنوان ابزاری كارآمد برای متخصصین رشته های گوناگون، موجبات تسهیل و تسریع ارائه خدمات را فراهم نموده است.

در همین راستا،مهندسین حمل و نقل نیز سعی بر آن داشته‌اندتا از فن‌آوری اطلاعات (IT) بعنوان راهكاری مناسب درجهت از میان برداشتن معضلات اساسی مدیریت ترافیك بهره‌ جسته‌ و مشكلات آنرا به حداقل ممكن كاهش دهند و در این مقاله سعی بر آن است تا اندكی از كاربرد‌های IT در حمل و نقل تشریح شود.

در سالهای اخیر، جوامع پیشرفته با بهره جوئی از امکاناتی که امروزه بعنوان ره آوردهای IT شناخته میشوند، با ایجاد سیستمهای هوشمند حمل و نقل یا ITS‌ یك زیرساخت مطلوب و مناسب جهت تحقق و دستیابی به اهداف متخصصین فراهم شده است.

مدیریت و برنامه ریزی دقیق و كارآمد در حمل و نقل و ترافیك ، استفاده بهینه از منابع، كاهش صدمات و افزایش ایمنی و آرامش، كاهش هزینه و اثرات نامطلوب زیست محیطی، ‌كاهش مصرف انرژی و تأخیرهای ناخواسته در طول سفر و در نهایت جلب رضایت مسافرین و روانسازی جریان ترافیك و حمل و نقل، ‌همواره از مقاصد ومطلوبهای برنامه ریزان حمل و نقل در استفاده از ITS برشمرده می‌شوند.

در همین راستا میتوان بصورت دقیقتر ،‌مهمترین عملكردهای ITS را چنین برشمرد :

- مدیریت و بهینه سازی جریان ترافیك و روانسازی حركت

- مدیریت و كنترل حوادث

- مدیریت و پشتیبانی وسائل نقلیه امدادی

- مدیریت اخذ الكترونیكی عوارض , هزینه پاركینگ , خرید و رزرواسیون بلیط و...

- مانیتورینگ و كنترل حمل و نقل سنگین

- مدیریت و ناوبری پیشرفته

- مدیریت حمل و نقل عمومی

- مدیریت و پشتیبانی عابر پیاده و ...

روشن است که هر یك از موارد مذكور بدون بهره جوئی از ره‌آوردهای IT قابل دستیابی و انجام نبوده است. بطور مثال كنترل و برنامه‌ریزی چراغهای راهنمائی در داخل شهرها بعنوان یك مسئله مهم از مقوله مدیریت و بهینه سازی جریان ترافیك و روانسازی آن , همواره مطرح می باشد. بصورت خلاصه نحوه عملكرد این سیستم را می‌توان بدین شرح توصیف نمود كه حجم و میزان تراكم خودروها توسط حسگرهای گوناگونی كه در زیر سطح جاده و یا در حواشی آن نصب شده‌اند ، سنجیده شده و جهت

پردازش و اخذ تصمیم، توسط ابزارهای ارتباطی همچون فیبر نوری یا بصورت wireless، به مراكز كنترل مركزی ارسال می‌گردد و در آنجا بر اساس اصول و محاسبات مدیریت ترافیك و فاز بندی چراغها، توسط نرم افزارهای مفید با در نظر گرفتن شرایط متفاوت و مطروح، زمان بهینه توقف پشت چراغ و یا حركت در حالت سبز، پردازش و دستورات لازم به دستگاههای كنترل كننده چراغها ارسال می‌گردد.

امروزه در بسیاری از شهرهای بزرگ دنیا استفاده از این سیستم رایج و مرسوم است و در كلان شهر تهران نیز شاهد بهره‌جوئی از آن در بیش از 150 تقاطع می‌باشیم. از محاسن این سیستم می‌توان به کاستن از تاخیرهای بی مورد , کاهش زمان سفر و جلب آرامش و رضایت مسافر، ایجاد موج سبز در حركت ، كاهش تصادفات و... را نام برد.ایجاد چنین سیستمی ، همراه با اتصال آن به یك شبكه اطلاعاتی یا سایت اطلاع رسانی ، به سادگی می‌تواند قبل از شروع سفر، مسافر را در انتخاب مسیر مطلوب یاری رسانده و در كاهش حجم ترافیك تأثیر بسزائی داشته باشد.

بدیهی است در صورت ایجاد چنین سیستمی حتی گوشی‌های تلفن همراه نیز كه امروزه توانائی برقراری اتصال با شبكه‌های اطلاع رسانی را دارا هستند , قابلیت دریافت اطلاعات و اخبار مربوط به ترافیك را خواهند داشت. روشن است بدین ترتیب پیشنهاد یك مسیر مطمئن و به دور از تراكم‌های ناخواسته توسط سیستمهای اطلاعاتی و هوشمند و انتخاب آن توسط مسافر در روانسازی جریان ترافیك تأثیر مطلوب و شایانی خواهد داشت. ضمن اینكه كاستن از مصرف سوخت خودرو و کاهش آلودگی هوا، زمان سفر و بالا بردن ضریب اطمینان در رانندگی و آرامش در مسافر از نتایج مطلوب و دائمی آن بوده و از آثار سیستمهای ناوبری پیشرفتهITS به شمار می‌آید. تكنیك اطلاع رسانی به رانندگان امروزه در شهر تهران بصورت رادیوئی و توسط کانال پیام و در برخی نقاط بر روی تابلوهای اطلاعاتی انجام می‌پذیرد که از ابتدائی ترین شیوه های مطرح در مطلع نمودن رانندگان از شرایط ترافیكی محسوب میگردد.

در برخی موارد ارائه اطلاعات جهت انتخاب سایر شیوه ها و سیستمهای حمل و نقل و دستیابی به مقصد توسط دیگر وسائط نقلیه و یا ارائه اطلاعاتی راجع به سطوح سرویس و عرضه خدماتی كه در مقصد به مسافر ارائه می‌شوند نیز بعنوان دیگر كاربرد ‌‌های سیستمهای ناوبری پیشرفته به شمار می‌آیند. در سیستمهای اطلاعاتی مربوط به كنترل و برنامه ریزی حمل و نقل انتقال اخباری كه به بروز شرایط غیر عادی و یا تصادفات مربوط می‌گردد حائز اهمیت است چرا كه در هر دو حالت میتوان به موقع تدابیر لازم جهت تغییر مسیر مسافر را اندیشید و از ازدحام‌های ناگهانی جلوگیری نمود.