-
آمار
آمار علم و عمل توسعه دانش انسانی از طریق استفاده از دادههای تجربی است. آمار بر نظریهی آمار مبتنی است که شاخهای از ریاضیات کاربردی است. در نظریهی آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریه احتمال مدل میشوند. عمل آماری، شامل برنامهریزی، جمعبندی، و تفسیر مشاهدات غیر قطعی است. از آنجا که هدف آمار این است که از دادههای موجود «بهترین» اطلاعات را تولید کند، بعضی مؤلفین آمار را شاخهای از نظریهی تصمیمگیری به شمار میآورند.
تاریخچه
سرآغاز اولیه آمار را باید در شمارش های آماری حوالی آغاز قرن اول میلادی یافت. اما ،تنها در قرن هجدهم بود که این علم ، با به کار رفتن در توصیف جنبه هایی که شرایط یک وضعیت را مشخص میکردند ، به عنوان رشته ای علمی و مستقل شروع به مطرح شدن کرد.
مفهوم از کلمه لاتینی ،به معنی شرط ، استخراج شده است. مدت های مدید ، این علم ، محدود به کار در این حوزه بود ، و تنها در دهه های اخیر از این انحصاری جدا شدو ، و به کمک نظریه احتمال ،شروع به بررسی روش های تحلیل داده های آماری و اثبات فرض های آماری کرد.
روش های این آمار ریاضی با آشکار کردن قوانین جدید ، به ابزاری موثر در علوم طبیعی و تکنولوژی تبدیل شد.
جامعه و نمونه
جامعه یک بررسی آماری دارای مشاهده ها یا آزمایش هایی تحت شرایطی یکسان ، به عنوان عنصرهای خود است. هر یک از این عنصرها را میتوان نسبت به مشخصه های متفاوتی بررسی کرد ، که می توانند به عنوان متغیرهای تصادفی XوY .... در نظر گرفته شوند.
اگر مشخصه تحت بررسی X ، دارای تابع توزیع F در جامعه مربوط باشد ، آنگاه گفته می شود که جامعه مورد بحث دارای توزیع F نسبت به مشخصه X است. در بررسی های آماری همواره زیر مجموعه ای متناهی از عناصر جامعه مورد تحقیق قرار می گیرد.این زیر مجموعه به نمونه موسوم است ، و n، تعداد عناصر موجود در آن ، اندازه نمونه نامیده می شود.
مثال
اگر وزن پسر بچه های ده ساله متغیر تصادفی x باشد ، در این صورت تمام پسر بچه های به این سن یک جامعه تشکیل می دهند . اندازه های وزن پسربچه های در شماری از مکان ها یک نمونه می سازند ، و هر پسر بچه عنصری از جامعه مزبور است . وزن مورد بحث مشخصه ای از عنصر های مزبور به شمار می رود ، و سایر مشخصه ها ، به عنوان مثال ، بلندی قد و اندازه سینه اند.
طرح آزمایش
در بررسی یک مسئله با روش های آماری ، باید نقشه آزمایش کشیده شود که شامل روش جمع آوری داده ها،اندازه نمونه مورد نظر و روش حل آن مسئله است. در این مورد هر چه نقشه آزمایش دقیق تر باشد ، نتایج به دست آمده از روش های آماری بهتر خواهند بود . بخصوص ، باید اطمینان حاصل شود که هیچ یک از اندازه گیری هایی که برای نتایج مورد نظر دارای اهمیت اند از قلم نیفتند یا ناقص نباشند . اما در این مورد همچنین می توان ، تنها به همان اندازه که می شود با بخش ناچیزی از هزینه ها به دست آورد قناعت و از دستاوردی با یک رشته آزمون بسیار پرخرج اجتناب کرد.
در این رابطه ، نکات زیر از اهمیت برخوردارند:
* مواد یا اطلاعات بررسی شده باید همگن باشند ؛ یعنی ،روش آزمون ،در دوره بررسی ، باید یکسان باقی بماند. در وسایل یا شرایط تولید نباید تغییری داده شود ، و ابزارهای اندازه گیری با دقت های متفاوت نباید به کار روند.
* بایدتا آنجا که امکان دارد خطاهای منظم یا عوامل موثر کنار گذاشته شوند . به عنوان مثال ، اگر مایل باشیم دو ماده را با هم مقایسه کنیم ، باید هر دو را در یک دستگاه تهیه کرده باشیم ، چه در غیر این صورت تفاوت دستگاه ها در نتایج بررسی وارد می شود ، و در کشاورزی ، در آزمون کودهای متفاوت ، باید زمین را ،به خاطر یکسان کردن تاثیر نوع خاک و موقعیت آن ، به باریکه های موازی تقسیم کرد.
باید نظارتی در نظر گرفته شود. در این مورد، یا برای مشخصه تحت بررسی مقادیر استانداردی موجودند ،که می توانند با نتایج آزمون مقایسه شوند ، یا آزمونهای نظارتی باید انجام گیرند . به عنوان مثال ، در آزمایش مربوط به کودها ، باید تاثیر یک کود از تفاوت بین گیاهانی که که با آن یا بدون آن ،تحت شرایط محیطی یکسان ،رشد کرده اند ، ارزیابی شود.
انتخاب نمونه باید تصادفی یا نماینده ای باشد . انتخاب تصادفی انتخابی است که در آن هر عنصر برای اینکه عضو آن نمونه باشد یا نباشد ، از احتمال یکسان برخوردار است. به عنوان مثال ، در یک محموله پیچ ، نمونه مورد آزمون نباید تماماَ از یک مکان انتخاب شود ،بلکه باید روی کل محموله توزیع شده باشد ، و در اندازه گیری ضخامت سیم ها نقاط اندازه گیری شده باید به طور تصادفی روی تمام طول سیم توزیع شده باشد.
انتخاب تصادفی عناصر را می توان به کمک جداول اعداد تصادفی انجام داد ، و انتخاب نماینده ای نمونه را می توان زمانی انجام داد که ماده تحت بررسی را بتوان به گونه ای یکتا به اجزایی تقسیم کرد . به عنوان مثال ، امکان پذیر است که یک محموله پیچ را به چنان طریقی تقسیم کنیم که هر جزء مزبور ، به تصادف انتخاب کرد ، ودر این صورت کل آنها نمونه مورد نظر را تشکیل می دهند. به این طریق تصویری از محموله ، بر مبنای مقیاسی کاهش یافته به دست می آید.
با توجه به اندازه نمونه مورد آزمون ، البته باید به بررسی مورد بزرگ تر و استنتاج بهتر ، درباره جامعه ای که از آن می توان ساخت ، پرداخت ،اما از طرف دیگر ، اندازه مزبور ، به دلایل زمانی و تلاش به کار رفته ، معمولاَ کوچک در نظر گرفته می شود، بنابر این باید انحرافی تصادفی از نتایج را نیز به حساب بیاوریم. هنگامی که ، با روش های آماری ، استنتاجاتی درباره جامعه ای به دست می آوریم باید اندازه نمونه مورد آزمون را نیز در نظر بگیریم.
از این گفته ها میتوان به اهمیت تحصیل در رشته آمار و نیاز جامعه به فارغ التحصیلان این رشته پی برد.
-
ريشه و تعريف آمار
در كتاب ريشههاي لغت انگليسي آكسفورد
(The Oxford English etymology dictionary) آمار به صورت زير تعريف ميگردد:
كلمه آمار مشتق از واژه لاتينيstatus است و يكي از معاني آن State يا دولت است و در آغاز براي بيان واقعيتهاي يك جامعه يا يك كشور در علوم سياسي به كار گرفته شد(قرن18ميلادي).
كلمه آمار داراي معاني بسياري است و در قالب يك اسم عام، عبارت از مجموعهاي از دادههاي عددي مانند آمار بيكاران، حوادث، بيمهشدگان، درآمدها، هزينهها و... است. امروزه بسياري از مردم همچنان آمار را تنها به عنوان مجموعهاي گيجكننده از اعداد و ارقام و جداولي ميدانند كه بيانكننده وضعيتهاي گوناگون جمعيتي، اقتصادي، سياسي و... هستند. علم آمار در يكي،دو قرن گذشته، چنان تحول شگرفي پيدا كرده است كه به عنوان مهمترين ابزار استدلالي مبتني بر دادهها معرفي ميشود. پيشرفتهاي بهدستآمده در علم آمار باعث تأييد و تثبيت بسياري از نظريههاي علوم ديگر شده كه اين نكته، خود به توسعه ساير علوم انجاميده است. همچنين نمايشهاي عددي صرف به صورت جنبهاي فرعي از علم آمار درآمده است و تعداد بسيار محدودي از كارشناسان حرفهاي آمار به فعاليتهاي معمولي جدولبندي و رسم نمودارها اشتغال دارند. امروزه آمارشناسان از روشهاي مختلف آماري براي استنتاج بر اساس مجموعهاي از دادههاي گردآوريشده و استخراج اطلاعات از آنها به صورت جداول، نمودارها، خلاصهسازيها و تحليلهاي تخصصي بهره ميگيرند.
آمار به عنوان يك اسم عام را ميتوان به صورت زير تعريف كرد: «آمار ابزاري براي خلاصهسازي وقايعي است كه تحت تأثير دلايل متنوعي رخ داده و به صورت عددي در سطح قابل قبولي از خطا بيان ميشوند. دادههاي اين وقايع به روشي نظاممند و با هدفي مشخص و ازپيشتعيينشده گردآوري شده و در جداول و نمودارها با يكديگر در ارتباط قرار داده ميشوند».
تعريف قبل، تمامي ويژگيهاي آمار را در قالب صفات زير بيان ميكند:
1 - خلاصهاي از وقايع
2 - تحت تأثير چند علت
3 - توصيفشده به صورت عددي
4 - برآوردشده با سطح قابل قبولي از خطا
5 - گردآوريشده به روشي نظاممند
6 - گردآوريشده براي هدفي مشخص
7 - مرتبشده در ارتباط با يكديگر در جداول و نمودارها
آمار در قالب يك اسم خاص، به عنوان شاخهاي از علم رياضيات است كه هدف آن توسعه روشهايي براي استنتاج براساس مجموعهاي از دادههاي گردآوريشده و استخراج اطلاعات از آنها به صورت جداول، نمودارها، خلاصهسازيها و تحليلهاي تخصصي است. روشهاي متنوع بهكارگرفتهشده در اين علم روشهاي آماري (statistical methods) و كساني كه اين روشها را به كار ميبرند، آمارشناس ناميده ميشوند.
در تعريف مدرن، علم آمار عبارت از «گردآوري، توصيف، تجزيه و تحليل و تفسير دادههاي كمي و كيفي» است. روشهاري آماري، مخصوصا هنگامي كه تغييرپذيري در اندازهها يا دادهها مشاهده ميشود(در پديدههاي طبيعي و موجود در زندگي بشر) مفيد بوده و به كار گرفته ميشوند. شايد بتوان مهمترين وجه تمايز آمار و رياضيات را در اين نكته دانست كه در رياضيات، يك عدد(به عنوان مثال 100) تنها يك عدد است كه ميتوان با آن محاسبات رياضي انجام داد، اما در آمار اين عدد هويت مييابد؛ به اين مفهوم كه 100 در جايي عددي بزرگ و مهم است، ولي همين عدد در جايي ديگر مقداري ناچيز به شمار ميرود. نكته ديگري كه بايد به آن توجه كرد، اين است كه در علم رياضي صحبت از قطعيت است( اينكه همواره دو به علاوه دو برابر چهار ميشود) اما در علم آمار بحث بر سر عدم قطعيتهاست، يعني در علم آمار، دو به علاوه دو لزوما برابر چهار نيست و در اين علم آن را با درصدي از اطمينان، برابر چهار ميدانند.
در تعريف مدرن، چهار مرحله زير در علم آمار بيان ميشود:
1 - گردآوري دادهها
2 - توصيف دادهها
3 - تحليل دادهها
4 - تفسير دادهها
شايد بتوان مرحله پنجمي را نيز براي اين علم در نظر گرفت. اين مرحله ميتواند به عنوان سازماندهي دادهها بيان شود.
-
تكنيك و هدف آمار
با تمام تعاريف و زواياي مختلف موجود براي علم آمار، هدف اين علم چيست؟ ميتوان بيان كرد كه: «هدف علم آمار توسعه و بهكارگيري روشهايي براي استخراج اطلاعات مفيد از دادهها و تجربيات است.» بهعلاوه، به دليل نقش اساسي اين علم در تحليل دادهها، لزوم بهكارگيري دادههاي موثق و قابل اعتماد در اين علم از اهميت بالايي برخوردار است. پس يكي ديگر از اهداف اين علم تعيين روشهاي گردآوري مفيدي براي دادهها است. اين روشهاي گردآوري در قالب روشهاي ثبتي، بررسيهاي نمونهاي، طراحي آزمايشها و... طرح ميشوند.
روشهاي بررسي دادهها به دو روش آمار توصيفي (Descriptive Statistics) و آمار تحليلي يا استنباطي (Inferential Statistics) انجام ميشود. آمار توصيفي به بررسيهاي اكتشافي، نمايشي و خلاصهسازي دادهها ميپردازد، بدون اينكه بر روي دادهها هيچگونه مدلي را برازش دهد. اين روش توصيف دادهها اولين گام در تحليل دادههاست. در اين مرحله به دليل اينكه هيچگونه مدلي براي دادهها فرض نشده است، هيچگونه آزمون فرض يا برآورد قابل آزموني نميتواند بهكار گرفته شود. اگرچه نبايد اين نكته را از نظر دور داشت كه اين مرحله در تحليلهاي آماري از اهميت خاصي برخوردار است، چرا كه ميتواند آشكاركننده خصوصيات بسيار جالب و مهم دادهها باشد. آمار استنباطي گام بعدي تحليل دادهها است و هدف آن، شناسايي مدل مناسبي براي دادههاست. پس از برازش مدل به دادهها، هدف برآورد بهينه پارامترهاي مدل است. در نهايت اعتبار مدل با انجام آزمونهاي مناسبي براي برآوردهاي بهدست آمده و فرضيات مدل مورد بررسي قرار ميگيرد. در اين مرحله نتايج بهدست آمده از يك نمونه خاص را ميتوان به جامعه تعميم داد.
چه زماني از آمار استفاده ميشود؟
* به منظور توصيف دادهها به شكلي محدود و خلاصه: روشهاي آماري در كلاسهبندي، گروهبندي و جدولبندي كردن دادههاي خام اوليه به منظور پردازشها يا جدولبنديهاي بيشتر بهكار ميروند.
* به منظور سادگي در بيان دادههاي حجيم و پيچيده: براي رسيدن به اين منظور دادهها به صورت جداول، نمودارها، گرافها و... نمايش داده ميشوند و يا با استفاده از شاخصهاي تمركز و پراكندگي بيان ميگردند.
* براي مقايسه دو يا چند مجموعه از دادهها: جداول، اندازه ميانگين و پراكندگيها در مقايسه مجموعههاي مختلفي از دادهها بهكار ميروند.
* به منظور تصميمگيري و برنامهريزي: از آمارها ميتوان براي تصميمگيري و شكل دادن سياستهاي كاري بهره گرفت. به عنوان مثال بر اساس آمارها ميتوانند براي پيشبيني تقاضاي بازار بهكار گرفته شوند.
* براي اندازهگيري شدت و اندازه پديدهها: امكان شمارش جمعيت يك كشور و رشد آن، رشد صنعتي، كشاورزي، سطح تحصيلات و... با استفاده از آمار بهدست ميآيد.
-
محدوديتهاي آمار
* آمار راجع به پارامترهاي جامعه است و بر اساس اندازههاي بهدست آمده از يك فرد جامعه بحث نميكند. به دليل اينكه آمار بر اساس آمارهاي خلاصه شدهاي از وقايع بحث ميكند، در مطالعاتي كه تنها بر روي يك عضو جامعه انجام ميشوند، كاربردي ندارد. به عنوان مثال، حق بيمه پرداخت شده كارگري در يك شركت خاص در يك زمان مشخص نميتواند به عنوان مأخذ آماري قلمداد شود. حال آنكه اگر حق بيمههاي پرداخت شده از تمامي كارگران شركت در يك زمان و يا زمانهاي متوالي گردآوري شود بهعنوان منبعي براي پردازشهاي آماري بهشمار خواهد رفت. همچنين نمره يك دانشجو در درس آمار، نميتواند به عنوان شاخصي براي نمره آمار كلاس محسوب شود (در حقيقت ميتواند، ولي شاخص خوبي نيست) در صورتي كه متوسط نمره تمامي افراد كلاس آمار ميتواند به عنوان يك شاخص آماري بسيار خوب و مناسب براي نمره آمار كلاس در نظر گرفته شود.
* سازههاي ذهني كيفي مانند اخلاق، هوش و استعداد، زيبايي و غيره تنها در صورتي كه كمي شوند ميتوانند به عنوان آمارهايي براي پردازشهاي آماري بهكار گرفته شوند.
* نتايج آماري در يك قالب كلي صحيح هستند: نتيجهگيريهاي بهدست آمده بر اساس محاسبات آماري، براي تكتك افراد صادق نيستند. اين نتايج تنها تحت شرايط خاصي صحيح ميباشند.
* روشهاي آماري بر اساس عدم قطعيت بنيان گذارده شدهاند. از اين رو اين روشهاي آماري تنها زماني كه به دقت رياضيات نيازي نيست و يا دستيابي به اين دقت امكانپذير نيست، بهكار ميروند.
پس از مطالعه و شناخت مفهوم آمار و علم آمار، مسايل مورد توجه در علم آمار و همچنين نقاط ضعف آن در ادامه به معرفي آمارشناسان و مسايلي كه معمولاً به حل آنها ميپردازند و حيطههاي كاربردي آمار در ساير علوم پرداخته ميشود.
-
آمارشناس كيست؟
آمارشناس كسي است كه اين سؤالات را مورد توجه قرار ميدهد:
* چه دادههايي بايد گردآوري شوند؟
* منابع چگونه ميتوانند به شكل كاراتري براي گردآوري دادهها بهكار روند؟
* چگونه ميتوان يك مدل آماري را به دادههاي گردآوري شده برازش داد؟
* چگونه ميتوان دادهها را بهگونهاي ارايه كرد كه ويژگيهاي آنها را بهخوبي بيان كند؟
* چه نتيجهاي از دادهها بايد استنتاج شود و ميزان عدم قطعيت اين نتيجه تا چه اندازه است؟
* بر اساس نتايج بهدست آمده از دادههاي گردآوري شده، چه فعاليتهايي بايد صورت گيرد؟
پيشزمينه بسيار خوب از رياضيات، بهخصوص در رياضي عمومي و نظريه احتمالات براي متخصصان علم آمار ضروري است؛ چرا كه اين روشهاي رياضي و احتمالي ابزاري براي مدلسازي آماري و حل مسايل است. با توجه به پيشرفتهاي شگرف علم رياضي در دهههاي اخير، به دليل حضور و استفاده از رايانههاي سريع و پرقدرت، امروزه، اشراف بر علم آمار و رياضي بهتنهايي براي آمارشناسان كافي نبوده و فراگيري كامپيوتر نيز براي اين آمارشناسان از اهميت بالايي برخوردار است. به علاوه، به دليل اين كه امروزه هر يك از آمارشناسان به عنوان مشاور و دستيابي علمي محققين علوم مختلف فعاليت ميكنند، بايد دانش مناسبي از حيطه تخصصي كه در آن به مشاوره ميپردازند نيز داشته باشند.
كاربرد آمار در ساير علوم
آمار كاربردهاي گوناگوني دارد و روزبهروز هم بر كاربردهاي آن افزوده ميشود. برخي از علومي كه آمار به صورت تخصصي در آنها نقش بازي ميكند، عبارتند از:
* علوم بيمه: تعيين نرخهاي مرگومير، طراحي طرحهاي بازنشستگي، اندازهگيري اثرات برنامههاي مربوط به كنترل و پيشگيري از مخاطرات، تناسب و توازن منابع و مصارف و يا تعيين نرخ حق بيمههاي مختلف و غيره.
* كشاورزي: توسعه گونههاي جديد و مقاومتري از غلات، افزايش توليد شير و تخممرغ، ارزيابي اثرات و خطرات بالقوه سموم آفتهاي گياهي و حشرهكشها و غيره.
* زيستشناسي: مطالعه سير تكامل، مدلبندي رشد، بررسي اثرات متقابل گونههاي مختلف و محيط اطرافشان و غيره.
* علوم رايانه: ارزيابي الگوريتمها بر اساس مدلهاي تصادفي، ارزيابي سيستمهاي صف در مصارف كامپيوتري (بهخصوص در خدمات مربوط به خطوط ديتا در انتقال اطلاعات و شبكههاي كامپيوتري)، استخراج اطلاعات از مجموعه دادههاي بزرگ و غيره.
* حسابداري و تجارت: برآورد حجم خردهفروشي، طراحي سيستمهاي كنترل مالي، توليد روشهاي محاسباتي و حسابداري و غيره.
* اقتصاد: اندازهگيري و محاسبه شاخصهاي مختلف مانند تورم، حجم تجارت، حجم نيروي كار فعال، نيروي كار بالقوه، استانداردهاي زندگي، برآوردهاي كوتاه و بلندمدت از شاخصهاي اقتصادي و غيره.
* مهندسي: بهبود كيفيت محصولات و آزمون عملكرد آنها، برآورد اعتماد و سيستمها و اجزاي آنها، طراحي الگوريتمهايي به منظور تشخيص و شناسايي خودكار و غيره.
* مالي: مدلبندي و مديريت مخاطرات مالي، ارزشگذاري و...
* جنگلداري و منابع آبزيان: برآورد جمعيت گونههاي مختلف حيوانات و ماهيها، مديريت و تخصيص منابع طبيعي و غيره.
* پزشكي و سلامت: بررسي، توليد و توسعه داروهاي جديد، ارزيابي و بهبود برنامههاي پيشگيري و درمان سرطانها، تعيين عوامل ژنتيكي بيماريها و سرطانها، ارزيابي عوامل خطر محيطي براي بيماريهاي مختلف و غيره.
* حقوق: ارزيابي شواهد و بررسي مدارك.
* مديريت: نيازسنجيهاي گوناگون در زمينه نيروي كار، آموزش، امكانات و تجهيزات، ارزيابي بهرهوري، ارزيابي بازارهاي مختلف، ارزيابي رضايت كاركنان، مشتريان و غيره.
* روانشناسي: اندازهگيري تواناييهاي آموزش، هوش و ويژگيهاي شخصيتي، مطالعه رفتارهاي نرمال و غير نرمال و غيره.
* كنترل كيفيت: ارزيابي كيفيت با استفاده از نمونهگيري، كنترل فرآيندها، طراحي آزمايشها در توسعه محصولات و غيره.
* جامعهشناسي: آزمون نظريههاي مختلف درباره سيستمهاي اجتماعي، طراحي و انجام بررسيهاي نمونهاي به منظور مطالعه عادت و رفتار اجتماعي، توصيف و تفسير تفاوتهاي بين فرهنگها و غيره.