محاسبات آماری
آمار کلاسیک یا آمار سنتی شاخه ای از آمار است که توزیع کمیت مورد نظر را در یک یا چند جامعه، بدون در نظر گرفتن موقعیت فضایی آنها نسبت به یکدیگر، مورد بررسی قرار می دهد. بنابراین در این شاخه از آمار این واقعیت که احتمال تشابه مقدار یک کمیت در دو جزء (نمونه) با موقعیت فضایی نزدیک به هم ممکن است بیشتر از دو نمونه دور از هم باشد، در نظر گرفته نمی شود. به عبارت دیگر توزیع فضایی داده ها مد نظر قرار نمی گیرد و تحلیل ها مستقل از موقعیت و توزیع فضایی آنها صورت می پذیرد.
1- آمار تک متغیره
اولین گام در شناخت خصوصیات داده های اکتشافی محاسبه پارامترهای آماری تک متغیره ی داده ها، نظیر میانگین، انحراف از معیار، پراش، چولگی و کشیدگی می باشد. در تعیین مقدار زمینه و حد آستانه ای محلی و ناحیه ای که سرانجام می تواند به تعیین آنومالی های “ممکن” و “محتمل” یک سری از داده های ژئوشیمیایی ختم شود مهم ترین مساله تعیین انحراف معیار است. در بررسی های ژئوشیمیایی اکتشافی، برای تعیین “مقدار زمینه معمولا مقادیر منطبق باX +1S و برای تعیین حد آستانه ای محلی و ناحیه ای مقادیر منطبق برX +2S انتخاب می گردند. البته هاوکس و وب خاطر نشان ساختند که مقادیر بین X +2S و X +3S می تواند “آنومالی ممکن” و مقادیر بزرگتر ازX+3S تحت عنوان “آنومالی های احتمالی” طبقه بندی شوند. لپلتیه یک روش ترسیمی برای ارزیابی مقدار X, X+1S, X+2S , X+3S پیشنهاد کرده است. در این روش، لپلتیه پس از تعیین فاصله لگاریتمی بین گروهی در یک دستگاه محورهای مختصات با مقیاس کاغذ احتمال غلظت عناصر شیمیایی را به عنوان تابعی از فراوانی تجمعی رسم کرد، سپس عدد نظیر 50% از فراوانی تجمعی را معادل میانگین هندسی و غلظت های نظیر 84% و 97.5% فراوانی تجمعی را به ترتیب معادل مقدار زمینهX+1S و حد آستانه ای محلی و یا ناحیه ایX+2S قرار داد. برطبق این روش مقادیر ژئوشیمیایی که به ازای آنها فراوانی تجمعی بیش از 97.5% باشد می توانند به عنوان آنومالی مورد بررسی قرار گیرند.
2- آمار دو متغیره
برای داشتن معیاری از همبستگی دو متغیر بدون وابستگی به واحد اندازه گیری داده ها، پارامتر آماری ضریب همبستگی تعریف میشود. در محاسبه ضریب همبستگی نیز مانند بسیاری از پارامترهای آماری دیگر فرض بر نرمال بودن دادها ست.
براي شناسايي روابط ژنتيكي و ثانويه ميان متغيرها (عناصر) و تجزيه و تحليل آنها، بررسيهاي دو متغيره، به عنوان نخستين گزينه انتخاب ميشود، بررسيهاي دو متغيره شامل بررسي و تفسير نمودار پراكنش و محاسبه ضريب همبستگي بين دو متغير(عنصر) ميباشد، ضريب همبستگي و بررسي تغييرات آن در مراحل مختلف اكتشافات ژئوشيميايي كاربرد گستردهاي دارد.
3- آمار چند متغیره
روش های چند متغیره، امکان آنالیز آماری چندین متغیر را فراهم می کنند. اگرچه استنباط های آماری تک متغیره و یا دو متغیره می توانند معتبر باشند، ولی استنباط های آماری مبتنی بر بررسی های چند متغیره از اعتبار بیشتری برخوردار است. در این روش آماری خطاهای تصادفی یک متغیره می تواند تا حدودی بوسیله ی متغیرهای دیگر کنترل شود. این امر بخصوص در کاهش خطاهای ناهنجار در تحلیل داده ها و استنباط های واقعی تر می تواند موثر و مفید باشد.
روش های رایج در آمار چند متغیره شامل: روش تحلیل مولفه های اصلی (PCA)، تحلیل فاکتوری، تحلیل تفریقی (تمایز)، تحلیل خوشه ای، رگرسیون چندگانه و تحلیل ویژگی است. روش های تحلیل فاکتوری و تحلیل تفریقی (تمایز) براساس تحلیل مولفه های اصلی صورت می گیرد.
تجزیه و تحلیل فاکتوری
در واقع هدف از تجزیه و تحلیل فاکتوری تشخیص اصلی ترین متغیرهای کنترل کننده از متغیرهایی با نقش کمتر است. در این صورت می توان با حداقل تعداد متغیرهای فاکتوری حداکثر تغییرپذیری بین داده ها را توجیه کرد و سهم نسبی هر یک از متغیرهای فاکتوری را در توجیه تغییرپذیری مشخص نمود. به طور خلاصه هدف از تجزیه و تحلیل فاکتوری آن است که برای p متغیر اندازه گیری شده (تحت بررسی) بتوان k متغیر فاکتوری (k<p) را طوری تعریف کرد که بتوانند بخش اعظمی از تغییرپذیری ها را توجیه کنند.
رابطه بین تحلیل فاکتوری و تحلیل مولفه های اصلی
هر دو روش تجزیه و تحلیل مورد نظر سعی در کاهش بعد فضای مورد مطالعه دارند. بدلیل شباهت دو روش در محاسبه و هدف، بسیاری از مولفین تجزیه و تحلیل مولفه های اصلی را حالت خاصی از تجزیه و تحلیل فاکتوری می دانند. در ادامه چند مورد از اختلاف های این دو روش ذکر می شود:
1- در تجزیه و تحلیل مولفه های اصلی تاکید روی توجیه پراش بین داده های اندازه گیری شده است در حالی که در تجزیه و تحلیل فاکتوری تاکید روی توجیه کواریانس است.
2- در روش تحلیل فاکتوری اگر تعداد فاکتورها را تغییر دهیم، فاکتورهای تخمین خورده ی قبلی تغییر می کنند در حالی که این امر در مورد تحلیل مولفه های اصلی صادق نیست.
3- امکان چرخش فاکتورها یکی از مزایای روش تحلیل فاکتوری نسبت به روش تحلیل مولفه های اصلی است که به تفسیر بهتر داده ها کمک می کند. بدیهی است که اگر هدف تحلیل داده ها شناخت رفتار عوامل (فاکتورها) و توصیف مهم ترین آنها باشد، روش تحلیل فاکتوری مناسب تر از روش تحلیل مولفه های اصلی است ولی اگر هدف تحلیل ها تعریف تعداد کمتری از متغیرها نسبت به متغیرهای اندازه گیری شده باشد، روش تحلیل مولفه های اصلی مناسب تر است. البته گاهی تحلیل فاکتوری برای منظور اخیر نتایج مناسبی ارائه می دهد.
تجزیه و تحلیل خوشه ای (کلاستر)
در تحلیل خوشه ای هدف دست یافتن به ملاکی برای طبقه بندی هر چه مناسب تر متغیرها و یا نمونه ها براساس تشابه هر چه بیشتر درون گروهی و اختلاف هر چه بیشتر بین گروهی است. این خصوصیت به ما کمک می کند که بتوانیم متغیرها و نمونه ها را به صورت خوشه هایی که حداکثر تشابه ممکن را درون خود و حداکثر اختلاف را بین خود دارند رده بندی کنیم.
/سوران قادری/