کاربرد رگرسیون چندگانه در اکتشافات ژئوشیمیایى

 

عنوان مقاله : کاربرد رگرسیون چندگانه در اکتشافات ژئوشیمیایى
نوع مقاله : زمین شناسى اقتصادى واکتشاف
محل ارائه : بیست و پنجمین گردهمائى علوم زمین
  متن کامل :

 

◊◊◊◊ (کاوه پازند[۱]، دانشجوى کارشناسى ارشد اکتشاف معدن، دانشگاه صنعتى امیرکبیر، کارشناس شرکت زمین پیمایش باختر) (محسن یزدانى پور، دانشجوى کارشناسى ارشد اکتشاف معدن، دانشگاه صنعتى امیرکبیر) (امیر ملکى قهفرخى، دانشجوى کارشناسى ارشد اکتشاف معدن، دانشگاه صنعتى امیرکبیر ،کارشناس شرکت مهندسین مشاور کوشامعدن)   ◊◊◊◊ چکیده: روش هاى آمارى چند متغیره با در نظر گرفتن فرضهاى اولیه مورد نیاز و به کار گیرى دقت لازم، در ارائه یک تحلیل دقیقتر مى توانند راهگشا باشند. استفاده از این روش ها، امکان بررسى همزمان تغییرات چند متغیر را فراهم مى سازد. یکى از این روش ها، رگرسیون چندگانه مى باشد که با داشتن سادگى جبرى و تفسیر قابل فهم یکى از روشهاى کارآمد در آنالیز داده هاى چند متغیره است. این روش به خصوص در مورد عناصرى مانند طلا بسیار مناسب مى باشد. در این مطالعه ۱۷۰ نمونه از رسوبا ت آبراهه اى برگه ۱:۵۰۰۰۰ گودین برداشته شد و آنالیز شیمیایى بر روى ۴۴ عنصر صورت گرفت. اطلاعات بدست آمده پس از پردازش هاى آمارى مقدماتى به کمک روش رگرسیون چندگانه مورد تحلیل قرار گرفتند. نتایج بدست آمده نشان دهنده کارآیى بالاى این روش در تحلیل ناهمگنى هاى منطقه و تعیین پاراژنز مى باشد.  واژه هاى کلیدى: رگرسیون چندگانه، رسوبات آبراهه اى، گودین.   Abstract: Multivariate statistical methods can present a more precision analysis with considering the primary requirement hypothesis and enough precision. Using these methods provides possibility of study about variation of several variants. One of these methods is multivariate regression that has simplicity of its algebra and understandable interpretation. This type is a useful method for analyzing multivariate data set, especially some elements such as Au. In this study, 170 samples were taken from stream sediments of Goudin sheet and were geochemically analyzed for 44 elements. Received data set were analyzed with multivariate regression after the primary statistic process. The results showed the high efficiency of this method to determine paragenesis elements and interpret local nonhomogenouses. Key words: Multivariate regression, Stream sediments, Goudin     مقدمه :    در اکتشافات ژئوشیمایى اندازه گیرى بعضى از عناصر مرتبط با کانى سازى با مشکلاتى از قبیل بالا بودن هزینه ها و زیاد بودن خطاها همراه است. مهمترین این عناصر طلا است. از آنجا که در نقشه هاى ژئوشیمیایى، اغلب پتانسیل ضعیفى از طلا مشاهده مى شود بایستى براى گرفتن اطلاعات اکتشافى بیشتر از عناصر مرتبط با طلا ( ردیابهاب طلا) استفاده نمود. در خصوص مشکلات اکتشافى طلا در مطالعات ژئوشیمیایى مى توان گفت که بدلیل پایین بودن غلظت طلا، تغییرپذیرى زیاد آن در محیطهاى نمونه بردارى و توزیع ناهمگون طلا در نمونه، برداشت نمونه معرف و آماده سازى آن جهت آنالیز با مشکلات زیادى مواجه خواهیم شد. بنابراین آنومالى هائى که بر اساس این داده ها مشخص مى شوند معمولاً غیر قابل اطمینان مى باشند. عناصر ردیاب مختلفى همراه طلا تمرکز مى یابند که مى توان از این گونه متغیرها که اندازه گیرى آنها نسبت به طلا آسان تر و کم هزینه تر و کم خطا تر است استفاده نمود. یکى از راههاى یافتن آنومالیهاى ژئوشیمیایى طلا، تخمین مقدار طلا با استفاده از معادله رگرسیون چندگانه برازش شده به داده ها است بطوریکه در آن طلا به عنوان تابعى از مقدار عناصر ردیاب قابل تخمین باشد. پس از مشخص کردن آنومالى هاى ژئوشیمیایى طلا به روش رگرسیون لازم است نتایج را با آنچه که از تحلیل داده هاى طلا بدست مى آید مقایسه کرد و سپس با توجه به کلیه شواهد و قرائن اکتشافى نتیجه گیرى کرد. ◊◊◊◊ تحلیل رگرسیون    واژه رگرسیون اغلب جهت رساندن مفهوم بازگشت به یک مقدار متوسط یا میانگین به کار برده مى شود. تحلیل رگرسیون روشى است که جهت مطالعه روابط بین متغیرها و به ویژه فهم نحوه وابستگى یک متغیر به سایر متغیرها مورد استفاده قرار مى گیرد. به عبارتى تحلیل رگرسیون تحلیلى جهت کمى نمودن ارتباط بین یک متغیر ملاک ( یا متغیر وابسته) و یک یا چند متغیر پیش بینى کننده ( یا متغیر مستقل) مى باشد. بطور کلى این تکنیک را مى توان جهت دو مقصود اساسى به کار گرفت: ۱-      پیش بینى متغیر ملاک بر مبناب مقادیر معین متغیرهاى پیش بینى کننده ۲-      فهم نحوه ارتباط یا تأثیر گذارى متغیرهاى پیش بینى کننده بر متغیر ملاک   مدلهاى رگرسیون چندگانه    معادله رگرسیون خطى چندگانه به جاى یک عرض از مبدأ و ضریب زاویه داراى یک مقدار پابت ( مترادف با عرض از مبدأ) و به تعداد متغیرهاى مستقل داراى ضریب مى باشد. این ضرایب به نام ضرایب رگرسیون پارشیال خوانده مى شود. براى برآورد مقادیر ضرایب مى توان از روش کمترین مربعات استفاده کرد. یعنى ضرایب انتخاب مى شوند که مجموع مربعات اختلاف بین مقادیر پیش بینى شده و مشاهده شده متغیر وابسته ، کمترین مقدار را داشته باشد. با داشتن مقدار معینى از R2 (R ضریب همبستگى چندگانه) مى توان P2 ( P برآوردى است از اینکه مدل بدست آمده چقدر با داده هاى دیگرى که از همان جامعه گرفته شود برازش دارد) را براى مدل رگرسیون داراى یک متغیر مستقل به طریق زیر محاسبه نمود: براى مثال در صورتیکه در یک مدل P2=0.96 باشد بیانگر آن است که اگر این مدل خطى براى جامعه تمام مشاهدات به کار رود، آنگاه انتظار خواهیم داشت که مدل پیش بینى کننده، تقریباً ۹۶ درصد تغییرات در متغیر وابسته را توضیح دهد. در صورتیکه متغیر وابسته ماyiو متغیرهاى مستقل x1i , x2i , x3i ,…. باشند، عرض از مبدأ معادله رگرسیون  بوده و  ضرایب رگرسیون پارشیال مربوط به متغیرهاى مستقل مى باشند. بدین ترتیب معادله رگرسیون چندگانه حاصل بصورت زیر بیان مى شود: از طریق معادله بدست آمده مى توان مقدار متغیر yi را بر اساس مقادیر  متغیرهاى x1i , x2i , x3i ,… پیش بینى کرد. فرض لازم جهت انجام رگرسیون چندگانه آن است که رابطه بین متغیر وابسته و متغیرهاى مستقل، خطى باشد و نیز براى هر یک از ترکیب هاى مقادیر مستقل، توزیع متغیر وابسته نرمال بوده و واریانس آن ثابت باشد. در صورتیکه متغیرهاى مستقل با متغیر وابسته رابطه خطى نداشته باشند بایستى با روشهایى از قبیل لگاریتم گیرى از داده ها و … رابطه خطى بین متغیرها بوجود آورد. زمین شناسى منطقه      برگه گودین یکی از چهار برگه ۱:۵۰۰۰۰ واقع در برگه ۱:۱۰۰۰۰۰ تویسرکان می باشد که در استان همدان قرار دارد. منطقه مورد مطالعه در جنوب غربى برگه تویسرکان و بین طولهای  ً۰۰ َ۰۰ ْ   ۴۸تا ً۰۰ َ ۱۵ ْ۴۸ شرقی و عرضهایً۰۰ َ۳۰ ْ۳۴   تا ً۰۰ َ ۴۵ ْ۳۴شمالی واقع می باشد. برگه گودین از دیدگاه زمین شناسى ساختارى ایران در زون سنندج – سیرجان جاى گرفته است و ویژگیهاى همگانى این زون را دارد. بخش عمده منطقه مورد مطالعه را واحدهاى دگرگونى مى پوشانند. مجموعه سنگهاى دگرگونى ناحیه اى زون سنندج – سیرجان در منطقه از سه واحد سنگی تشکیل شده است. واحد اول بخش بزرگى از منطقه را مى پوشاند و متشکل از سنگهاى شیستى خاکسترى – نقره اى تا خاکسترى رنگ است که بطور معمول تحت عنوان شیست ها یا اسلیت هاى همدان شناخته مى شود. سنگ خاستگاه اولیه واحد یاد شده بیشتر شیل و ماسه سنگ است و عدسى هاى سنگ آهکى و مواد حاصل از فورانهاى آتشفشانى نیز در میان آنها تشکیل شده است. واحد دیگر که حجم بیشتر آنرا سنگهاى آهکى – دولومیتى به رنگ خاکسترى روشن تشکیل مى دهند دو رویداد دگرگونى را متحمل شده است که یک رویداد آن دگرگونى در حد شیست سبز است و دیگرى که بر سنگهاى این مجموعه اعمال شده است با کلریتى شدن کانیهاى قبلى مشخص مى شود. واحد سوم شامل سنگهاى متاریولیت، متاریوداسیت، متاولکانیکهاى بازیک تا متوسط، سنگ آهک مرمریتى و دولومیت است. واحدهاى سنگى دیگرى نیز در منطقه وجود دارد که پراکندگى کمترى دارند و شامل سنگهاى دیوریت، گرانیت، ماسه سنگ و کنگلومرا مى باشند.   شکل ۱ : نقشه زمین شناسى تویسرکان.     پردازش داده ها   در این برگه تعداد ۱۷۰ نمونه ار رسوبات آبراهه اى برداشت و پس از آماده سازى براى ۴۴ عنصر مورد آنالیز قرار گرفته اند. در این تحقیق براى عناصر W,Te,Tl,Ag,Au,Bi,Cd,S,Mo که بخشى از داده هاى آنها بصورت سنسورد گزارش شده بود با روش بیشترین درستنمائى کوهن مقادیر جانشینى براى هر عنصر محاسبه گردید.  
 ً۰۰ َ ۴۵ ْ۳۴
۰۰ َ۳۰ ْ۳۴  
ً۰۰ َ۰۰ ْ  ۴۸
ً۰۰ َ ۱۵ ْ۴۸   
شکل ۲ : موقعیت نقاط نمونه بردارى برگه ۱:۵۰۰۰۰ گودین.       خنثى سازى مؤلفه سنژنتیک و تخمین مقدار زمینه    براى جداسازى مؤلفه سنژنتیک از مؤلفه اپى ژنتیک به روش جداسازى جوامع سنگى عمل شده است. در این روش بر اساس نقشه زمین شناسى، نمونه ها بر حسب واحدهاى سنگى مؤثر در آنها جدا مى شوند. سپس در هر جامعه اثر لیتولوژى از طریق نرمالیزه کردن مقادیر نسبت به میانه حذف و مقدار هر عنصر در هر نمونه از یک جامعه به مقادیر میانه آن تقسیم شده، تا نسبت غنى شدگى یا تهى شدگى آن عنصر در هر نمونه محاسبه گردد. در نهایت جوامع حاصل با هم مخلوط شده و تحت یک جامعه همگن بررسى مى شوند. جامعه بدست آمده تحت عنوان جامعه شاخص غنى شدگى نامیده مى شود که در صورت دقت کافى تا حدود زیادى مستقل از فاکتور لیتولوژى در ناحیه منشأ رسوبات آبراهه اى باشد. قبل از انجام تحلیل آماری باید نرمال بودن توزیع متغیر ها امتحان شود زیرا روشهای آمارکلاسیک به توزیع غیر نرمال داده ها حساس هستند. لذا برای استفاده از این روش باید توزیع داده ها به توزیع نرمال تبدیل شود. داده های ژئوشیمیایی ناحیه ای عملا توزیع غیر نرمال دارند. براى تبدیل توزیع غیر نرمال عناصر به توزیع نرمال از تبدیل لگاریتمى و تبدیل کاکس- باکس استفاده شد. و داده هاى خارج از ردیف توسط روش دورفل جایگزین شدند. پس از تصحیح داده ها مقادیر  و  برای داده های نرمال شده بدست آمد که معرف حد آستانه ای و بالاتر از آن به عنوان ناهنجاری ممکن و مقادیر بالاتر از به عنوان ناهنجاری احتمالی معرفی شد.   رگرسیون چند متغیره    با استفاده از روشهایى چون P.N و آنالیز فاکتورى، تعدادى آنومالى در برگه گودین مشخص گردید. اگر بخواهیم براى رسم نقشه توزیع عناصر از این آنومالى ها استفاده کنیم ممکن است مساحت زیادى از نقشه را این آنومالى ها، که بعضاً چندان هم جالب توجه نمى باشند، اشغال کنند. بنابراین براى اعتبار بخشیدن به بعضى از این آنومالى ها نیاز است پردازش دیگر نیز بر روى داده ها صورت گیرد. همچنین به منظور شناخت عناصر ردیاب سایر متغرهاى ژئوشیمیایى و پردازش جدید بر روى آنها از آنالیز رگرسیون چند متغیره استفاده مى شود. براى انجام رگرسیون چند متغیره نرم افزار SPSS بکار گرفته شد. براى تعیین مدل رگرسیون، از روش رگرسیون مرحله اى یا قدم به قدم استفاده مى شود. در این روش متغیرها به ترتیب وارد معادله رگرسیون مى شوند و با ورود هر متغیر جدید کلیه متغیرهاى موجود در معادله دوباره مورد بررسى قرار مى گیرند. در این تسلسل اگر هر یک از متغیرها سطح معنى دارى خود را از دست بدهند قبل از ورود متغیر جدید از دور عملیات خارج مى شود و در پایان عملیات هیچ متغیرى که سطح معنى دارى آن کمتر از سطح مطلوب انتخاب شده باشد(۰۵/۰)، در معادله حضور نخواهد داشت. همیشه اولین متغیرى که به مدل رگرسیون وارد مى شود، متغیرى است که بیشترین همبستگى را با متغیر پاسخ دارد. در هر مرحله، مدل تحت آنالیز واریانس قرار گرفته و در صورتى که سطح معنى دارى کوچکتر از سطح مطلوب باشد، صحت انتخاب متغیر تأیید مى شود.    در جدول ۱ نتایج آنالیز رگرسیون چند متغیره آورده شده است. در این جدول عنصر طلا به عنوان متغیر وابسته در نظر گرفته و داده هاى سایر عناصر بعنوان متغیرهاى مستقل وارد مدل رگرسیون شده اند. مقدار۵۹/۰ = R2 نشان مى دهد که ۵۹ % تغییرات متغیر وابسته به وسیله متغیرهاى مستقل مشخصص مى شود. مقدار R2 تعدیل یافته از رابطه زیر بدست مى آید: که در آن k تعداد متغیرهاى مستقل مدل رگرسیونى است. معیار Ra2 حقیقى تر است، زیرا الزاماً با افزایش تعداد متغیرهاى مستقل افزایش نمى یابد در حالیکه مقدار R2 تابع تعداد متغیرهاى مستقل مدل است. در جدول DF‌ برابر درجه آزادى است ( k براى رگرسیون وn-k-1 براى باقیمانده) و عبارت Sum of squre‌مجموع مربعات با رابطه  براى باقیمانده است. Beta‌ برآورد ضرایب تعدیل شده  را نمایش مى دهد. در حقیقت Beta شیب خط رگرسیون است که به روش کمترین مربعات برآورد مى شود. ستون T مقدار آماده آزمون معنى دارى ضرایب رگرسیون است. جدول بعدى با عنوان Variables not in the equation به متغیرهایى اشاره مى کند که وارد مدل نشده اند. نام این متغیرهاى باVariable در جدول آمده است و Beta in مقدار ضریب رگرسیون متغیرهاى جدید در صورت ورود به مدل رگرسیون، با حضور متغیرهاى فبلى را نشان مى دهد. ستون Partial ضریب همبستگى جزئى بین هر متغیر و متغیر وابسته پس از کسر اثر خطى متغیرهایى که وارد مدل شده اند را نشان مى دهد. با بکار بردن آنالیز رگرسیون چند متغیره مى توان مقادیر هر عنصر را از روى مقادیر عناصرى که بیشترین همبستگى را با آن نشان مى دهند پیش بینى کرد. براى مثال رابطه اى را که از جدول ۱ مى توان براى عنصر طلا نوشت بصورت زیر است: Au = 0.547As + 0.277 Sb + 0.353 جدول ۱ : مشخصات حاصل از آنالیز رگرسیون چندگانه براى عنصر طلا.      براى رسم نقشه ناهنجاریها، مقادیر  و  برای داده های محاسبه شده بدست آمد که معرف حد آستانه ای و بالاتر از آن به عنوان ناهنجاری ممکن و مقادیر بالاتر از به عنوان ناهنجاری احتمالی معرفی شدند.                               شکل ۳ : نقشه ناهنجاریهاى طلا با استفاده از آنالیز رگرسیون چندگانه.     ◊◊◊◊ نتیجه گیرى :    درتعیین ناهنجارى هاوارائهنقشهمعرفىپتانسیلهاىمعدنى ،روش رگرسیون چندمتغیره کارایى مناسبى دارد و روشى کارآمد براى اکتشافات ژئوشیمیایى مى باشد. در این مطالعه با استفاده از این روش به تعیین پاراژنزهاى عنصرى منطقه گودین و تعیین ناهمگنى هاى موجود پرداخته شد. نتایج بدست آمده نشانگر قابلیت بالاى این روش در تحلیل ناهمگنى ها مى باشد. بدون شک براى دستیابى به جزئیات دقیقتر، استفاده همزمان از این روش و سایر روشهاى آمارى چند متغیره سودمند خواهد بود. استفاده از این روش با توجه به کارایى مناسب در اکتشافات ژئوشیمیایى سایر مناطق مشابه پیشنهاد مى گردد. ◊◊◊◊ منابع فارسى : ۱-                 حسنى پاک، على اصغر، (۱۳۷۱)، نمونه بردارى معدنى، انتشارات دانشگاه تهران. ۲-                 حسنى پاک، على اصغر، شرف الدین، محمد، (۱۳۸۰). تحلیل داده هاى اکتشافی. انتشارات دانشگاه تهران. ۳-                 سازمان زمین شناسى ایران، پایگاه داده ها، سایت اینترنتى، www.NGDIR.COM . ۴-         مهندسین مشاور کانى کاوان شرق، (۱۳۸۳)، اکتشافات ژئوشیمیایى- کانى سنگین سیستماتیک در محدوده ۱۰۰۰۰۰/۱ تویسرکان، گزارش سازمان زمین شناسى و اکتشافات معدنى کشور. ۵-         بی.اف.جى مانلى (۱۳۷۳)، آشنایى با روشهاى آمارى چند متغیره، مترجمین دکتر محمد مقدم، مهندس محمدى، مهندس آقایى سربرزه. ۶-                 دیک.ار.ویتینک (۱۳۷۲)، کاربرد تحلیل رگرسیون، ترجمه حمید ابریشمى و تیمور محمدى، انتشارات دانشگاه تهران. ۷-         میر مرتضوى، ایمر احسان،(۱۳۸۰)، اکتشافات نیمه تفصیلى ژئوشیمیایى در منطقه شمال تکاب(آقدره)، پایان نامه کارشناسى ارشد، دانشکده مهندسى معدنف دانشگاه صنعتى امیرکبیر. ◊◊◊◊       References: [8]. Rantitsch, G., ۲۰۰۴,”Geochemical exploration in a mountainous area by statistical modeling of polypopulational data distributions”, Journal of Geochemical Exploration, 82, 79–۹۵pp. [9].Stanley, C.R., Sinclair, A.J., 1989, “Comparison of probability plots and gap statistics in the selection of threshold for exploration geochemistry data, Journal of Geochemical Exploration, 32,355-357pp. [10] Fletcher, W,1997,” Stream Sediment Geochemistry in Todayes Exploration World in proceedings of Exploration, 97. [11]


مطالب مشابه :


رگرسیون چند متغیره

رگرسیون چند متغیره. در رگرسیون چند متغیری، یک متغیر را وابسته و متغیرهای دیگر را مستقل می
کاربرد رگرسیون چندگانه در اکتشافات ژئوشیمیایى

روش هاى آمارى چند متغیره با در نظر گرفتن در جدول ۱ نتایج آنالیز رگرسیون چند متغیره
رگرسيون

در رگرسیون ، صرف نظر از خاستگاه‌هاي اين تغييرات، به موجب تعريف بالسويه در چند
آموزش محاسبات آماري با نرم افزار مطلب

شده استفاده کرد در ادامه به تابع رگرسیون اشاره شده رگرسیون چند متغیره، یکی از
تحليل رگرسيون

در رگرسیون ، صرف نظر از خاستگاه‌هاي اين تغييرات، به موجب تعريف بالسويه در چند
تحلیل مسیر در spss

در تحلیل رگرسیون خطی چند متغیره قصد داریم رابطه خطی بین متغیرهای مستقل و متغیرهای وابسته را
مقدمه ای برلزوم استفاده از رگرسیون لوجستیک[1] در تحقیقات

بااستفاده از رگرسیون چند متغیره می توان اثر هریک تحلیل چند متغیره در سطوح
برچسب :