آمار و احتمالات

اصطلاحات و برخی مفاهیم آمار

 همبستگی : رابطه بین دو یا چند متغیر را همبستگی می گویند.

همبستگی مثبت (مستقیم) : افزایش یا کاهش یکی باعث افزایش یا کاهش دیگری می شود.

همبستگی منفی (غیر مستقیم) : افزایش یکی باعث کاهش دیگری و بلعکس.

ضریب همبستگی: شاخصی آماری برای نشان دادن شدت و حدود همبستگی .

ضریب همبستگی پیرسون(r xy) : زمانی مورد استفاده است که متغیر های مورد مطالعه با استفاده از مقیاس فاصله ای یا نسبی اندازه گیری شده باشند.

ضریب همبستگی اسپیرمن( r s ):  زمانی مورد استفاده است که متغیر های مورد مطالعه با استفاده از مقیاس رتبه ای یا نسبی اندازه گیری شده باشند.

 

مفروضه ها ضریب همبستگی پیرسون :

 1- رابطه خطی بین متغیر ها

  2- توزیع ها دارای شکل مشابه باشند

 3- نمودار پراکندگی یکسان باشد.

 ضریب تعیین: با محاسبه این ضریب می توان تعیین کرد که چند درصد از کل واریانس X ناشی از واریانس Y است . این ضریب میزان تغییراتی را که بوسیله یک متغیر برای متغیر دیگر تعیین می شود محاسبه می کند . که فرمول آن عبارت است از ضریب همبستگی پیرسون به توان 2  ضرب در 100 .

نکته: از ضریب همبستگی نمی توان روابط علت و معلولی را نتیجه گرفت .

پیش بینی : چنانچه بین دو متغیر همبستگی وجود داشته باشد می توان نمره فردی را در یک متغیر از روی متغیر دیگر پیش بینی کرد ، دقت پیش بینی به شدت همبستگی بین متغیر پیش بینی شونده و متغیر پیش بینی کننده دارد. چنانچه همبستگی کامل باشد ( 1+ ، 1- ) پیش بینی کامل و دقیق امکان پذیر است .

هنگامی که همبستگی بین دو متغیر کامل نباشد پیش بینی یک برآورد خوب است نه بیان یک حقیقت مطلق.

بخش عمده و ذاتی پیش بینی رگرسیون است.

رگرسیون زمانی اتفاق می افتد که همبستگی بین دو متغیر کامل نباشد.(1+ ، 1- نباشد).

 

رگرسیون به طرف میانگین: زمانی است که همبستگی بین متغیر ها کامل نباشد در این صورت نمرات متغیر اول به سمت میانگین تمایل دارند .

خط برازش به منظور پیش بینی متغیر Y از روی متغیرX به کار برده می شود.

قانون حداقل مجذور ها : از آن برای تعیین بهترین خط برازش استفاده می کنیم (که عبارت است از حاصل جمع مجذور خطا ها).

خط رگرسیون: خطی است که موجب می شود خطا های پیش بینی به حداقل برسد.

همه اعداد یا نمرات پیش بینی شده بر روی یک خط قرار می گیرند چون برای بدست آوردن آن ها کلیه نمرات x  در یک عدد ثابت ضرب می شوند .

شاخص های مرکزی : (میانه، میانگین، نما)...برای تعیین مقدار متوسط نمره ها به کار برده می شودن.

شاخص های پراکندگی : (دامنه تغییرات، انحراف چارکی، واریانس، انحراف استاندارد)... این شاخص ها میزان پراکندگی یا تغییراتی که در نمره هاست نشان می دهند.

 

شاخص های مرکزی و شاخص های پراکندگی دو دسته از روش ها ی آمار توصیفی اند که استفاده از آن ها در توصیف نمره ها الزامی است .

استفاده از دامنه تغییرات مستلزم داشتن مقیاس فاصله ای است . ( در صورتی که مقیاس اندازه گیری اسمی یا ترتیبی باشد دامنه تغییرات شاخص مناسبی نیست ).

از انحراف چارکی زمانی استفاده می شود که مقیاس اندازه گیری حد اقل فاصله ای باشد.

برای محاسبه یا برای استفاده از انحراف متوسط باید مقیاس اندازه گیری حداقل فاصله ای باشد.

واریانس در آمار استنباطی کاربرد فراوانی دارد اما در آمار توصیفی محدود، چون با مجذور کردن انحراغ نمره ها از میانگین واحد واریانس یا واحد اندازه گیری تغییر پیدا خواهد کرد .

مقدار میانگین در زمانی که اعداد طبقه بندی شده اند با زمانی که طبقه بندی نشده اند متفاوت است، که به آن خطای طبقه بندی می گویند. این خطا در محاسبه میانگین آن قدر زیاد نیست که از نظر آماری دارای اهمیت باشد چون مثبت و منفی همدیگر را خنثی می کند . اما در محاسبه انحراف استاندارد، خطای طبقه بندی به دلیل آنکه انحراف ها مجذور می شوند، بیشتر می شود بنابراین برای تعدیل این خطا، انحراف استاندارد محاسبه شده باید تصحیح شود . که از تصحیح شپرد استفاده می شود . البته باید متذکر شد که مقدار این خطا به فاصله طبقات بستگی دارد هرچه فاصله طبقات بیشتر باشد خطا زیاد می شود .

برای محاسبه انحراف استاندارد مرکب (محاسبه میانگین انحراف استاندارد ها) از فرمول مک نیمار استفاده می شود.

زمانی که میانه مناسب ترین شاخص مرکزی باشد از انحراف چارکی برای محاسبه پراکندگی می توان استفاده کرد . هنگامی که نمودار نمره ها دارای کجی (مثبت، منفی) باشد انحراف چارکی شاخص مناسبی برای نشان دادن پراکندگی است .

بهتر است زمانی از انحراف استاندارد استفاده شود که میانگین به عنوان یک شاخص مرکزی مورد استفاده قرار گیرد. ( در زمانی که منحنی دارای کجی است نمی شود از آن استفاده کرد. ) در این مورد یعنی زمانی که منحنی دارای کجی است انحراف چارکی بهترین مورد است چون تحت تاثیر اعداد بزرگ و کوچک قرار نمی گیرد.

رتبه درصدی شاخصی است ترتیبی که رتبه نسبی فرد یا عدد را نسبت به افراد یا اعداد دیگر تعیین می کند.

نمره های استاندارد وضغیت فرد یا عدد را نسبت به میانگین تعیین می کنند.( نمره های استاندارد با مقیاس فاصله ای به کار برده می شوند.).

نمره های استاندارد نشان می دهند که یک نمره چند انحراف استاندارد بالا یا پایین میانگین قرار دارد.

میانگین و  انحراف استاندارد هر توضیع استاندارد شده ای به ترتیب صفر و یک است.

 

انواع نمره های استاندارد :

 

1- نمره z  : شاخص ترین نمره با میانگین 0 و انحراف استاندارد 1 می باشد.

2- نمره t   : میانگین 50 و انحراف استاندارد 10 .

3- نمره نه گانه:  میانگین 5 و انحراف استاندارد 2 .

 

 

 

 

 

کواریانس

1- مقدمه:

در این نوشتار قصد داریم به معرفی آنالیز اجزا اصلی (Principal components analysis) به پردازیم. آنالیز اجزا اصلی  (pca) یک تکنیک مفید آماری است که کاربرد آن در زمینه های از قبیل : تشخیص چهره،فشرده سازی تصویر و یک تکنیک رایج برای شناسایی یک نمونه در داده های از بعد بالا است.

این تبدیل که با اسامی دیگری چون هتلینگ(Hostelling Transform)، کارهانن-لو(Karhunen-Live Transform(KLT)) و بردار های ویژه نیز شناخته می شود،تبدیل بهینه در کارهای فشرده سازی و کاهش بعد است و خطای میانگین مربعات حاصل از فشرده سازی را کمینه می کند. هر چند این تبدیل به علت وابسته بودن به داده ورودی، جای خود را در الگوریتم های کاربردی و عملی، به تبدیل گسسته کسینوسی(Discret Cosine Transform(DCT)) داده است اما در صورت کافی بودن داده ورودی می تواند تبدیل بهینه را استخراج نماید.

آنالیز اجزای اصلی یک روش اختیاری چند منغیری است. اگر ما در جایی مجبور هستیم مهم ترین متغیر را یا یک تعداد محدودی از متغیر ها را دریک مجموعه انتخاب کنیم از آنالیز اجزای اصلی کمک می گیریم .

آنالیز اجزای اصلی می تواند هم چنین برای پیدا کردن سیگنال ها در اطلاعات نویزدار به کار رود.

قبل از این که از آنالیز اجزا اصلی توصیفی به دست آوریم ابتدا به معرفی مفاهیمی ریاضی که در آنالیز اجزا اصلی استفاده می شود می پردازیم.

این قسمت انحراف معیار، کوورایانس ، بردارهای مشخصه و مقادیر ویژه را پوشش می دهد.این دور نما دانشی قابل فهم از قسمت های آنالیز اجزا اصلی فراهم می آورد.

در این نوشتار مثال های وجود دارد که از طریق آن معنی و مفهوم بحث را روشن می سازد.

2- ریاضیات زمینه(لازم):

در این قسمت تلاش می کند که مهارت های لازم در ریاضیات پایه مورد نیاز در آنالیز اجزا اصلی بدست آوریم.

به خاطر سپردن طرز کار صحیح تکنیک ریاضی نسبت به فهمیدن دلایل اهمیت کمتری دارد. زیرا که یک تکنیک ممکن استفاده شود و نتیجه عملی به ما در مورد داده نهایی بگوید.

در این قسمت ابتدا به بخشی از آمار که در توزیع اندازه یا چگونگی پراکندگی داده ها است توجه می کنیم و در بخش دیگر به ماتریس جبری، مقادیر ویژه و بردار های مشخصه که مهمترین ویژگی یک ماتریس که اساس آنالیز اجزا اصلی توجه می کنیم.

2-1 آمار:

در سراسر بحث آماری ما با مجموعه نسبتا بزرگی از داده ها سر و کار داریم و باید ارتباط (وابستگی) بین مجموعه با نقاط خاص در آن مجموعه داده را تحلیل کنیم. اما ما قصد داریم در مجموعه داده ها توجه کنیم به تعداد کمی از اطلاعات و نتیجه ای که درباره این مجموعه داده ها به ما می دهد.

2-1-1 انحراف معیار استاندارد :

برای فهمیدن انحراف معیار به یک مجموعه داده احتیاج داریم. آمارشناسان معمولا علاقمند به نمونه گیری از جامعه هستند. برای استفاده کردن از روش های نمونه گیری به عنوان مثال جامعه تمام مردم یک کشور است. در حالی که یک نمونه یک زیر مجموعه از جامعه است که آمارشناسان اندازه می گیرند.


مطالب مشابه :


خطای استاندارد برآورد و تفسیر آن

انحراف استاندارد نمرات y در یک سطح x مشخص به عنوان خطای استاندارد برآورد در نظر فرمول: *sy : se




حسابداری سنجش مسئولیت و تجزیه و تحلیل انحرافات

اختلاف بین بهای تمام شده واقعی و استاندارد را انحراف می فرمول بهای تمام شده




شاخص های پراكندگي

انحراف استاندارد که بین این تابع با تابع لجستیک دارد با اضافه کردن مقدار ثابت در فرمول




آزمون‏های معناداری و “اندازه ‏ی اثر”

حوزه‏ی وسیعی از فرمول Mj میانگین جامعه‏ی j ام از بین k گروه است و δ انحراف استاندارد




سوال دوم:کوواریانس چیست؟

با توجه به فرمول کوواریانس می‏توان گفت که میانگین و هم بر اساس انحراف استاندارد




حسابداری سنجش مسئولیت و تجزیه و تحلیل انحرافات

اختلاف بین بهای تمام شده واقعی و استاندارد را انحراف می نامند و گیری شود فرمول تعیین




آمار و احتمالات

که فرمول آن عبارت است از ضریب اما در محاسبه انحراف استاندارد، خطای طبقه بندی به دلیل




محاسبه حجم نمونه با فرمول کوکران

فرمول کوکران. یکی می دهند بسته به میانگین و انحراف استاندارد مورد نظر و در دسترس از نمونه




بولينكر باندBollinger Band

نوسانات بر اساس انحراف استاندارد ، که حرکت ساده هم در فرمول انحراف استاندارد




تست های صنعتی ارشد به همراه جواب تشریحی

با دقت در دو فرمول انحراف ترکیب و انحراف مصرف: نرخ استاندارد * ترکیب استاندارد) = انحراف




برچسب :