انواع ضرایب همبستگی

ساخت وبلاگ

بنابراین ، اکنون ما این را پوشش داده ایم که ضریب همبستگی چیست ، اما اگر من گزینه های متفاوتی از خطی بودن رابطه داشته باشم یا متغیر طبقه بندی یا مداوم داشته باشم یا انواع مختلفی از توزیع ها را دارم ، در این صورت از کدام نوع ضریب همبستگی استفاده خواهیم کرد.

ما در این فصل شاهد آن خواهیم بود.

ما انواع مختلفی از ضرایب همبستگی مانند ضریب R پیرسون ، ضریب Rho Spearman یا ضریب تاو کندال را داریم.

در این ماژول به خصوص می توانیم در مورد پیرسون و اسپیرمن بیاموزیم.

چرا؟زیرا این ضرایب همبستگی بسیار گسترده ای هستند.

بنابراین ، اساساً ضریب R پیرسون چه کاری انجام می دهد؟این یک رابطه خطی بین هر دو متغیر عددی به ما می گوید ، به این معنی که هر دو متغیر کمی که کمی هستند ، به معنای آن است که به معنای تعداد است.

اگر بخواهیم در مورد رابطه آنها بیابیم ، از ضریب R پیرسون استفاده خواهیم کرد.

قبل از استفاده از R Pearson ، ما باید برخی از فرضیات آن را مانند هر دو متغیر من باید در نظر داشته باشیم ، این بدان معنی است که آنها باید متغیرهای عددی باشند.

داده های من از هر دو متغیر باید از توزیع های عادی پیروی کنند.

در داده های ما ، نباید از هر کدام از داده هایی که استفاده می کنیم یا از هر نمونه ای که از آن استفاده می کنیم ، دور ، Fouth ، Fouth وجود داشته باشد ، باید نماینده داده های کامل باشد.

پنجم ، باید یک رابطه خطی بین دو متغیر وجود داشته باشد ، به این معنی که اگر همه این پنج فرض را دنبال کنیم ، می توانیم از ضریب R پیرسون برای یافتن هر دو متغیر خطی استفاده کنیم ، بنابراین ، بیایید ببینیم فرمول است.

با نگاهی به فرمول ، باید آن را بسیار دشوار کنیم.

این x ، y ، حتی مربعات استفاده می شود ، چند برابر نیز وجود دارد؟این چیزی نیست که نگران آن باشید.

همانطور که در ماژول آخر دیدیم ، اگر کواریانس را با محصول انحراف استاندارد تقسیم کنم.

سپس به سادگی ضریب همبستگی به من می دهد.

بنابراین ، از این طریق ، در این فرمول ، r x y قدرت همبستگی من بین دو متغیر x و y است.

N کوچک اندازه نمونه من خواهد بود.

Sumission چیزی نیست جز کل مبلغی که ما انجام خواهیم داد ، از تمام مقادیری که خلاصه من نامیده می شود.

x به معنای مقدار متغیر X است.

y به معنای هر مقدار متغیر y است.

اگر ما آنها را ضرب کنیم ، نمرات مربوط به متغیر X و متغیر y.

سپس ما یک فرمول خاص دریافت خواهیم کرد.

ما فرمول ضریب R پیرسون را طبق نمونه یا جمعیت تغییر می دهیم ، که در صورت محاسبه نمونه های Pearson.

سپس ما آن را با R کوچک بیان خواهیم کرد ، که در آن X و Y کوچک را در اشتراک نگه می داریم.

فرمول ساده آن کواریانس x y است که توسط S از x چند برابر شده توسط S از y تقسیم شده است.

S از x و y چیست؟این انحراف استاندارد من از x و y است.

کواریانس x و y به سادگی این است که اگر کواریانس x و y را محاسبه کنیم ، پس از آن ضریب R شخص را برای هر نمونه به ما می دهد.

برای محاسبه جمعیت R Pearson ، ما آن را با یک نامه یونانی ، که ردیف است ، نشان می دهیم ، جایی که سرمایه X و سرمایه Y را در اشتراک نگه می داریم.

فرمول آن چیست؟به سادگی به جای S از x و s y ، من به سادگی از سیگما x و سیگما از y استفاده می کنم.

این بدان معناست که انحراف استاندارد جمعیت به جای انحراف استاندارد ، من جمعیت خود را پیرسون می کنم.

بنابراین ، از این طریق با قرار دادن ارزش های مختلف و یافتن کواریانس می توانیم R را پیدا کنیم.

آیا می بینید ضریب Rho Spearman چیست؟ما با ضریب Rho Spearman تماس می گیریم

به عنوان ضریب همبستگی Spearman نیز.

همچنین ، ما بیشتر از این استفاده می کنیم وقتی که قادر به استفاده از ضریب R پیرسون نیستیم ، این بدان معنی است که اگر فرض R هر یک از آنها از بین برود ، ما از Rho Spearman استفاده می کنیم.

به طور کلی ، ممکن است با نداشتن ارزش مداوم یا عددی باشد ، این امکان وجود دارد که ما یک ستون طبقه بندی داشته باشیم که در آن باید زن یا مرد تعریف شود ، باید موفقیت یا شکست تعریف شود.

اگر این نوع ستون های مختلف طبقه بندی شده من ، در آن مورد خاص یا اگر توزیع من از توزیع عادی پیروی نمی کند.

در تمام این شرایط ، جایی که ما نمی توانیم از ضریب پیرسون استفاده کنیم ، در آنجا از ضریب Spearman استفاده می کنیم.

این اساساً یک ضریب همبستگی درجه است.

چرا؟از آنجا که ما به هر متغیر ، بالاترین تا پایین ترین رتبه بندی می کنیم و بعد از آن ضریب آن را می یابیم.

بنابراین ، در کدام روش ها این کار را انجام می دهیم؟ما این را در فصل های آینده خواهیم دید.

بیایید تفاوت کمی بین پیرسون و اسپیرمن ببینیم.

ضریب پیرسون انجام می دهد؟این به ما می گفت خطی بودن هر

رابطه ، این بدان معنی است که اگر یک متغیر در یک جهت تغییر کند.

بنابراین ، در همان جهت متغیر دیگر نیز تغییر خواهد کرد یا نه.

یا با همان نرخ تغییر خواهد کرد یا نه؟اما ضریب Spearman چه کاری انجام می دهد؟این غیرخطی بودن را به ما می گوید ؛این یکنواختی روابط را به ما می گوید.

یکنواختی چیست؟اگر هر یک از مقادیر من در یک جهت تغییر می کند.

جهت باید یکسان باشد اما آیا با همان نرخ تغییر می کند یا نه؟این امر توسط ضریب ردیف Spearman به ما گفته می شود مانند اگر هر دو منحنی ، رابطه خطی را ببینیم که یک خط مستقیم از طریق x و y وجود دارد.

که به سادگی به من می گوید متغیرهای X و Y به صورت خطی مرتبط هستند و هر مقدار از این با همان نرخ تغییر می کند.

اما اگر یک رابطه یکنواخت را در منحنی راست مشاهده می کنید.

منحنی من دایره ای است.

در این حالت اگر مقدار X من در حال تغییر باشد ، جهت ارزش Y یکسان است.

در جهت مثبت تغییر می کند ، اما آیا نرخ آن یکسان است؟شماره

اگر مقدار X در این حالت بیشتر باشد ، مقدار Y کاهش می یابد.

به همین دلیل ما از Pearson و Spearman استفاده می کنیم ... اگر می خواهیم از خطی استفاده کنیم ، از Pearson استفاده می کنیم و اگر مجبور به یافتن غیر خطی هستیم ، از Spearman استفاده خواهیم کرد.

همانطور که در پیرسون دیده بودیم ، چگونه خطی مثبت و منفی را تعریف می کنیم.

به همین ترتیب ما یکنواختی را در این مورد خواهیم دید.

اگر منحنی روابط یکنواخت مثبت را مشاهده می کنید ، بنابراین این بدان معنی است که اگر یک مقدار من در حال افزایش باشد ، حتی مقدار دیگر افزایش می یابد.

رابطه یکنواخت منفی بدان معنی است که اگر یک مقدار در حال افزایش باشد ، مقدار دیگر کاهش می یابد.

مثل اینکه می توانیم از این منحنی بگیریم.

منحنی غیر یکنواخت به این معنی است که هر دو متغیر از تکمیل یک الگوی کاملاً در حال کاهش پیروی نمی کنند.

بیایید ببینیم که چگونه از ضریب همبستگی Spearman استفاده می کنیم و همه چیز در آن است

عمدتا برای ما استفاده می شود یا از چه طریق ، رتبه بندی را ارائه می دهیم؟بنابراین ، وجود دارد

منطق ساده ، اگر مجبور باشم ضریب همبستگی پیرسون را بین هر

متغیرها سپس ابتدا با دیدن فرمول رتبه Spearman شروع خواهیم کرد

فرمول ضریب همبستگی.

اگر فرمول آن را می بینید ، فرمول کمی عجیب است که می توانم ببینم.

یک منهای شش جمع بندی DI روی مکعب n منهای n.

مقادیر زیادی در آن وجود دارد.

بیایید این فرمول را از طریق یک مثال ببینیم.

تا بتوانیم همه این اصطلاحات را به راحتی درک کنیم.

فرض کنید اگر من 9 داده فیزیک و ریاضیات بچه ها را دارم ، به این معنی که تعداد بچه ها در فیزیک و ریاضی چند امتیاز کسب کرده اند ، من داده های آن مجموعه داده را دارم.

جایی که من باید رتبه دانش آموزان را در هر دو موضوع محاسبه کنم و باید همبستگی رتبه Spearman را پیدا کنم.

من باید دریابم که رابطه در رده های این دو موضوع چیست.

بنابراین ، ما آن را در یک مرحله خاص دنبال خواهیم کرد.

قدم اول ، من هر دو علامت موضوع را در یک جدول ذکر کردم ، در مقابل آن ما

یک رتبه را اختصاص داده اید ، مانند اگر در علائم فیزیک ببینید ، 47 مورد من بود

بیشترین ارزش ، بنابراین من آن را رتبه بندی کردم.

پس از آن ، اگر می بینید 43 مقدار دوم من است.

من به آن رتبه دو داده ام ، به همان روش حتی در ریاضیات از یک تا نه ، تمام ارزش ها را رتبه بندی کرده ام.

در مرحله دوم

ما یک ستون ایجاد کرده ایم که نام آن را به عنوان D ، D ، D اساساً تفاوت بین رده ها است ، این بدان معنی است که رتبه ای که ما در مورد فیزیک و نمرات ریاضی ایجاد کرده ایم ، تفاوت هر دو رده ها را می گیریم ، مانند ردیف اول ماببینید ، این رتبه سه برای فیزیک است و برای ریاضیات در رتبه پنج قرار دارد.

بنابراین ، اگر من سه را از پنج نفر تفریق کنم ، بنابراین ارزش من به عنوان دو است.

ما ارزش مطلق آن را خواهیم گرفت.

این را در خاطر داشته باشید.

ما مقدار منفی را حذف خواهیم کرد.

به همین ترتیب 5-3 2 ، 1-2 است ، ما 1 را گرفته ایم ، تمام مقادیر d را محاسبه کرده ایم.

ما در مرحله سوم چه کاری انجام دادیم؟ما تمام مقادیر D را مربع کردیم و آن را در یک ستون جدید مربع قرار داده ایم.

این بدان معناست که اگر مقدار D دو بود ، اگر مقدار D یکی باشد ، مربع 4 خواهد بود ، مربع آن 1 است.

به همین روش

ما یک ستون مربع D ایجاد کرده ایم.

اکنون کاری که ما انجام دادیم این است که من تمام ستون های مربع D را خلاصه کردم.

بعد از جمع بندی مقادیر مربع D که من 12 است.

در مرحله آخر انجام خواهد شد.

ما تمام مقادیر را در فرمول خود قرار خواهیم داد.

با این کار ما به راحتی می دانیم که آنچه D Square بود ، N.

من به سادگی تمام مقادیر مربع D را در این مقدار خاص قرار داده ام.

یک منهای 6 ضرب شده توسط 12 ، تقسیم شده توسط 9 ، 9 اندازه نمونه من بود.

این بدان معنی است که من داده های دانشجویی 9 را می خواندم.

9 ارزش آن خواهد بود.

مربع n به معنی ، مربع 9 81 منهای 1 است.

وقتی تمام این مقادیر را قرار دادم ، بعد همبستگی رتبه Spearman را گرفتم که 0. 9 بود.

بنابراین ، این یک همبستگی مثبت بین دو رده بود.

با این کار به راحتی می توانیم بگوییم که همه این مقادیر یک همبستگی مثبت تشکیل می دهند.

بنابراین ، به سادگی مقادیر رتبه Spearman من بین منهای یک و به علاوه یک نهفته است.

اگر به علاوه یک مقدار باشد ، می تواند یک همبستگی مثبت کامل بین رده ها باشد اگر منهای یک باشد ، می تواند یک همبستگی منفی کامل بین رده ها باشد و اگ ر-1 باشد ، همبستگی منفی کاملی بین رده ها خواهد بودبشر

اگر مقدار همبستگی Spearman من به 0 برسد.

بنابراین ، این بدان معنی است که هیچ ارتباطی بین رده ها وجود ندارد.

بنابراین ، به این ترتیب ، ما دیدیم که چگونه از طریق همبستگی رتبه Spearman ، می توانیم رتبه هر دو متغیر را ترغیب کنیم.

دو نوع ضرایب همبستگی را پوشش داده اند.

همبستگی های پیرسون و Rho.

اگر من یک رابطه خطی می خواهم ، اگر می خواهم در مورد رابطه غیرخطی یا یکنواختی بدانم ، از R پیروی می کنم ، پس Rho Spearman را دنبال می کنم.

اگر داده های مداوم یا عددی وجود داشته باشد ، ما از R Pearson استفاده خواهیم کرد ، اگر متغیرهای طبقه ای وجود داشته باشد ، ما Rho Spearman را دنبال خواهیم کرد.

به سادگی اگر این یک توزیع عادی است ، از Pearson استفاده کنید و اگر توزیع دیگری وجود دارد ، می توانیم Rho Spearman را دنبال کنیم.

بنابراین ، از این طریق ما دیده ایم که انواع مختلف ضرایب همبستگی و نحوه و زمان استفاده از آن چیست.

ما ماژول چهارم را در مورد آزمایش فرضیه تکمیل کرده ایم.

در این ماژول ، ما بسیاری از مفاهیم جدید را یاد گرفتیم ، بسیاری از اصطلاحات که برای اولین بار یاد می گیریم.

در واحد اول دیدیم که آزمایش فرضیه و چگونگی مفید بودن آن در علم داده است.

در واحد دوم ما اولین کاری را که باید هنگام انجام آزمایش فرضیه انجام دهیم ، این فرضیه تهی یا متناوب است.

چگونه می توانیم آن را برای موقعیت های مختلف ایجاد کنیم ، ما آن را از طریق نمونه های زیادی دیده ایم.

در واحد سوم دیدیم که اگر فرضیه تهی و متناوب دریافت کنید ، چگونه تصمیم به استفاده از هر آزمون می گیرید.

این بدان معناست که ما باید فرضیه تهی را رد کنیم یا نمی توانیم فرضیه تهی را رد کنیم ، چگونه می توانیم این تصمیمات را بر اساس منطقه بحرانی و پذیرش خود تشکیل دهیم.

ما همه این موارد را با جزئیات پوشش داده ایم.

در واحد چهارم دیدیم که انواع مختلف خطاها چیست.

که در آن در مورد خطای نوع یک و نوع دو یاد گرفتیم.

با نمونه هایی مانند محاکمه جنایی و واکسن Covid ، ما آن را به درستی درک کردیم ، چگونه می توان خطای نوع یک ما را کاهش داد یا خطای نوع دو کاهش می یابد.

در واحدهای پنجم و ششم ما پوشش می دهیم که کواریانس است.

ضریب همبستگی چیست.

چه ارتباطی بین آنها و انواع مختلفی از ضرایب همبستگی وجود دارد که در آن در مورد R و Rho Spearman پیرسون دیده ایم ، ما در مورد هر دو ضرایب با جزئیات یاد می گیریم.

چه موقع و چه ضریب ما باید از آن استفاده کنیم ، این در مورد جزئیات زیادی آموخته ایم.

در ماژول بعدی ما پوشش خواهیم داد که انواع مختلفی از آزمون های فرضیه هستند.

اگر نظر یا سؤال مربوط به این دوره دارید ، می توانید روی دکمه بحث در زیر این ویدیو کلیک کنید و می توانید آنها را در آنجا ارسال کنید.

به این ترتیب ، می توانید با سایر زبان آموزان مانند خود ارتباط برقرار کنید و می توانید با آنها صحبت کنید.

بهترین پلتفرم ترید...
ما را در سایت بهترین پلتفرم ترید دنبال می کنید

برچسب : نویسنده : جهان پناه حديث بازدید : 50 تاريخ : يکشنبه 6 فروردين 1402 ساعت: 1:41