در این فیلم آموزشی با نحوه محاسبه آمارههای توصیفی در نرمافزار R آشنا خواهید شد.
آمار توصیفی (Descriptive Statistics)
اولین گام در تجزیه و تحلیل دادهها استفاده از آمار توصیفی است که به کمک آن می توانیم خلاصهای از اطلاعات مربوط به یک مجموعه داده را گزارش کنیم. به عبارت دیگر، آمار توصیفی به منظور توصیف، نشان دادن و خلاصه کردن داده ها به شیوه ای معنادار بهکار میرود. در آمار توصیفی، دادههای خام با استفاده از محاسبه آمارههای خاص، جدولها و یا رسم نمودارها، به روشی تفسیر پذیر و قابل درک برای عموم ارائه میشود.
آمارهها در واقع نمایندهای از دادهها هستند که برای خلاصه کردن اطلاعات یک مجموعه داده در یک عدد به کار میروند. انواع آمارههای توصیفی عبارتند از شاخصهای مرکزی و شاخصهای پراکندگی.
شاخصهای مرکزی، گرایش دادههای عددی به مرکز را اندازهگیری میکنند. آمارههای مربوط به شاخصهای مرکزی در یک مجموعه داده شامل مقادیر میانگین، میانه و نما میباشند.
شاخصهای پراکندگی، میزان پراکندگی یا تغییرپذیری مجموعه دادههای عددی را اندازهگیری میکنند. آمارههای مربوط به شاخصهای پراکندگی در یک مجموعه داده شامل دامنه، دامنه میان چارکی، واریانس و انحراف معیار هستند.
در این قسمت از مجموعه آموزشی به بررسی آمارههای توصیفی در نرمافزار R میپردازیم و با توابعی که در این رابطه وجود دارند، آشنا خواهیم شد. همچنین در این قسمت نحوه محاسبه جدولهای توزیع فراوانی از جمله جدول فراوانی مطلق و جدول فراوانی نسبی را نیز بررسی میکنیم.