انواع ساختار داده در نرمافزار R (2)
انواع ساختار داده در R
مهمترین هدف در زبان برنامهنویسی R، تجزیه و تحلیل اطلاعات موجود در دادهها است. اولین قدم در تجزیه و تحلیل دادهها نیز آشنایی با نوع دادهها و ساختار آنها است؛ زیرا در هنگام تحلیل، باید از توابع خاصی استفاده کنیم و در ورودی این توابع دادههایی را که متناسب با نوع داده ورودی آنها است، به کار ببریم. ساختارهای مختلفی برای دسته بندی داده ها در R، وجود دارد. مهمترین این ساختارها عبارتند از: بردار (Vector)، ماتریس (Matrix)، چهارچوب داده (Data frame)، آرایه (Array)، لیست (List). در فیلم آموزشی قبل با دو ساختار داده بردار و ماتریس آشنا شدیم. در این فیلم ساختارهای دیگر از جمله چهارچوب داده، آرایه و لیست را مورد بررسی قرار میدهیم.
چهارچوب داده (Data frame): چهارچوب داده یا دیتا فریم تعمیمی از ماتریس است با این تفاوت که در هر ستون آن میتوان دادههایی با نوع متغیر متفاوت ذخیره کرد. دیتا فریمها نیز مانند ماتریسها، برای ذخیره دادههایی که به صورت جدولی هستند میتوانند استفاده شوند.
آرایه (Array): آرایهها ماتریسهای چند بعدی (بیشتر از دو بعد) هستند که برای ذخیره دادهها در ابعاد بالا به کار میرود. در واقع آرایهها از به هم پیوستن چندین ماتریس به یکدیگر تشکیل میشوند.
لیست (List): لیست نیز مجموعهای از دادهها با ساختار داده مختلف را میتواند در خود ذخیره کند. به عبارت دیگر، در داخل یک لیست میتوان اشیای مختلف مثل بردار، ماتریس، دیتا فریم و حتی یک لیست دیگر قرار داد.