آشنایی با توابع آشنایی با توابع ()separate() ،unite و ()extract در R
تفکیک و یا تجمیع مقادیر ستونها در یک مجموعه داده با استفاده از بسته tidyr
یکی دیگر از کارهایی که در مرحله پاکسازی دادهها (Data Cleaning)، و با استفاده از توابع بسته tidyr قابل انجام است، تفکیک و یا تجمیع مقادیر کاراکتری در ستونهای یک مجموعه داده است. در این قسمت سه تابع ()separate() ،unite و ()extract را مورد بررسی قرار میدهیم که به ترتیب برای تفکیک مقادیر کاراکتری به ستونهای مختلف، تجمیع مقادیر کاراکتری در یک ستون خاص و یا انتخاب مقادیری از یک ستون که شامل یک کاراکتر خاص هستند مورد استفاده قرار میگیرند.
اگر مقادیر یک ستون طوری باشند که بتوان آنها را تفکیک کرد؛ به عنوان مثال اگر در یک ستون تاریخ روزها ثبت شده باشند، با استفاده از تابع ()separate میتوان مقادیر این ستون را به سه ستون مجزا که شامل روز، ماه و سال است، تفکیک کرد. تابع ()unite عکس این کار را انجام میدهد و برای تجمیع مقادیر ستونها در یک ستون خاص مورد استفاده قرار میگیرد. تابع ()extract نیز یک مقدار کاراکتری را در بین مشاهدات یک ستون خاص جستجو و نتیجه را در ستون جدیدی ذخیره میکند.