مروري بر داده هاي گم شده؛ مقاله آموزش مداوم
 
 
نویسندگان:  كاظمي الهه, كريملو مسعود*, رهگذر مهدي
 
 * تهران، اوين، بلوار دانشجو، خيابان کودکيار، دانشگاه علوم بهزيستي و توانبخشي، گروه آموزشي آمار حياتي
 
چکیده: 

در اين مقاله سعي شده است که مفاهيم گم شدگي داده به صورت ساده و کاربردي توضيح داده شود.
گم شدگي داده در تمامي پژوهش هاي علوم اجتماعي، رفتاري، پزشکي وجود دارد. در آمار، گم شدن داده به وضعيتي گفته مي شود که بخشي از مجموعه داده ها گزارش نشده باشند. گم شدگي داده باعث کاهش تطابق جامعه نمونه با جامعه کل شده و مي تواند منجر به نتيجه گيري اشتباه در مورد جمعيت اصلي شود.
گم شدگي داده يک اتفاق معمول بوده و بسته به ميزان آن، مي تواند اثر قابل توجهي در نتيجه گيري به دست آمده از داده ها داشته باشد. تمامي روش هاي برآورد پارامترها بر پايه فرض کامل بودن مجموعه داده ها استوار است و تحت برقراري اين شرايط منجر به برآوردهايي نااريب مي شوند؛ و البته با افزايش نسبت گم شدگي، مقدار اريبي نيز افزايش خواهد يافت.
براي دهه ها، محققين از روش هاي قديمي استفاده مي کرده اند، اين روش ها متکي به تصحيح مجموعه داده ها با صرف نظر کردن از موردهاي داراي مقادير گم شده و يا جايگزيني مقاديري تخميني با مقادير گم شده بودند. متاسفانه اکثر اين روش ها وابسته به برقراربودن فرض دلايل گم شدگي داده و نوع سازوکار گم شدگي است؛ و در صورت عدم برقراري اين فرض منجر به اريبي نتايج مي شود.

 
كليد واژه: داده گمشده، سازوکار گم شدگي کاملا تصادفي، سازوکار گم شدگي تصادفي، سازوکار گم شدگي غير قابل اغماض، سازوکار گم شدگي به علت ذات طرح
 
 
 
[thrive_leads id='1265']
author-avatar

حدود علی ایوبی

من علی ایوبی هستم متخصص و مدرس بازاریابی اینترنتی، به کسانی که نیاز به دیجیتال مارکتینگ خود را دارند کمک می کنم که بتوانید سیستم بازاریابی آنلاین خود را راه اندازی کنند به نظرم من دلیل شکست شکست کسب و کارها نداشتن سیستمی برای جذب مخاطب(ترافیک) و تبدیل آن به مشتری(تبدیل) است روش کار من استفاده از سیستم قیف های فروش(Funnel) است.

بازگشت به لیست
0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها