موزش – معرفی الگوریتم CART در داده کاوی (Classification and Regression Tree)
در معرفی مدل درختی با تقسیمات دوتایی می توان ازشاخص های دیگری نظیر آنتروپی نیز استفاده نمود. مزیت شاخص جینی نسبت به آنتروپی و شاخص های دیگر، سرعت بالاتر آن در انجام محاسبات است. مدل CART را می توان به عنوان یکی از شناخته شده ترین الگوهای رده بندی به منظور تشخیص و پیشگویی در علوم پزشکی بر شمرد.
در مدل CART هرس کردن درخت رده بندی بر اساس Cost-Complexity صورت می پذیرد و بررسی دقت درخت معرفی شده به کمک نمونه آزمون معرفی می گردد. یکی از ایرادات مطرح برای مدل CART اریبی این مدل در انتخاب متغیرها است. علاوه بر این، در متغیرهای کیفی با تعداد سطوح بیش از دو، نتایج حاصل گیج کننده خواهد بود. چون ممکن است چند سطح یک متغیر به یک گره تعلق بگیرد که این باعث می شود نتوان تفسیر ساده ای از نتایج ارائه نمود.
منبع :