یک روش بسیار ساده در این کار استفاده از قوانین رده بندی است که صفات بخش اگر داروهای مصرفی است و بخش انگاه ان نوع بیماری است. در این حالت نویزهایی مانند استفاده از دفترچه دیگران اگر درصد پایینی داشته باشد اثری روی مساله نخواهد داشت.
روشهای پیچیده تر استفاده از الگوریتم های تجزیه ماتریس matrix factorization است که از جمله روشهای جبر خطی هستند و در داده های دیگر بهتر از روشهای دیگر روی داده تنک جواب داده اند. مقاله هایی بنده در این راستا ارائه کرده ام که تخصصی این روشها را در داده تنک شبیه این داده بررسی و چالشهای ان را مشخص و روش متناسب ارائه کرده است. ازمون ما روی داده مدیا جواب خیلی مناسبی داشته است.
استفاده از قوانین رده بندی
اشتراک در
وارد شدن
0 نظرات