- مقدمه
داده کاوی پیشتر برای تحلیل بازار و الگوهای خرید مشتریان از فروشگاه های زنجیره ای بزرگ مورد استفاده می گرفت. امروزه با پیشرفت و توسعه فناوری، داده های بسیار زیاد پزشکی در بیمارستان ها و مراکز پزشکی در حال تولید می باشند. با توجه به هزینه های گزاف خدمات بهداشت و درمان هم برای بیماران و هم برای دولت، می توان از این داده ها برای صرفه جویی در هزینه های درمان با استفاده از تحلیل داده ها انجام داد. داده کاوی راهی است برای تحلیل اتوماتیک داده ها و شناسایی الگوهای پنهان که انجام این امر بصورت دستی ممکن نمی باشد. با استفاده از داده کاوی می توان، بهترین روش های درمانی و کم هزینه ترین روش ها را شناسایی کرد و این امر موجب کاهش در هزینه های درمانی می شود.
1. ارزیابی اثربخشی درمان
2. مدیریت بهداشت و درمان
3.مدیریت ارتباطات با مشتری
4. تشخیص تقلب و سوء استفاده
5. پزشکی بر پایه شواهد.
2.1 ارزیابی اثربخشی درمان:
با طبقه بندی داده ها بر اساس علائم بیماری می توان با مقایسه دوره درمان، موثر بودن درمان را تعیین کرد. برای مثال، با مقایسه نتیجه درمان گروه های بیماران با رژیم های مختلف دارویی برای یک بیماری یا وضعیت، می توان تعیین کرد کدام درمان بهتر و از نظر اقتصادی با صرفه تر است.
2.2 مدیریت درمان
با استفاده از داده کاوی می توان بیماری های مزمن و خطرناک را شناسایی کرد و نتیجه ی این کار مدیریت بهتر بر روی بیماران این بیماری میباشد که میتوانیم به این بیماری ها اولویت بیشتریاختصاص داده و در اورژانس ها و موقعیت هایی که زمان و منابع مورد نیاز در برخورد با تمام بیماران محدود می باشد، این بیماران را در اولویت اول قرار داد. حتی می توان تعداد موارد بستری در بیمارستان ها را کاهش داد و از پذیرش های بی جهت جلوگیریکرد.همچنین میتوان عوارض دارویی و تضاد دارویی برخی از درمان ها را شناسایی کرد و برای درمان دیگر بیماران ازنتیجه ی این الگوها استفادهنمود.
مثال:
- Seton و BlueCross:
- کاهش مدت زمان بستری.
- جلوگیری از عوارض کلینیکی
- شناسایی سندرم ها:
- SARS که از چند Symptom ایجاد می شود.
2.3 مدیریت ارتباطات با بیمار (CRM)
یکی از موضوعات مورد علاقه مراکز پزشکی و درمانی، بررسی رفتار در رابطه با بیماران میباشد که منجر به وفاداریبیماران می شود. نتیجه داده کاوی در یکی از بیمارستان ها متغییرهایمستقل و فاکتورهای دخیل در وفاداری بیماران این گونه بوده است:
متغییر LOS (طول زمان بستری) مهمترین فاکتور در وفاداری بیماران می باشد. محققان دریافتند که اگر بیماری بیشتر از 13.5 روز در بیمارستان بماند به احتمال 30% به عنوان وفادار شناخته خواهد شد، اگر مدت زمان بستری کمتر از 13.5 روز باشد، اگر ترکیب درمان ،انتخابی باشد 28% بعنوان وفادار شناسایی می شود. بیماری که جراحی نداشته باشد و در بخش داخلی بستری باشد به احتمال 70% و اگر در بخش جراحی بستری شود این احتمال به 17% خواهد رسید.
2.4 تشخیص
با توجه به هزینه های گزاف و مستمر در راستای آزمایشات و فرآیندهای آزمایشگاهی و کلینیکی و همچنین دردناک بودن و دشوار بودن بعضی از آزمایشات مانند biopsy در نمونه گیری برای تشخیص تمور، می توان از داده کاوی برای تشخیص بیماری ها استفاده کرد. می توانیم از الگوریتم جمع آوری داده های K-means* برای شناسایی این گونه تمورها استفاده کنیم، که طبق گزارشات توسعه دهندگان این الگوریتم، تهیه داده ها دقیق تر از نتایج پزشکی و آزمایشگاهی است. حتی عواملی را بیان کردند که می تواند به پزشکان در اخذ تصمیم این که بیمار مورد عمل Biopsy قرار گیرد یا نه کمک کند.
2.5 تقلب و سوء استفاده
برخی از افراد سود جو در خرید دارو از بیمه سوءاستفاده می کنند و داروهایی که خود نیاز ندارند تحت پوشش بیمه تهیه می کنند. یکی از کاربردهای داده کاوی تشخیص این گونه سوءاستفاده ها می باشد.
- EBM) evidence based medicine
در پزشکی مبتنی بر شواهد، پزشک با مطالعه در مقاله ها و منابع علمی معتبر منتشر شده، درمانبیماری بیمار خود را جستجو میکند. در این روش پزشک با چالش های زیر روبرو است:
– زمان برای جستجو
– باید صحت و اعتبار مقالات را بررسی کند.
– پس از پیدا کردن مقالات، هر مقاله یا منبع معتبر را بخواند و علائم بیماری بیمار را با فرضیات منبع مقایسه کند(برای اطمینان مناسب بودن منبع)
با استفاده از Text mining و Data mining میتوان هزینه های فرآیند دستی این روش درمان را از بین برد .
3چالش های داده کاوی در پزشکی
3.1اکثر روش های داده کاوی استاندارد، می توانند تنها الگوها را نمایش دهند، و قادر نیستند الگوها و تمایلات را شرح دهند. در مقابل، پزشکی نیاز به توصیف الگوها دارد زیرا یک تفاوت اندک می تواندنتیجه(مرگ یا ادامه زندگی) را تغییر دهد. مانند تشخیص بیماری آنفلوآنزا و بیماریanthrax کهنشانه های هر دو بیماری شبیه به هم هستند.
3.2 آماده کردن داده ها یا همان مرحله preprocessing داده ها یک مرحله بسیار دشوار است، چون داده ها باید کامل و بی عیب و نقضباشند تا داده کاوی بر روی داده ها درست انجام شوند و چالش مهمی که ما با آن روبرو هستیم، کامل نبودن داده های پزشکی می باشد و همچنینداده های پزشکی از منابع مختلف می باشند و تلفیق اطلاعات و آمادهسازی داده ها امری است دشوار.
3.3 حفظ حریم خصوصی در پزشکی: موضوع حفظ حریم خصوصی موضوعی است بسیار مهم در امر انتشار وتحویل داده ها پیش از داده کاوی می باشد. داده های پزشکی نیز شامل بیماری های افراد می باشد کهاطلاعات حساس افراد می باشند و این گونه اطلاعات در فرآیند داده کاوی نباید فاش شوند. مکانیزم ها و مدلهایی برای حفظ حریم خصوصی در داده کاوی طراحی شده که می توانند از فاش شدن اطلاعات حساس جلوگیری به عمل آورند. این مدل ها و روش ها شامل دستکاری داده ها، randomization و گمنامی می باشد. اما اگر کارایی داده کاوی از اهمیت بیشتری برخوردار باشد، سیاست های امنیتی در جهت حفظ حریم خصوصی باید به همراه داده کاوی انجام شود که شامل دستکاری در الگوریتم های داده کاوی برای محدود سازی داده کاوی و همچنین جلوگیری از خرابکاری از طریقquery auditing می باشد.
4 . مراجع
[1]. Fawzi Elias Bekri, Dr. A. Govardhan, Association of Data Mining and Healthcare Domain: Issues and Current State of the Art, Global Journal of Computer Science and Technology, December 2011
[2]. L. Sweeney. k-anonymity: a model for protecting privacy. International Journal on Uncertainty, Fuzziness and Knowledge-based Systems, 10 (5), 2002
[3]. Eun Whan Lee , Data Mining Application in Customer Relationship Management for Hospital Inpatients Healthc Inform Res. 2012 September; 18(3): 178–185. Published online 2012 September 30. doi: 10.4258/hir.2012.18.3.178
[4]. Hian Chye Koh and Gerald Tan, Data Mining Applications in Healthcare, Journal of Healthcare Information Management — Vol. 19, No. 2
[thrive_leads id='1265']