داده کاوی عمدتاً با ساختن مدل ها مرتبط است . یک مدل اساساً بـه الگـوریتم یـا مجموعـه ای از قوانینی گفته می شود که مجموعه ای از ورودی ها را با هدف یا مقصد خاصی مرتبط مـی نمایـد . یک مدل تحت شرایط درست می تواند منجر به بینش درست شود. بسیاری از مسائل محیط اطراف خود را می توان در قالب یکی از شش عمل زیر گنجاند، به عبارت دیگر برای تبدیل یک مسأله کسب و کار و تجارت به یک مسأله داده کاوی باید آن را بـه یکـی از فعالیت های داده کاوی تبدیل نمود، این فعالیتها عبارتند از:

 

  1.  دسته بندی
  2.  تخمین
  3.  پیش بینی
  4.  دسته بندی شباهت
  5.  خوشه بندی
  6.  توصیف و نمایه سازی

فعالیت های داده کاوی

سه مورد اول (دسته بندی، تخمین،پیش بینی) همگی مثال هایی از داده کاوی هدایت شده هستند که هدف آنها یافتن ارزش یک متغیر هدف خاص است . دسته بندی شباهت و خوشه بندی جـزء داده کاوی غیرهدایت شده هستند که در آن هدف، یافتن ساختاری در داده ها بدون توجه به یک متغیـر هدف خاص است. نمایه سازی عملی توصیفی است که می تواند هم هدایت شده و هم غیرهدایت شده باشد .

-1 دسته بندی

هدف دسته بندی داده ها ، سازماندهی و تخصیص داده ها به کلاس های مجزا است .در این پروسه بر اساس مجموعه داده های آموزشی، مدل اولیه ای ایجاد میشود، سپس این مدل برای دسته بنـدی داده های جد ید مورد استفاده قرار می گیرد، به این ترتیب با بکارگیری مدل بدست آمده تعلـق داده های جدید به دسته معین قابل پیش بینی است . به عبارت دیگر دسته بندی شامل بررسـی ویژگـی های یک شیء جدید و تخصیص آن به یکی از مجموعه های از قبل تعیین شده است .

 

 2- تخمین تخمین

عبارت اس ت از برآورد رابطه علت و معلولی بین مجموعه ای از متغیرها بگونـه ای کـه درآن یک متغیر معلول سایر متغیرها در نظر گرفته شده و روابط بین آنها برآورد می شود.در تخمـین، داده های ورودی وارد مدل شده و پس از تجزیه و تحلیل به صورت متغیرهای خروجـی ارائـه مـی شوند. نکته ح ائز اهمیت آن است که تخمین لزوما به زمان بستگی ندارد. مـدل هـای رگرسـیون و شبکه های عصبی از جمله تکنیک های مناسب داده کاوی برای تخمین می باشند

 

3- پیش بینی

در روش پیش بینی از داده های پیشین برای تهیه یک مدل که بیانگر رفتار مـشاهده کنـونی اسـت استفاده می شود . وقتی این مدل برای ورودی های کنونی بکار رفت نتیجه کـار پـیش بینـی رفتـار آینده خواهد بود. ساختن یک مدل پیش بینی کننده مستلزم تفکیک زمانی میان ورودی های مدل یا پیش بینی کننـده ها و خروجی های مدل یا پیش بینی شونده ها می باشد . اگر این تفکیک برقرار نباشد مدل درسـت کار نخواهد کرد. این یک مصداق از اهمیت پیروی از یک روش مناسب داده کاوی است.

4 – دسته بندی

شباهت یا قوانین وابستگی قوانین وابستگی، الگوهای موجود در داده ها را بدون هیچ هدف خاصی نشان مـی دهنـد . تـشخیص اینکه آیا این الگو معنی دار است یا نه ، به عهده فرد تحلیل گر است . بسیاری از افراد این اصطلاح را تحت موضوع تحلیل سبد بازار شنیده اند.قوانین وابـستگی در اصـل از داده هـای نقطـه فـر وش استخراج شده که مشخص می کند کدام کالاهابا هم خریداری شده اند .زنجیره های خـرده فروشـی مــــیتواننــــد از دســــته بنــــدی شــــباهت بــــرای تعیــــین چیــــدمان اقــــلام در قفسه های فروشگاه یا در یک کاتالوگ استفاده کن ند تا اقلامی که اغلب با هم خریداری مـی شـوند در کنار هم قرار گیرند .(مثلا افرادی که شیر خشک نوزاد می خرند با احتمال P1 شیـشه شـیر هـم می خرند.)

 

5- خوشه بندی داده ها

ممکن است حاوی ساختارهای پیچیده ای باشند که حتی بهترین تکنیکهای داده کـاوی هـم قادر به استخراج الگوهای معنی دار ازآنها نباشند.خوشه بندی، راهی را برای یافتن ساختار دادههـای پیچیده فراهم میآورد و سیگنالهای رقابتی ناهماهنگ را به اجزایشان تفکیک میکند. خوشه بندی به عمل تقسیم جمعیت ناهمگن به تعدادی از زیرمجموعه ها یا خوشه های همگن گفته می شود .

نقطه تمایز خوشه بندی از دسته بندی: در دسته بندی براساس یک مدل هر کدام از داده ه ا به دسته ای از پیش تعیین شده اختـصاص مـی یابد. این دسته ها از طریق یافته های پژوهش های پیشین تعیین گردیده اند . لیکن در روش خوشـه بندی هیچ دسته از پیش تعیین شده ای وجود ندارد و داده ها صرفاً بر اساس تشابه، گروه بندی می شوند و عناوین هر گروه نیز توسط کاربر تعیین می گردد.

6- توصیف و نمایه سازی

گاهی اوقات هدف داده کاوی تنها توصیف آ ن چیزی است کـه در یـک پایگـاه داده ای پیچیـده در جریان است که باعث افزایش درك ما از فرآیندها یی که در مرحله اول ، دادهها را تولیـد کـرده انـد، میشود.به عبارت ساده تر می توان از آن به شناخت داده از طریق بصری سـازی نیزنـام بـرد .نمایـه سازی یک روش آشنا برای بسیاری از مسائل است، که نیاز به درگیر شدن با تحلیل پیچیده داده ها ندارد. مثل تفاوت بین مشتریان سودآور و غیر سود آور. درخت های تصمیم گیری ابزار مفیدی برای نمایه سازی هستند . قوانین وابستگی و خوشه ب ندی را نیز می توان برای نمایه سازی استفاده نمود

[thrive_leads id='1265']
author-avatar

حدود علی ایوبی

من علی ایوبی هستم متخصص و مدرس بازاریابی اینترنتی، به کسانی که نیاز به دیجیتال مارکتینگ خود را دارند کمک می کنم که بتوانید سیستم بازاریابی آنلاین خود را راه اندازی کنند به نظرم من دلیل شکست شکست کسب و کارها نداشتن سیستمی برای جذب مخاطب(ترافیک) و تبدیل آن به مشتری(تبدیل) است روش کار من استفاده از سیستم قیف های فروش(Funnel) است.

بازگشت به لیست
0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها