حجم زیاد دادهای که به صورت پیوسته در حال افزایش است درون سازمان مشکلاتی را برای سازمانها به وجود آورده است که این افزایش درک درستی از اتفاقاتی که درون سازمان در حال اتفاق افتادن است را سخت و یا غیر ممکن می‌کند این مشکلات فهم سازمان را از گذشته و مشتریان برای کیفیت تصمیم گیری بسیار کاهش می دهد. امروزه سازمانها به اهمیت ارزش نهفته درون اطلاعات پی برده‌اند که می‌تواند کیفیت تصمیم گیری درون سازمان را به طور چشمگیری بهبود دهد، ولی امروزه سازمانها در دریایی از داده گیر افتاده اند و محتاج دانشند. شناخت اندکی از این قابلیت ها میتواند بسیار سود آور باشد و یا به میزان زیادی از ضررها جلوگیری نماید.

در این مقاله چند مورد از بهترین نرم‌افزار متن‌باز برای داده‌کاوی مورد استفاده قرار می گیرد معرفی شده است. هر یک از این نرم‌افزارها دارای نقاط قوت و ضعف هستند و برای زمینه خاصی مناسب است. بعضی برای داده‌کاوی ها بسیار پیجیده مناسب هستند و بعضی دیگر برای مقالات دانشجویی.با شناخت نیازهای خود و نگاه کردن به توانمندی ها و ضعف نرم‌افزار می‌توان بهترین نرم‌افزار را برای کار به دست آورد. این مقاله به 3 مورد از بهترین نرم‌افزار های داده‌کاوی که متن‌باز نیز هستند می پردازد. یکی دیگر از ویژگی های عالی این نرم‌افزار ها امکان اتصال هر یک از این نرم‌افزارها به یکدیگر است و می‌توان بدون هیچ مشکلی از نرم  افزار دیگر درون یک نرم‌افزار استفاده کرد.

داده‌کاوی چیست؟

شناخت روش‌های برای استفاده از قابلیت های نهفته در کسب و کار، یکی از مؤثرترین راههای موفقیت در بازار رقابتی است ولی پیدا کردن این قابلیت های نهفته بسیار سخت است و داده‌کاوی این کار را انجام می دهد.

مدیران بسیاری از شرکت ها و ادارات مانند بیمارستان ها، بانکها و مؤسسات مالی، شرکت های بیمه و …، با صرف هزینه های بالا اقدام به ایجاد پایگاههای داده و یا سیستم های مدیریتی همچون مدیریت منابع سازمانی و مدیریت ارتباط با مشتری نموده اند و ولی از گنجینه های پنهان (داده‌های) خود استفاده نمی‌کنند. این حجم از داده‌ها بدون تبدیل شدن به اطلاعات ارزشمند و دانش، در کسب و کار ارزش زیادی نخواهند داشت و هیچ کمکی به غیر از انبار داده نخواهد داشت و درانبوهی از داده‌ها گیر افتاده اند و محتاج دانش اند.

داده‌کاوی را می‌توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده است، نظیر عملیات: جمع آوری داده‌ها و ایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده‌ها. متاسفانه بسیاری از مدیران نمیدانند که این قابلیت های بالقوه وجود دارند و شناخت اندکی از این قابلیت ها میتواند بسیار سود آور باشد و یا به میزان زیادی از ضررها جلوگیری نماید.

دكتر شهرابي در بيان دانش داده كاوي اظهار داشت:( دانش داده كاوی سازمانها را قادر می سازد تا از سرمایه داده‌هایشان بهره برداری كنند و این ابزار برای پشتیباني فرایند تصمیم گیری استفاده می‌شود در واقع داده كاوی با پردازش جامع داده و انجام فرایند تصمیم سازی از طریق استخراج دانش با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می كند ).

 

به گزارش روابط عمومي دانشگاه صنعتي اميركبير: دكتر عليرضا رهايي رئيس دانشگاه صنعتي اميركبير با بيان اينكه داده كاوي ابزار و تكنيكي براي كشف اطلاعات و دانش است بيان داشت: داده كاوي در همه جا مطرح بوده و اميد است با گسترش اين رشته به تحليل مسائل مطرح در سطح كشور بپردازيم.

عوامل پیدایش داده‌کاوی

اصلی‌ترین دلیلی که باعث شد داده‌کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، در دسترس بودن حجم وسیعی از داده‌ها و نیاز شدید به اینکه از این داده‌ها اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست امده در کاربردهای وسیعی از مدیریت کسب و کار و کنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می گیرد.

 

ابزارهای داده‌کاوی، داده‌ها را آنالیز می‌کنند و الگوها ی داده‌هایی را کشف می‌کنند که می‌توان از ان درکاربردهایی نظیر: تعیین استراتژی برای کسب و کار، پایگاه دانش وتحقیقات علمی و پزشکی، تسخیص نقوذ و … استفاده کرد. شکاف موجود بین داده‌ها و و تحلیلگران داده سبب ایجاد نیاز شدیدی برای ابزارهای داده‌کاوی شده است تا داده‌های دارای ارزش کم را به دانشی کاربردی ارزشمند تبدیل کنیم.

البته اسامی دیگری نیز برای این فرایند پیشنهاد شده که بعضا بسیار متفاوت با واژه داده‌کاوی است، نظیر: استخراج دانش از پایگاه داده، استخراج دانش، انالیز داده/الگو، باستان شناسی داده، و لایروبی داده‌ها.

تعريف داده كاوي

با اهمیت ترین قسمت این موضوع استفاده از تعریف آن است تا درک دستی و یکسانی از این علم داشته باشیم تا بتوانیم درست در این بستر حرکت کنیم.
در داده کاوي معمولا به کشف الگوهاي مفيد از ميان داده‌ها اشاره مي شود. منظور از الگوي مفيد: مدلي در داده‌ها است که ارتباط ميان يک زير مجموعه از داده‌ها را توصيف مي کند، و معتبر، ساده، قابل فهم و جديد است.

تعاريف گوناگوني براي داده کاوي ارائه شده اند. برخي از اين تعاريف عبارتند از:
داده کاوي: عبارت است از فرايند استخراج اطلاعات معتبر، از پيش ناشناخته، قابل فهم و قابل اعتماد از پايگاه داده‌هاي بزرگ و استفاده از آن در تصميم گيري در فعاليت هاي تجاري مهم.
اصطلاح داده کاوي: به فرايند نيم خودکار تجزيه و تحليل پايگاه داده‌هاي بزرگ به منظور يافتن الگوهاي مفيد اطلاق مي شود
داده کاوي: يعني جستجو در يک پايگاه داده‌ها براي يافتن الگوهايي ميان داده‌ها.
داده کاوي: يعني استخراج دانش کلان، قابل استناد و جديد از پايگاه داده‌ها ي بزرگ.
داده کاوي: يعني تجزيه و تحليل مجموعه داده‌هاي قابل مشاهده براي يافتن روابط مطمئن بين داده‌ها.

تاریخچه داده‌کاوی

براي اولين بار مفهوم داده کاوي در کارگاه در زمينه کشف دانش در پایگاه داده‌ها توسط شیپر مطرح گرديد. به دنبال آن در سالهاي 1991 تا 1994، کارگاههاي کشف دانش در پایگاه داده‌ها مفاهيم جديدي را در اين شاخه از علم ارائه کردند.

داده‌کاوی در ابتدا از حوزه تجارت برخاست اما کاربردهای آن در سایر حوزه هائی که به گردآوری حجم وسیعی از داده‌های می پردازند که دستخوش تغییرات پویا نیز می گردند؛ مفید شناخته شد. بخشهایی مثل بانکداری، تجارت الکترونیک، تجارت سهام، بیمارستان و هتل از این نمونه اند.

داده‌کاوی یکی از پیشرفتهای اخیر در راستای فن آوریهای مدیریت دادههاست. مجموعه ای از فنون است که به شخص امکان میدهد تا ورای داده پردازی معمولی حرکت کند و به استخراج اطلاعاتی که درانبوه داده‌ها مخفی و یا پنهان است کمک می‌کند. این تکنولوژی امروزه دارای کاربرد بسیار وسیعی در حوزه های مختلف است به گونه ای که امروزه حد و مرزی برای کاربرد این دانش در نظر نگرفته و زمینه های کاری این دانش را از ذرات کف اقیانوسها تا اعماق فضا می دانند.

نکته ای: که باید در این قسمت بیان شود این است که داده‌کاوی به صورت یک محصول قابل خریداری نمی‌باشد، بلکه یک رشته عمل و فرآیندی است که بایستی به صورت یک پروژه پیاده‌سازی شود

کارکردهای داده‌کاوی
توصیف و کمک به پیش بینی دو کارکرد اصلی داده‌کاوی هستند. تحلیل داده مربوط به مشخصه های انتخابی متغیرها؛ از گذاشته و حال، و درک الگو مثالی از تحلیل توصیفی است. برآورد ارزش آینده یک متغیر و طرح ریزی کردن روند مثالی از توانایی پیشگویانه داده‌کاوی است.

  • توصیفی: فرايند جستجو در يك بانك داده براي يافتن الگوهاي پنهان، بدون داشتن يك فرضيه از پيش تعيين شده درباره اينكه اين الگو ممكن است چه باشد.
    مانند تحليلهايي كه برحسب كالاهاي خريداري شده صورت مي گيرد، اينگونه تحليلهاي سبدي نشانگر موارديست كه مشتري تمايل به خريد آنها دارند. اين اطلاعات مي تواند به بهبود موجودي، استراتژي طراحي، آرايش فروشگاه و تبليغات منجر گردد.

 

  • مدل پيش بيني: فرايندي كه الگوهاي كشف شــده از بانك داده را مي گيرد و آنها را براي پيش بيني آينده به كار مي برد.
    مانند پيش بيني فروش در خرده فروشي، الگوهاي كشف شده براي فروش به آنها كمك مي كند تا تصميماتي را در رابطه با موجودي اتخاذ كنند.

ارزیابی مدل ها

ارزیابی روش‌های کلاس‌بندی با معیارهای زیر انجام می‌پذیرد:

  1. میزان دقت(Accuracy) درپیشگویی، از جمله معیارهای ارزیابی روش‌های مذکور در کلاس‌بندی است که میزان قابلیت و توانایی یک مدل را در پیشگویی صحیح برچسب یک کلاس،مشخص می‌کند.
  2. سرعت(Speed ) و توسعه‌پذیری از نظر زمانیکه برای ایجاد یک مدل و زمان استفاده از ان مدل لازم است،از معیارهای دیگر ارزیابی روش در کلاس‌بندی است.
  3. قوی بودن(Robustness) معیار مهمی است که میزان توانایی یک مدل را در برخورد با نویز و مقادیر حذف شده تعیین می‌کند.
  4. توسعه‌پذیری(Scalability) معیار دیگری است که از نقطه نظر میزان کارایی در بانک‌های اطلاعاتی بزرگ و نه داده‌های مقیم در حافظه مورد بررسی قرار می گیرد.
  5. قابل تفسیر بودن(Interpreted) یعنی میزان و سطح درک ایجاد شده توسط مدل از دیگر مواردی است که می‌بایست در بررسی روش‌های کلاس‌بندی در نظر گرفت.

 

دلایل استفاده از متن‌باز

به دلیل حجم بزرگ داده‌ها نیاز به سیستم‌هایی است که بتواند این حجم از داده‌ها را پردازش کند و استفاده از متن‌باز یک مزیت بسیار بزرگی برای ایجاد کلاستر کردن و استفاده از پردازش موازی است. دلیل دیگر داده‌ها که در دنیای متن‌باز انواع روش‌های مختلف برای کار است که باید با برسی بهترین روشها را انتخاب کرد یا بعضی بهینه سازی ها را در روش‌های موجود به وجود آورد تا کارایی بهترین شود و از چهارچوب ساختاری کنار رفت و فراتر از آن فکر کرد که این قسمت هم توسط روش‌های متن‌باز مورد پشتیبانی می‌شود.

پروژه‌ای داده‌کاوی از 6 مرحله تشکیل‌شده‌اند که در مرحله آخر بحث توسعه است که باید به یک زبان برنامه‌نویسی در درون برنامه‌ها توسعه داد که توسط یک زبان برنامه‌نویسی پشتیبانی باید شود.

 

نرم‌افزارها

هدف ما در این مقاله مقایسه نیست بلکه بیان کردن توانمندی های هر نرم‌افزار برای کار داده‌کاوی است تا بنا به نیاز خود این‌یکی از نرم‌افزارهای داده‌کاوی را انتخاب کنند.

مقایسه 4 نرم‌افزار داده‌کاوی که جزو بهترین‌ها این زمینه هستند.

  • R
  • Rapid Miner
  • WEKA

دلیل انتخاب این 3 نرم‌افزار به شرح زیر است:

در آماری که از داده کاوان جهان انجام شده است این نرم‌افزارها از رتبه بالاتری برخوردار بودند.

 

رپدماینر(Rapid Miner)

این نرم‌افزار یکی از بهترین نرم‌افزاری‌های متن‌باز داده‌کاوی است. دلیل استفاده از آن هم می‌توان رابط گرافیکی بسیار کاربرپسند این نرم‌افزار نام برد که توانسته است کاربران زیادی را جذب می‌کند. پشتیبانی عالی شرکت RAPID-I از آن بسیار قوی است و آقای پروفسور نخعیزاده هم در متخصص در زمینه داده‌کاوی کار می‌کند این نرم‌افزار را برای کارهای داده‌کاوی پیشنهاد می‌کنند. استفاده از زبان گرافیکی کار با این نرم‌افزار را ،بدون از دست دادن قدرت این زبان، زیاد کرده است.

از ویژگی‌های این نرم‌افزار می‌توان به موارد زیر اشاره کرد.

  • ارائه گزارش و رونوشت از مراحل اجرای الگوریتم
  • ظاهری مناسب برای کار
  • امکان ورود انواع فایلها برای داده‌کاوی arff, excel and ….
  • امکان تصحیح و خطایابی بسیار دقیق
  • مستندات بسیار زیاد آن
  • قابلیت لوله گزاری
  • الگوریتم‌های بسیار زیاد برای کار داده‌کاوی
  • امکان افزودن الگوریتم‌های داده‌کاوی weka به این نرم‌افزار
  • امکان اتصال به نرم‌افزار R برای انجام تحلیل‌ها
  • کیفیت عالی الگوریتم‌ها برای کار
  • امکان استفاده در پلتفورم های مختلف
  • افزونه‌های دیگر برای کارهای مثل متن‌کاوی و سری های زمانی
  • امکانات گرافیکی بسیار عالی برای کار با این نرم‌افزار
  • امکان اتصال به پایگاه داده‌های مختلف
  • امکان برنامه‌نویسی دران (به دلیل این که 3 ساختار اصلی برنامه‌نویسی ساخت‌یافته دران پیاده‌سازی شده است)

 

واسط کاربر رپدماینر

این نرم‌افزار دارای واسط کاربری بسیار قوی است که از جمله مهم‌ترین نقاط قوت این نرم‌افزار است. ساختار بسیار عالی این نرم‌افزار برای اتصال به انواع پایگاه داده‌ها و پیش‌پردازش قوی و جامع کاربری فراوان این نرم‌افزار می‌توان به جزو ویژگی‌های عالی این نرم‌افزار به شمار می رود. ولی در قسمت مدل‌ها این نرم‌افزار از ضعف در کیفیت پایین مدل‌ها می‌توان اشاره کرد که بسیار کیفیت مدل‌سازی را کاهش داده است. ولی توسط بسته نرم‌افزار که به این نرم‌افزار اضافه می‌شود تمام الگوریتم‌های نرم‌افزار وکا را می‌توان در این قسمت استفاده کرد و بسیار قوی شناخته می‌شود.

الگوریتم‌های زیادی را پشتیبانی می‌کنند.

  • درخت تصمیم
  • شبکه‌ی عصبی
  • مدل های لجستیک خطی
  • بوست
  • روش‌های بیز
  • Svm
  • ورودی از انواع داده‌ها
  • خروجی از انواع داده‌ها
  • و روش‌های دیگر

واسط کاربری بسیار ساده این نرم‌افزار کار با آن را بسیار ساده کرده است به‌طوری که در عرض چند ساعت می‌توان کار با آن را یاد گرفت. استفاده از مدل‌های موجود در نرم‌افزار وکا باعث بالا بردن کیفیت مدل ها می‌شود.

 

وکا
WEKA (سرنام Waikato Environment for Knowledge Analysis) نرم‌افزاری آزاد و متن‌باز است که توسط دانشگاه وایکاتو در نیوزیلند طراحی شده است.

میزکار وکا، مجموعه‌ای از الگوریتم ‏های روز یادگیری ماشینی و ابزارهای پیش‌پردازش داده‌ها است . این نرم‌افزار به گونه‌ای طراحی‌شده که می‌توان به‌سرعت روش ‏های موجود را به‌صورت انعطاف‌پذیری روی مجموعه‌های جدید داده ، آزمایش نماید. این نرم‌افزار، پشتیبانی‏‏های الگوریتمی بسیار ارزشمندی را برای کل فرایند داده‌کاوی ‏های فراهم می‌کند. این پشتیبانی‏ها شامل آماده‌سازی داده‌های ورودی ، ارزیابی آماری چارچوب های یادگیری و نمایش گرافیکی داده‌های ورودی و نتایج یادگیری را در برمی‌گیرند . این نرم‌افزار شامل ابزارهای متنوع پیش‌پردازش داده‌ها است.
جعبه‌ابزار متنوع و جامع ، از طریق یک واسط متداول در دسترس است ، به‌نحوی‌که کاربر می‌تواند روش ‏های متفاوت را دران با یکدیگر مقایسه کند و روش‌هایی را که برای مسایل مد نظر مناسب تر هستند ، تشخیص دهد .هر محصول یک وب سایت خوب توسعه‌یافته دارد .

سادگی یادگیری نرم‌افزار باعث مي‌شود تا برای شروع داده‌کاوی معرفی وکا گزینه‌اي مناسب محسوب شود. تقریباً همه شركت‌هاي بزرگی که ابزاری برای کار با داده‌ها عرضه مي‌کنند، امکانات داده‌کاوی را نیز ارائه مي‌كنند. اما در میان نرم‌افزارهاي آزاد وکا چیز دیگری است. این نرم‌افزار برای نخستين‌بار در سال ۱۹۹۷ به شکل مدرنش نوشته شده و تحت مجوز GPL عرضه شد. پلتفرم جاوایی وکا باعث مي‌شود تا اجرای آن روی بيشتر سیستم‌عامل‌ها امكان‌پذير باشد. این سیستم همچنین به یک API عمومی مجهز است که شما مي‌توانید با گنجاندن آن در برنامه خودتان از امکانات داده‌کاوی وکا سود برید.

شروع کار با وکا

آموزش این قسمت از سایت گرفته شده است.
برای اجرای وکا به نصب JRE روی سیستم نیاز است. درصورتی‌که این موضوع صورت گرفته باشد، مشکل خاص دیگری در اجرای این نرم‌افزار نخواهید داشت.

صفحه آغازین شامل ۴ گزینه است:

  1. Explorer: محیطی برای مکاشفه در داده‌ها با استفاده از وکا
  2. Experimenter: محیطی برای انجام آزمون و انجام آزمايش‌هاي آماری میان روش‌هاي مختلف یادگیری
  3. Knowledge Flow: محیطی که تقریباً تمام کارایی اكسپلورر را پشتیبانی مي‌کند، اما در عوض از یک رابط drag-and-drop استفاده مي‌كنند.
  4. SimpleCLI: رابط ساده خط فرمان که به شما اجازه دسترسی مستقیم به دستورات وکا را مي‌دهد.
    محیط عملیاتی اكسپلورر برای شروع کافی است. پس اكنون وارد این محیط شوید.

 زبان آماری و داده‌کاوی R

 

کوچک اما توانا، این توصیف موجزترین تعبیری باشد که می‌توان راجع به نرم‌افزار R بیان کرد. این نرم‌افزار محیط بسیار مناسبی برای محاسبات آماری و ترسیم نمودارها است. این نرم‌افزار در سال‌های اخیر در دنیا شهرت بسزایی بافته و نظر کاربران زیادی  را به خود جلب کرده است. ویژگی که باعث شهرتش شده است

  • رایگان است و حمایت افراد دانشگاهی را داراست
  • روی اکثر سکوها قابل‌اجراست
  • بیش از 5 هزار بسته نسبی دارد که زمینه‌های مختلف آماری و داده‌کاوی را در بر می‌گیرد.

نرم‌افزار R یک زبان برنامه‌نویسی ریاضی شی گرای است که بسیار شبیه S-plus است و برای محاسبات آماری طراحی شده است.این پروژه از سال 1995 در گروه آمار دانشگاه Auckland شروع شد.

ویژگی های این زبان می‌توان به موارد زیر اشاره کرد.

  • رایگان بوده و تحت پلتفرم ها برای کلاست رینگ می‌توان استفاده کرد.
  • قابلیت های گرافیکی فراوان ای دارد.
  • یادگیری آسان و توابع پیش‌ساخته آماری فراوانی است
  • توابع را می‌توان به آسانی به‌کار بدر
  • بسته‌هایی از دیگر نرم‌افزارهای دادده کاوی دران وجود دارد.
  • سیستم تجاری آن را پشتیبانی می‌کند.
  • راهنمای بسیار عالی برای کار دارد.
  • با بیش از 5 هزار بسته بسیاری از نیاز برنامه‌نویسان را حل کرده است

 

در زبان r  می‌توان داده‌های زیر را نگه‌داری کرد.

 

R  مجموعه کامل از امکانات نرم‌افزاری برای کار کردن با داده‌ها و محاسبه و رسم نمودار است. ازجمله امکانات این مجموعه می‌توان به موارد زیر اشاره کرد:

  • زبان برنامه نوسی ساده و پیشرفته شامل عبارت های شرطی، حلقه و توابع بازگشتی و …
  • مجموعه قوی از عملگرهای محاسباتی آرایه‌ها و ماتریس‌ها
  • کتابخانه انجام عملیات داده‌کاوی و یادگیری ماشین
  • امکانات گرافیکی برای تجزیه‌وتحلیل داده‌ها
  • و ….

 

این زبان در پیش‌پردازش دادها و مدل‌سازی آن هیچ محدودیتی ندارد و می‌توان از پردازش موازی برای محاسبات استفاده کرد.

نتیجه‌گیری

امروزه با گسترش سیستم های پایگاهی و حجم بالای داده‌های ذخیره‌شده در این سیستم‌ها ، نیاز به ابزاری است تا بتوان داده‌های ذخیره‌شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرارداد و این داده‌های به نحو احسنت به دانش ارزشمند تبدیل کرد. ضعف شدید شرکت‌ها که در حجم عظیمی از داده گیر افتاده و فاقد اطلاعات یا دانش باارزشی که این داده‌ها هستند مشاهده می‌شود. دلیل این امر را می‌توان در کم بودن افراد متخصص و قیمت بالای پروژه‌های داده‌کاوی گفت. دانشی که توسط داده‌کاوی محیا می‌شود می‌تواند مشکلاتی که در سازمان‌ها به‌مرور زمان در لایه‌های شرکت‌ها به وجود آمده است را برطرف کند . در این گشت گزار به دلیل این که خود داده‌کاوی به عنوان ابزاری برای تحلیل داده‌ها استفاده می‌شود باید داده‌ها را برای ابراز تهیه کرد و این قسمت 60 درصد از هزینه داده‌کاوی را شامل می‌شود. کارهایی در زمینه پیش‌پردازش بسیار کارا خواهد بود.

 

پیشنهاد من که بنا به تجربه که در این پروژه به‌دست آورده‌ام این است که سوخت این موتور قدرتمند باید با دقت تامین شود و از رشته دانشگاهی که شد مهم نیست به دلیل این که داده‌کاوی توانمندی پردازش تمام این اطلاعات را دارد. پس تحقیقاتی باید در رشته‌های مختلف صورت گیرد تا بتوان این داده‌ها را به نحو احسنت به‌دست آورد و در تحلیل از داده‌کاوی استفاده نمود. اگر پروژه‌های بعدی در این راستا صورت گیرد بسیار کارا خواهد بود.

در آخر به این جمله مهم از دانشگاه MIT بسنده می‌کنم که جان کلام را می‌گوید: دانش داده‌کاوی یکی ازده دانش در حال توسعه‌ای است که دهه آینده با انقلاب فنّاورانه مواجه خواهد ساخت.

 

منابع:

[1]- L. Olson، David─ Delen، Dursun─ Advanced Data Mining Techniques؛ انتشاراتSpringer ؛2008 ؛ISBN: 978-3-540-76916-3 ؛

[2] – NONE YE, “THE HAND BOOK OF DATA MINING”, ARIZONA STATE UNIVERSITY, 2003.

[3] – CHRIS RYGIELSKI, “DATA MINING TECHNIQUES FOR CUSTOMER RELATIONSHIP, ISBN: 978-0-470-74397-3

[4] – Ian H. Witten, Eibe Frank, Mark A. Hall , Data Mining Third Edition
ISBN 978-0-12-374856-0

[5] -Xindong Wu, Vipin Kumar ,”Ten algorithm of data mining” , 2009 International Standard Book Number-13: 978-1-4200-8964-6

[6] دکتر شهرابی ،جمال ، داده‌کاوی پیشرفته: مفاهیم و الگوریتم‌ها، انتشارات: جهاد دانشگاهی

[7]-دکترصنیعی آباده، محمدداده‌کاوی کاربردی، انتشارات : نیاز دانش

[8]- منحاج محمد باقرمبانی شبکه های عصبی، انتشارات :دانشگاه امیرکبیر

[9]- سروش علیرضا،داده‌کاوی و هشمندی کسب و کار، انتشارات:ناقوس

[10]- علیزاده سمیه ،داده‌کاوی و کشف دانش گام به گام با نرم‌افزار کلمنتاین، انتشارات : خواجه نصیر الدین طوسی

[11]- بهبودیان، جواد ،آمار ریاضی ،انتشارات:موسسه امیرکبیر ISBN:987-964-00-0283-4

[12]- دکتر فتاحی پرویر،الگوریتم‌های فرا ابتکاری ، انتشارات: دانشگاه بوعلی سینا

 

 

 

[thrive_leads id='1265']
author-avatar

حدود علی ایوبی

من علی ایوبی هستم متخصص و مدرس بازاریابی اینترنتی، به کسانی که نیاز به دیجیتال مارکتینگ خود را دارند کمک می کنم که بتوانید سیستم بازاریابی آنلاین خود را راه اندازی کنند به نظرم من دلیل شکست شکست کسب و کارها نداشتن سیستمی برای جذب مخاطب(ترافیک) و تبدیل آن به مشتری(تبدیل) است روش کار من استفاده از سیستم قیف های فروش(Funnel) است.

بازگشت به لیست
0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها