الگوریتمهای مختلفی در حوزه یادگیری ماشین و هوش مصنوعی در سالهای اخیر ایجاد یا بهبود یافته اند که برای هر فردی که قصد کار حرفه ای در این حوزه را دارد، آشنایی و تسلط بر آنها و مفاهیم پایه هر کدام و نیز استفاده از آنها در کاربردهای عملی، جزء ضروریات است . سایت مهندسی داده ، اخیراً شروع به نشر مقالاتی در توضیح این الگوریتم ها و نمونه کدهای پایتون و R برای هر کدام نموده است که در بخش اول این مجموعه از مقالات به بررسی دسته بندی کلی این الگوریتم ها پرداختیم و برای اینکه یک مرجعی از الگوریتم های لازم را برای علاقه مندان و محققین ایجاد کنیم ، تصمیم گرفتیم در بخش دوم این مجموعه، الگوریتمهای اصلی یادگیری ماشین را فهرست کنیم .

در سال ۲۰۰۷ یک مقاله با عنوان ده الگوریتم برتر حوزه داده کاوی در دنیا توسط دانشگاه ورمونت مطرح شد که نسخه فارسی شده (دانلود)و حتی آماده انتشار به صورت کتاب آنرا هم در ایران داریم .

این ده الگوریتم که می توانید توضیحات آنها عبارتند از :

در سال ۲۰۱۱، در سایت پرسش و پاسخ معروف Qura در پاسخ به سوالی که ده الگوریتم برتر داده کاوی را پرسیده بود، موارد زیر توسط کاربران برشمرده شده اند :

  1. Kernel Density Estimation and Non-parametric Bayes Classifier
  2. K-Means
  3. Kernel Principal Components Analysis
  4. Linear Regression
  5. Neighbors (Nearest, Farthest, Range, k, Classification)
  6. Non-Negative Matrix Factorization
  7. Support Vector Machines
  8. Dimensionality Reduction
  9. Fast Singular Value Decomposition
  10. Decision Tree
  11. Bootstapped SVM
  12. Decision Tree
  13. Gaussian Processes
  14. Logistic Regression
  15. Logit Boost
  16. Model Tree
  17. Naïve Bayes
  18. Nearest Neighbors
  19. PLS
  20. Random Forest
  21. Ridge Regression
  22. Support Vector Machine
  23. Classification: logistic regression, naïve bayes, SVM, decision tree
  24. Regression: multiple regression, SVM
  25. Attribute importance: MDL
  26. Anomaly detection: one-class SVM
  27. Clustering: k-means, orthogonal partitioning
  28. Association: A Priori
  29. Feature extraction: NNMF

و در سال ۲۰۱۵ این لیست به صورت زیر در آمده است :

  1. Linear regression
  2. Logistic regression
  3. k-means
  4. SVMs
  5. Random Forests
  6. Matrix Factorization/SVD
  7. Gradient Boosted Decision Trees/Machines
  8. Naive Bayes
  9. Artificial Neural Networks
  10. For the last one I’d let you pick one of the following:
  11. Bayesian Networks
  12. Elastic Nets
  13. Any other clustering algo besides k-means
  14. LDA
  15. Conditional Random Fields
  16. HDPs or other Bayesian non-parametric model

سعی خواهیم کرد که تا چند ماه آتی ، تمامی این الگوریتم ها را با مثالها و نقاط ضعف و قوت و نیز نمونه کدهای لازم در این سایت بررسی کنیم.

[thrive_leads id='1265']
author-avatar

حدود علی ایوبی

من علی ایوبی هستم متخصص و مدرس بازاریابی اینترنتی، به کسانی که نیاز به دیجیتال مارکتینگ خود را دارند کمک می کنم که بتوانید سیستم بازاریابی آنلاین خود را راه اندازی کنند به نظرم من دلیل شکست شکست کسب و کارها نداشتن سیستمی برای جذب مخاطب(ترافیک) و تبدیل آن به مشتری(تبدیل) است روش کار من استفاده از سیستم قیف های فروش(Funnel) است.

بازگشت به لیست
0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها