一、所用到第三方库
Numpy:科学计算库
Pandas:数据分析处理库
Matplotlib:数据可视化库
Scikit-learn:机器学习库
二、线性回归
三、人工神经网络
四、K-Means聚类
五、决策树
六、NaiveBayes (朴素贝叶斯)
用这个算法最常见的场景就是针对垃圾邮件的分类判断;即,判断P(‘垃圾邮件’|‘具有某种特征’) 是否大于1/2。
七、分类回归树CART
八、最近邻算法——KNN 算法
KNN 算法本身简单有效,它是一种 lazy-learning 算法。
分类器不需要使用训练集进行训练,训练时间复杂度为0。
KNN 分类的计算复杂度和训练集中的文档数目成正比,也就是说,如果训练集中
文档总数为 n,那么 KNN 的分类时间复杂度为O(n)
九、线性回归算法(Linear Regression)
十、Logistic Regression(逻辑回归)
十一、SVM支持向量机
SVM 想要的就是找到各类样本点到超平面的距离最远,也就是找到最大间隔超平面。