机器学习
嗯_雅娴
数学系研究生
展开
-
sklearn决策树--泰坦尼克号幸存者预测
决策树的原理即利用不同的最优特征选择方法,优先选择样本纯度最高的特征来进行样本分类。其中: 使用信息增益的决策树算法为 ID3; 使用信息增益率的决策树算法为 C4.5; 使用Gini指数的决策树算法为 CART算法。 ID3算法中,信息增益(Information gain)越大,数据越纯净,越有序,自然地我们优先选取信息增益最大的特征来分类样本。样本集的信息熵(Entorpy)的值越小...原创 2019-12-16 01:40:44 · 2994 阅读 · 0 评论 -
scikit-learn两类决策树参数说明
原文链接:https://blog.csdn.net/qq_16000815/article/details/80954039 scikit-learn两类决策树参数说明 ''' scikit-learn中有两类决策树,它们均采用优化的CART决策树算法。 ''' from sklearn.tree import DecisionTreeRegressor ''' 回归决策树 ''' Decisi...转载 2019-12-16 00:46:05 · 463 阅读 · 0 评论 -
scikit-learn支持向量机(SVM)--手写数字识别
#手写数字识别 #scikit-learn库 from sklearn import datasets digits = datasets.load_digits() #加载scikit-learn自带的手写数字识别图片数据集 from matplotlib import pyplot as plt #将数据所代表的的图片显示出来 images_and_labels = list(z...原创 2019-12-11 17:34:25 · 1405 阅读 · 0 评论 -
机器学习应用开发典型步骤
一、数据清洗 统一同类数据的单位,去掉重复数据及噪声数据。使得数据具备结构化特征,方便作为机器学习算法的输入。 二、特征选择 从所有的特征值中,逐个分析选择合适的特征集合作为输入。 方法:1、人工选择;2、PCA算法 三、模型选择 根据问题领域、数据量大小、训练时长、模型准确度等多方面因素决定模型的选择。 四、模型训练和测试 将数据集分为训练集、测试集、验证集(交叉验证集)来进行模型训练。 五、模...原创 2019-12-11 10:36:53 · 431 阅读 · 0 评论 -
机器学习笔记总结--Coursera吴恩达
网易云视频连接:https://study.163.com/course/courseMain.htm?courseId=1004570029 笔记参考:http://daniellaah.github.io/2016/Machine-Learning-Andrew-Ng-My-Notes 监督学习与无监督学习 通常我们讲,任何的机器学习(Machine Learning,简ML)算法问题都可以分...原创 2019-08-15 11:45:41 · 262 阅读 · 0 评论