scikit-learn
机器学习-scikit-learn
金融科技自习生
机器学习、数据挖掘、大数据、Python、金融科技。
展开
-
机器学习实战之朴素贝叶斯--python/scikit-learn实现
目录理论基础知识基本思想贝叶斯模型手动计算实例一:实战项目--屏蔽社区留言板的侮辱性言论Python版本Scikit-learn版本One more thing1.连续特征的处理方式2.零概率问题--拉普拉斯平滑理论基础知识贝叶斯与大多数机器学习算法不同,如:决策树,逻辑回归,支持向量机等都是判别方法,也就是直接学习出特征输出Y和特征X之间的...原创 2019-10-28 11:52:10 · 1661 阅读 · 0 评论 -
机器学习实战之决策树--Python/scikit-learn实现
目录简单理论介绍ID3--信息增益C4.5--信息增益率CART--基尼系数决策树对比机器学习实战-决策树预测隐形眼镜类型(ID3)Python实现Scikit-learn实现简单理论介绍ID3--信息增益信息熵( Information Entropy):度量了事物的不确定性,越不确定的事物,它的熵就越大;随机变量X它的熵表达式如下:其中 ...原创 2019-10-15 17:20:21 · 952 阅读 · 0 评论 -
scikit-learn机器学习--决策树
目录sklearn的基本建模流程分类树:DecisionTreeClassifier重要参数criterion实战部分重要接口七个参数:分类树与回归数参数对比回归数DecisionTreeRegressor实战部分:sklearn.tree模块 tree.DescisionTreeClassifier 分类树 tree.Descision...原创 2019-09-10 21:39:27 · 1238 阅读 · 0 评论 -
scikit-learn机器学习--随机森林
目录随机森林 RandomForestClassifier参数实战部分试验一试验二:n_estimators学习曲线ensemble模块 ensemble.AdaBoostClassifier AdaBoost分类 ensemble.AdaBoostRegressor Adaboost回归 ensemble.RandomForestClassi...原创 2019-09-11 21:48:05 · 1725 阅读 · 2 评论 -
scikit-learn机器学习--特征处理
参考并推荐:菜菜的sklearn课堂:http://edu.cda.cn/course/982目录1.归一化:preprocessing.MinMaxScaler1.1实战部分:1.2实战部分:numpy实现归一化2.标准化 preprocessing.StandardScaler2.1实战部分3.汇总4.缺失值处理4.1实战部分4.2实战部分:panda...原创 2019-09-12 11:59:25 · 1779 阅读 · 0 评论 -
机器学习实战之K近邻(KNN)-python/sklearn实现
目录简单理论介绍kNN算法之约会网站配对(Python)scikit-learn实现简单理论介绍K最近邻(k-Nearest Neighbor,KNN)分类算法应该是最简单的机器学习算法了。它采用测量不同特征值之间的距离方法进行分类。它的思想很简单:与它附近的k个样本比较,与它最相似(即特征空间中最邻近)的这K个样本中,大多数属于某一个类别,则该样本就属于这个类别。对于两个...原创 2019-10-11 16:15:31 · 1505 阅读 · 0 评论