机器学习
文章平均质量分 93
明镜应缺
这个作者很懒,什么都没留下…
展开
-
决策树实例及原理
一、实例import pandas as pdfrom sklearn.tree import DecisionTreeClassifier #决策树分类器。from sklearn.feature_extraction import DictVectorizer # 将特征值映射列表转换为向量from sklearn.model_selection import train_test_s...原创 2019-07-22 23:05:43 · 354 阅读 · 0 评论 -
机器学习kaggle案例:风控评分卡模型(Give_Me_Some_Credit)
kaggle链接:https://www.kaggle.com/c/GiveMeSomeCreditipynb文件:https://github.com/824024445/KaggleCases/blob/master/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0kaggle%E6%A1%88%E4%BE%8B%EF%BC%9A%E9%A3%8E%E6%8E%A7%...原创 2019-08-21 02:02:31 · 8906 阅读 · 1 评论 -
学习曲线函数
from sklearn.svm import LinearSVC from sklearn.learning_curve import learning_curve #绘制学习曲线,以确定模型的状况 def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, ...原创 2019-08-15 16:35:35 · 403 阅读 · 0 评论 -
机器学习:8降维
ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/8降维.ipynb《Sklearn与TensorFlow机器学习实用指南》学习笔记维数灾难:很多机器学习的问题都会涉及到有着几千甚至数百万维的特征的训练实例,这不仅让训练过程变得非常缓慢,同时还很难找到一个很好的解。幸运的是,在现实生活中我们...原创 2019-08-14 16:37:53 · 379 阅读 · 0 评论 -
机器学习:6决策树
ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/6决策树.ipynb《Sklearn与TensorFlow机器学习实用指南》学习笔记决策树和支持向量机一样, 决策树是一种多功能机器学习算法, 即可以执行分类任务也可以执行回归任务。决策树也是随机森林的基本组成部分,而随机森林是当今最强大的机...原创 2019-08-09 16:03:17 · 321 阅读 · 0 评论 -
机器学习经典Kaggle案例:泰坦尼克号:从灾难中学习机器
kaggle链接:https://www.kaggle.com/c/titanic一、简介泰坦尼克号案例可以说是kaggle的“hello world”,入门者的必看案例。1.1 比赛描述RMS泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为...原创 2019-08-18 17:48:13 · 17522 阅读 · 7 评论 -
机器学习:7集成学习和随机森林
ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/7集成学习和随机森林.ipynb《Sklearn与TensorFlow机器学习实用指南》学习笔记一、集成学习集成学习就是合并多个分类器的预测。一般会在一个项目快结束的时候使用集成算法,一旦建立了一些好的分类器,就可以使用集成把它们合并成一个更...原创 2019-08-13 16:53:06 · 646 阅读 · 0 评论 -
机器学习:5支持向量机
ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/5支持向量机.ipynb笔记来源:《Sklearn与TensorFlow机器学习实用指南》也叫最大间隔分类一、线性支持向量机分类以鸢尾花数据为例硬间隔,软间隔:软间隔就是允许一部分数据在边界内参数解释:C:值越小间隔越“软”loss...原创 2019-08-08 21:54:59 · 507 阅读 · 0 评论 -
一个完整的机器学习项目
ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/一个完整的机器学习项目.ipynb笔记来源:《Sklearn与TensorFlow机器学习实用指南》一、下载数据import osimport tarfile # 用于压缩和解压文件import urllibDOWNLOAD_ROOT...原创 2019-08-08 00:47:09 · 1665 阅读 · 0 评论 -
机器学习:4训练模型(线性模型)
ipynb文件见:4训练模型.ipynb笔记来源:《Sklearn与TensorFlow机器学习实用指南》本章内容> 第一步将以一个简单的线性回归模型为例,讨论两种不同的训练方法来得到模型的最优解1.直接在封闭方程上求根2.迭代,梯度下降(GD)的方法> 第二步研究更复杂的模型:多项式回归,可以拟合非线性数据集。由于参数多,多以容易出现过拟合,所以本章还会介绍如...原创 2019-08-08 00:31:35 · 1621 阅读 · 0 评论 -
机器学习kaggle案例:沃尔玛招聘 - 商店销售预测
kaggle链接:https://www.kaggle.com/c/walmart-recruiting-store-sales-forecastingipynb文件:https://github.com/824024445/KaggleCases一、简介1.1 比赛描述建模零售数据的一个挑战是需要根据有限的历史做出决策。如果圣诞节一年一次,那么有机会看到战略决策如何影响到底线。在此招聘...原创 2019-08-21 22:56:23 · 6060 阅读 · 4 评论