机器学习
木木竹
这个作者很懒,什么都没留下…
展开
-
机器学习概述
1、机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测2、学习时的数据集Kaggle网址:https://www.kaggle.com/datasetsUCI数据集网址: http://archive.ics.uci.edu/ml/scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html...原创 2019-03-17 11:32:54 · 97 阅读 · 0 评论 -
模型的选择与调优
原创 2019-03-18 19:49:52 · 274 阅读 · 0 评论 -
分类模型的评估
原创 2019-03-18 19:50:00 · 161 阅读 · 0 评论 -
线性回归
原创 2019-03-18 19:50:07 · 116 阅读 · 0 评论 -
岭回归
原创 2019-03-18 19:50:13 · 376 阅读 · 0 评论 -
逻辑回归
原创 2019-03-18 19:50:21 · 170 阅读 · 0 评论 -
随机森林
原创 2019-03-18 19:50:27 · 198 阅读 · 0 评论 -
决策树
原创 2019-03-17 12:12:34 · 115 阅读 · 0 评论 -
朴素贝叶斯
原创 2019-03-17 12:10:56 · 96 阅读 · 0 评论 -
K-近邻算法【KNN】
原创 2019-03-17 12:09:15 · 131 阅读 · 0 评论 -
机器学习基础
数据类型: 离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。 连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。离散型是区间内不可分,连续型是区间内可分机器学习算法分类:监督学习(有特征值+目...原创 2019-03-17 11:46:35 · 89 阅读 · 0 评论 -
转换器与预估器
1、转换器: 之前特征工程里面实例化的例如:CountVectorizer,其实就是一个转换器2、预估器:分类器和回归器都属于estimator,是一类实现了算法的API用于分类的预估器: sklearn.neighbors k-近邻算法 sklearn.naive_bayes 贝叶斯 skl...原创 2019-03-17 11:45:18 · 405 阅读 · 0 评论 -
数据集的获取与划分
机器学习的数据集一般划分为两个部分:1、训练集:用于训练,构建模型2、测试集:在模型检验时使用,用于评估模型数据集划分API:sklearn.model_selection.train_test_split练习时可以使用sklearn提供的数据集sklearn数据集的获取:sklearn.datasets 加载获取流行数据集 datasets.loa...原创 2019-03-17 11:42:54 · 998 阅读 · 0 评论 -
特征工程
1、特征工程是什么特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性2、特征工程的意义直接影响模型的预测结果3、scikit-learn库介绍安装scikit-learn库:pip install Scikit-learn4、数据的特征抽取1、sklearn特征抽取API:sklearn.feature_extracti...原创 2019-03-17 11:36:36 · 315 阅读 · 0 评论 -
回归性能评估
原创 2019-03-18 19:49:43 · 527 阅读 · 0 评论