![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
木木竹
这个作者很懒,什么都没留下…
展开
-
机器学习概述
1、机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测 2、学习时的数据集 Kaggle网址:https://www.kaggle.com/datasets UCI数据集网址: http://archive.ics.uci.edu/ml/ scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html...原创 2019-03-17 11:32:54 · 85 阅读 · 0 评论 -
模型的选择与调优
原创 2019-03-18 19:49:52 · 262 阅读 · 0 评论 -
分类模型的评估
原创 2019-03-18 19:50:00 · 151 阅读 · 0 评论 -
线性回归
原创 2019-03-18 19:50:07 · 104 阅读 · 0 评论 -
岭回归
原创 2019-03-18 19:50:13 · 363 阅读 · 0 评论 -
逻辑回归
原创 2019-03-18 19:50:21 · 154 阅读 · 0 评论 -
随机森林
原创 2019-03-18 19:50:27 · 175 阅读 · 0 评论 -
决策树
原创 2019-03-17 12:12:34 · 98 阅读 · 0 评论 -
朴素贝叶斯
原创 2019-03-17 12:10:56 · 81 阅读 · 0 评论 -
K-近邻算法【KNN】
原创 2019-03-17 12:09:15 · 116 阅读 · 0 评论 -
机器学习基础
数据类型: 离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。 连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。 离散型是区间内不可分,连续型是区间内可分 机器学习算法分类: 监督学习(有特征值+目...原创 2019-03-17 11:46:35 · 80 阅读 · 0 评论 -
转换器与预估器
1、转换器: 之前特征工程里面实例化的例如:CountVectorizer,其实就是一个转换器 2、预估器:分类器和回归器都属于estimator,是一类实现了算法的API 用于分类的预估器: sklearn.neighbors k-近邻算法 sklearn.naive_bayes 贝叶斯 skl...原创 2019-03-17 11:45:18 · 394 阅读 · 0 评论 -
数据集的获取与划分
机器学习的数据集一般划分为两个部分: 1、训练集:用于训练,构建模型 2、测试集:在模型检验时使用,用于评估模型 数据集划分API: sklearn.model_selection.train_test_split 练习时可以使用sklearn提供的数据集 sklearn数据集的获取: sklearn.datasets 加载获取流行数据集 datasets.loa...原创 2019-03-17 11:42:54 · 970 阅读 · 0 评论 -
特征工程
1、特征工程是什么 特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性 2、特征工程的意义 直接影响模型的预测结果 3、scikit-learn库介绍 安装scikit-learn库:pip install Scikit-learn 4、数据的特征抽取 1、sklearn特征抽取API:sklearn.feature_extracti...原创 2019-03-17 11:36:36 · 301 阅读 · 0 评论 -
回归性能评估
原创 2019-03-18 19:49:43 · 511 阅读 · 0 评论