![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 52
机器学习
【 变强大 】
这个作者很懒,什么都没留下…
展开
-
机器学习入门(十一):回归与聚类算法——无监督学习(K-means算法)
学习目录:内容目录:无监督学习包含算法:聚类:K-means(K均值聚类)降维:PCAK-means原理API:案例:如何对无监督学习进行评估?K-means算法总结:特点:采用迭代式算法,直观易懂且实用缺点:容易收敛到局部最优解(当k个初始点聚在一起的时候),可以使用多次聚类解决应用场景:当没有目标值时,先做聚类,如何再进行分类...原创 2021-03-21 22:20:54 · 819 阅读 · 0 评论 -
机器学习入门(十):回归与聚类算法——逻辑回归与二分类
学习目录:逻辑回归内容目录:逻辑回归应用场景:应用于二分类问题逻辑回归原理:将线性回归的输出映射到激活函数sigmiod上,输出0-1区间的一个数,当做概率值,若大于我们设置的阈值,则认为他属于这个类别。损失函数:对数似然函数整体逻辑回归流程:API:分类评估指标精确率和召回率的计算:当样本分类不均衡时,99个否,1个是,使用精确率和召回率就不好用了:就要引入ROC曲线和AUC指标API模型的保存和加载...原创 2021-03-21 19:07:33 · 391 阅读 · 0 评论 -
机器学习入门(九):回归与聚类算法——线性回归、过拟合、岭回归
学习目录:线性回归:案例:波士顿房价预估(比较正规方程和梯度下降优化方法)使用正规方程优化:使用梯度下降优化:使用均方误差(MSE)评估模型好坏:总结:过拟合与欠拟合正则化类别:**L2正则化(常用):**给损失函数后面加一个惩罚项,这个惩罚项与权重有关,在优化损失函数降低损失值得同时还可以减小特征对应的权重。L1正则化:岭回归就是带L2正则化的线性回归案例:使用岭回归对波士顿放假预测...原创 2021-03-21 15:27:20 · 458 阅读 · 0 评论 -
机器学习入门(八):分类算法——随机森林算法
学习目录:随机森林算法目录为什么使用随机森林?当决策树产生过拟合时,可以使用随机森林算法优化一.集成学习 集成学习是通过建立几个模型组合来解决单一预测问题原理:生成多个分类器/模型,各自独立学习和做预测,然后将他们的预测结合成组合预测二.什么是随机森林 随机森林是包含多个决策树的分类器,每个决策树都会输出预测类别,随机森林取树中结果出现最多的内个作.原创 2021-03-20 19:23:28 · 576 阅读 · 0 评论 -
机器学习入门(七):分类算法——决策树算法
学习目录:决策树内容目录:一.决策树作用: 这是我们判断这是个好瓜还是坏瓜的决策流程,决策树的作用:1.帮助我们选择用哪个特征先做if,用哪个特征后做if,能最快的判断出这是好瓜还是坏瓜2.帮助我们确定特征中作为划分标准的数值二.原理推导三.代码预测:案例对比:比较决策树算法和KNN算法在鸢尾花数据集上的分类准确率使用决策树算法对鸢尾花数据集分类:from sklearn.datasets import load_irisfrom skle.原创 2021-03-19 18:50:10 · 1042 阅读 · 0 评论 -
机器学习入门(六):分类算法——朴素贝叶斯算法
学习目录:四.朴素贝叶斯算法例子:朴素贝叶斯的应用(含拉普拉斯平滑系数):文本分类案例案例:20类新闻文本分类**流程:**获取数据(不需要做数据处理,英文sklearn数据是处理好的) 划分数据集 特征工程(由于是文章,所以要做文本特征抽取.原创 2021-03-17 16:29:57 · 223 阅读 · 0 评论 -
机器学习入门(五):分类算法——KNN算法
学习目录:一.sklearn转换器和估计器1.转换器(特征工程的父类)2.估计器(sklearn机器学习算法的实现)第一步:实例化一个estimator第二步:estimator.fit(x_train,y_train)训练和计算(调用完毕,模型生成)第三步:模型评估 1.直接比对真实值和预测值 .原创 2021-03-15 20:13:22 · 314 阅读 · 0 评论 -
机器学习入门(四):特征工程——特征降维
特征工程一.为什么需要特征工程?因为“数据和特征决定机器学习的上限,而模型和算法只是逼近这个上限而已”,使用专业背景知识和技巧处理数据,使算法变得更好。二.什么是特征工程sklearn库用于做特征工程pandas库用来做数据清洗、数据处理。特征降维定义:降低特征的个数(降低列数),得到一组“不相关”的主变量得过程方法一:特征选择 1.Filter(过滤式):主要探究特征本身特点、特征原创 2021-03-15 14:32:20 · 307 阅读 · 0 评论 -
机器学习入门(三):特征工程——特征预处理
特征工程一.为什么需要特征工程?因为“数据和特征决定机器学习的上限,而模型和算法只是逼近这个上限而已”,使用专业背景知识和技巧处理数据,使算法变得更好。二.什么是特征工程sklearn库用于做特征工程pandas库用来做数据清洗、数据处理。特征预处理定义:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据的过程使用sklearn.preprocessing()函数为什么要做归一化/标准化?:特征的单位或大小相差较大,或者某特证的方差相比其他特征大出几个数量级,容易影响(支配)目原创 2021-03-14 21:58:45 · 253 阅读 · 0 评论 -
机器学习入门(二):特征工程——特征抽取
特征工程一.为什么需要特征工程? 因为“数据和特征决定机器学习的上限,而模型和算法只是逼近这个上限而已”,使用专业背景知识和技巧处理数据,使算法变得更好。二.什么是特征工程 sklearn库用于做特征工程 pandas库用来做数据清洗、数据处理。 &n.原创 2021-03-10 23:02:46 · 1217 阅读 · 0 评论 -
机器学习入门(一):算法分类和数据集调用
机器学习算法分类:1.监督学习: 目标值:类别(离散型数据)------分类问题(例如图1对猫狗分类)分类算法:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归 目标值:连续性数据(房屋价格等)------回归问题(例如图2对房屋价格预测)回归算法:线性回归、岭回归2.无监督学习: &nbs.原创 2021-03-10 17:39:06 · 564 阅读 · 0 评论