机器学习
文章平均质量分 95
机器学习相关
码农充电站
微信公众号:码农充电站pro
个人主页:https://codeshellme.github.io
展开
-
机器学习相关文章总览
这里是机器学习相关文章。决策树算法、朴素贝叶斯分类、KNN 算法、SVM 算法、线性回归、Logistic 回归、随机森林算法、AdaBoost 算法、K 均值算法、EM 算法、Apriori 算法、PageRank 算法。原创 2020-12-25 17:09:34 · 219 阅读 · 0 评论 -
SVM 支持向量机算法-实战篇
上一篇介绍了 SVM 的原理和一些基本概念,本篇来介绍如何用 SVM 处理实际问题。原创 2021-01-22 10:40:06 · 326 阅读 · 1 评论 -
SVM 支持向量机算法-原理篇
SVM 算法最初是用来解决二分类问题的,而在这个基础上进行扩展,也能够处理多分类问题以及回归问题。原创 2021-01-20 10:19:43 · 1462 阅读 · 0 评论 -
RandomForest 随机森林算法与模型参数的调优
随机森林算法由多个决策树分类器组成,每一个子分类器都是一棵 CART 分类回归树,所以随机森林既可以做分类,又可以做回归。原创 2021-01-19 09:18:27 · 9336 阅读 · 1 评论 -
Logistic 回归-原理及应用
Logistic 回归,中文音译为逻辑回归,它是一个非线性模型,是由线性回归改进而来。逻辑回归模型主要用于处理二分类问题,也可以用于处理多分类问题。原创 2020-12-22 10:14:51 · 1080 阅读 · 0 评论 -
线性回归-如何对数据进行回归分析
线性回归模型用于处理回归问题,也就是预测连续型数值。线性回归模型是最基础的一种回归模型,理解起来也很容易,我们从解方程组谈起。原创 2020-12-21 10:39:39 · 5991 阅读 · 1 评论 -
AdaBoost 算法-分析波士顿房价数据集
在机器学习算法中,有一种算法叫做集成算法。AdaBoost 算法是集成算法的一种,由Freund 等人于1995 年提出。原创 2020-12-17 15:05:22 · 2510 阅读 · 0 评论 -
如何用Python 制作词云-对1000首古诗做词云分析
词云又叫文字云,它可以统计文本中频率较高的词,并将这些词可视化,让我们可以直观的了解文本中的重点词汇。原创 2020-12-15 08:59:27 · 540 阅读 · 2 评论 -
EM 算法-对鸢尾花数据进行聚类
EM 算法是聚类算法,中文为期望最大化算法,它是一个不断观察和调整的迭代过程,以此来构建聚类模型。原创 2020-12-14 11:38:50 · 4069 阅读 · 0 评论 -
Apriori 算法-如何进行关联规则挖掘
Apriori 算法是一种发掘事物内在关联关系的算法,它可以加快关联分析的速度,从而让我们更有效的进行关联分析。原创 2020-12-10 13:04:04 · 1648 阅读 · 0 评论 -
PageRank 算法-Google 如何给网页排名
1998 年前后,拉里·佩奇和谢尔盖·布林一起发明了著名的 PageRank 算法,才完美的解决了网页排名的问题。也正是因为这个算法,诞生了伟大的 Google 公司。原创 2020-12-09 09:30:57 · 812 阅读 · 0 评论 -
K 均值算法-如何让数据自动分组
K 均值算法是一种无监督学习。与分类算法相比,无监督学习算法又叫聚类算法,就是只有特征数据,没有目标数据,让算法自动从数据中“学习知识”,将不同类别的数据聚集到相应的类别中。原创 2020-12-04 09:52:04 · 1065 阅读 · 0 评论 -
KNN 算法-实战篇-如何识别手写数字
手写数字数据集是一个用于图像处理的数据集,这些数据描绘了 [0, 9] 的数字,我们可以用KNN 算法来识别这些数字。原创 2020-12-03 08:56:55 · 488 阅读 · 0 评论 -
KNN 算法-理论篇-如何给电影进行分类
KNN 算法的全称是K-Nearest Neighbor,中文为K 近邻算法,它是基于距离的一种算法,简单有效。KNN 算法即可用于分类问题,也可用于回归问题。原创 2020-12-02 10:46:07 · 2803 阅读 · 1 评论 -
如何使用Python 进行数据可视化
在进行数据分析的时候,经常需要将数据进行可视化,以方便我们对数据的认识和理解。Matplotlib 是一个可视化工具包,可以让我们使用Python 来可视化数据。原创 2020-12-01 09:34:06 · 2106 阅读 · 0 评论 -
数据变换-归一化与标准化
数据变换的目的是将不同渠道,不同量级的数据转化到统一的范围之内,方便后续的分析处理。原创 2020-11-30 10:58:04 · 1293 阅读 · 0 评论 -
计算机如何理解事物的相关性-文档的相似度判断
生活中,我们经常会对比两个事物的相关性,也可以叫做相似度。人类会根据自己的经验,很容易的判断两件事物是否相似,或者相似度是多少。那如何**计算机**也能够进行这样的判断呢?原创 2020-11-27 09:51:16 · 663 阅读 · 0 评论 -
朴素贝叶斯分类-实战篇-如何进行文本分类
上篇介绍了朴素贝叶斯的原理,本篇来介绍如何用朴素贝叶斯解决实际问题。朴素贝叶斯最擅长的领域是文本分析,包括:文本分类,情感分析,垃圾邮件处理。原创 2020-11-25 09:22:12 · 1488 阅读 · 3 评论 -
朴素贝叶斯分类-理论篇-如何通过概率解决分类问题
贝叶斯原理是英国数学家托马斯·贝叶斯于18 世纪提出的,当我们不能直接计算一件事情(A)发生的可能性大小的时候,可以间接的计算与这件事情有关的事情(X,Y,Z)发生的可能性大小,从而间接判断事情(A)发生的可能性大小。原创 2020-11-18 13:55:49 · 1100 阅读 · 2 评论 -
决策树算法-实战篇-鸢尾花及波士顿房价预测
决策树可用于很多场景,比如金融风险评估,房屋价格评估,医疗辅助诊断等。原创 2020-11-16 11:30:36 · 1585 阅读 · 1 评论 -
决策树算法-理论篇-如何计算信息纯度
决策树是一种机器学习算法,我们可以使用决策树来处理分类问题。决策树的决策(分类)过程可以用一个倒着的树形结构来形象的表达出来,因此得名决策树。决策树是一个包含根节点、若干内部节点和若干叶子节点的树形结构。决策树的根节点包含样本全集,内部节点对应特征属性,叶子节点表示决策的结果。原创 2020-11-11 12:06:52 · 1389 阅读 · 0 评论