![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
机器学习算法
钢筋工
这个作者很懒,什么都没留下…
展开
-
机器学习算法性能审核
切分数据集原理将数据集切分两部分,一部分用来作为训练模型,另一部分用来测试模型代码from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.3, random_state=0)'''参数:X : 数据Y: 标签test_size: 测试集占数据集的百分比,小数random_state: 随机数种子''原创 2020-05-08 18:22:07 · 425 阅读 · 0 评论 -
优化算法之梯度下降(批量梯度下降,随机梯度下降,小批量梯度下降)
梯度下降简介梯度下降是一种常见的优化算法,非常通用,能够为大范围的问题找到最优解中心思想: 迭代的调整参数从而使成本函数最小课本话解释:设置一个随机的θ值(这个过程称为初始化),然后逐步改进,每次踏出一步,每一步都尝试降低一点成本函数(例如MSE),知道算法收敛出一个最小值大白话解释:假设一人去爬山,山上起雾,只能感受到地面坡度,那么下山最快的办法就是一直走坡度最陡的方向(当然这是正...原创 2020-05-08 14:54:32 · 1104 阅读 · 0 评论 -
RFM模型简述
RFM模型的作用:· 判别客户的价值,针对性做出营销手段RFM模型的特点· 简单性,只需要四个字段,客户名称、消费时间、消费金额和消费频率· 客观性,利用数学尺度,简单且明确的描述客户价值· 直观,解释性极高RFM组成· R: 最近至今的消费时间间隔(Recency, 间度)· F: 最近消费次数(Frequency, 频度)· M:最近消费总金额(Monetory, 额度)...原创 2020-05-07 19:21:37 · 7221 阅读 · 0 评论 -
Python_机器学习_集成算法_Boosting_提升树
原创 2019-11-06 15:53:56 · 298 阅读 · 0 评论 -
Python_机器学习_集成算法_Bagging_随机森林
原创 2019-11-06 15:52:21 · 310 阅读 · 0 评论 -
Pthon_机器学习_线性回归算法
算法简介回归是一种应用广泛的预测建模技术,这种技术的核心在于预测的结果是连续型变量回归算法源于统计学理论,它可能是机器学习算法中最早的算法之一,在现实中的应用非常广泛只要基于特征预测连续型变量的,一般都使用回归技术本次只针对于线性回归算法原理简单的原理就是:已知y和x,求y与x之间的关系第一步:构造一个线性函数,对这个数据集进行拟合: 一元线性: y(x) = w0 + w1...原创 2019-11-06 15:50:31 · 256 阅读 · 0 评论 -
Python_机器学习_贝叶斯原理与朴素贝叶斯
简介朴素贝叶斯(Naive Bayers) 是一种概率统计的分类方法,朴素贝叶斯是在条件独立假设的基础上,使用贝叶斯定理构建的算法朴素贝叶斯在文本处理领域有广泛的运用,如文本分类、垃圾邮件分类、信用评估和钓鱼网站检测等领域算法原理联合概率:两个事件同时发生的概率,事件A,事件B,表示为:P(AB)两个事件同时发生的概率,事件A,事件B,表示为:\\{}\\P(AB)两个事件同时发生的概率,事件A,事件B,表示为:P(AB)条件概率:当一个事件A已经发生的时候,另一个事件B发生的概率原创 2019-11-05 19:58:39 · 192 阅读 · 0 评论 -
Python_机器学习_决策树算法
算法原理决策树是一个类似于流程图的树结构,分支节点表示对一个特征进行测试,根据测试结果进行分类,叶节点代表类别决策树的构造过程实际上就是针对于原有数据集,选取一定的属性测试条件,对原数据集进行不断切分的过程一旦构造完决策树,那么对于检验记录进行分类就很容易了,因为决策树本身生成的就是一系列规则,因此决策树是生成模型的算法原则上讲,数据集中的所有特征都可以用来分枝,特征上的任意节点又可以...原创 2019-11-05 19:57:38 · 148 阅读 · 1 评论 -
Python_机器学习_KNN分类算法
算法原理: KNN算法也叫作k近邻算法,本质是通过距离判断两个样本是否相似,如果距离足够近就认为它们足够相似,属于同一类别. 但是只对比一个样本是不够的,所以我们需要设定k值,也就是选择k个样本,并将这k个样本称为近邻(nearest neighbor...原创 2019-11-05 19:56:36 · 386 阅读 · 0 评论 -
Python_机器学习_KMeans聚类算法
算法基础K- Means是迭代动态聚类算法中的一种,其中K表示类别数,Means表示均值,属于无监督学习算法.K-Means算法的步骤: 第一步:确定一个超参数K,就是将样本聚集为几类 第二步:在所有样本中随机选择k个点,作为中心 第三步:依次计算...原创 2019-11-04 21:26:19 · 468 阅读 · 0 评论 -
Python数据可视化 - Matplotlib库
导包import numpy as npimport pandas as pdimport matplotlib.pyplot as plt页面内画图%matplotlib inline查看有什么风格plt.style.available设置风格plt.style.use(“风格”)中文字体plt.rcParams[‘font.sans-serif...原创 2019-10-16 19:11:06 · 126 阅读 · 0 评论 -
python数据清洗 -pandas库
123原创 2019-10-15 21:05:14 · 632 阅读 · 0 评论 -
python数据清洗 - Numpy库
1231原创 2019-10-15 20:29:45 · 645 阅读 · 0 评论