- 博客(3)
- 问答 (8)
- 收藏
- 关注
原创 白话机器学习算法 第6-12章 读书笔记
回归分析趋势线预测 一般只涉及单个预测变量也可用于比较个个预测变量的强弱梯度下降法优化参数的方法梯度下降法先初步猜测合适的权重组合,再通过一个迭代过程,把这些权重应用于每个数据点做预测,然后调整权重,以减少整体预测误差。但是梯度下降法可能会受到初始参数值的影响,如下为了降低这种风险–> 随机梯度下降法在这种方法中,每次迭代并不是采用所有数据点,而是只从其中选取一个来调整参数。这样做就引入了多变性,有助于算法逃离凹坑。梯度下降法的这个缺点通常只出现在更为复杂的模型中,做回归分析时
2020-12-15 20:56:04 1585
原创 白话机器学习算法 第2-5章 读书笔记
K均值聚类聚类聚类是通过识别共同的喜好或特征,把顾客分组,其中k表示群组个数。定义群组有多少个群组?每个群组中有谁?群组数量群组数量越多,组内成员越相似,响铃群组之间的区别则越不明显所以在决定群组数量时必须有所权衡往大,便于提取有意义的模式够小,确保各个群组之间有所区别确定群组数量的方式 陡坡图陡坡图可以展现群组内散度随群组数量增加而降低的过程。陡坡图地拐弯处往往体现了最佳主成分数量若所有成员都属于同一个群组,则群组内散度将达到最大值。随着群组数量增加,各个群组变得更紧凑,群组成
2020-12-14 20:59:41 390
原创 白话机器学习算法 第一章 读书笔记
前言数据科学的意义从大型数据集中发现隐藏的趋势充分利用发现的趋势做预测计算每种结果出现的概率快速获取准确结果数据科学研究步骤处理数据选择算法算法调优创建模型 比较 确定基础知识准备数据数据格式略数据类型二值变量:这是最简单的变量类型,它只有两种可能的值。在表1-1中,“是否买鱼”就是二值变量。分类变量:当某信息可以取Z两个以上的值时,便可以使用分类变量来表示它。在表1-1中,“顾客类别”就是分类变量。整型变量:这种变量用来描述可以使用整数表示的信息。在表1-1中
2020-12-11 00:46:02 260 1
空空如也
使用insert插入时间数据,只有日期没有时间
2022-06-20
ORACLE和PLSQL时间(date格式)字段显示问题
2021-07-07
Python Combination函数全排列问题
2021-05-31
python 全排列问题
2021-05-25
Dataframe值替换问题
2021-05-19
Python Dataframe 列值筛选问题
2021-05-14
如何统计表中一行值为1的列(字段),并将其列名组合输出?
2021-05-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人