什么是朴素贝叶斯中零概率问题?

要预测的样本某个属性值在已知的多个类别中,至少有一个类别在该属性上没有出现过这个值。所以计算的结果,属于该类别的概率为0,这不合理。所以要用拉普拉斯平滑。 参考:https://mp.weixin.qq.com/s?__biz=MzI3NTkyMjA4NA==&mid=2...

2018-09-17 16:13:25

阅读数 104

评论数 0

信息增益和信息增益率

信息增益偏向取值较多的特征。(极端情况,把序号当做特征) 信息增益率偏向取值较少的特征。   C4.5 找出信息增益高于平均水平的特征,然在在这些特征中再选择信息增益率最高的特征。...

2018-09-12 14:11:00

阅读数 238

评论数 0

collections.Counter 可以统计数组中每个元素出现的次数

import collections def MoreThanHalfNum_Solution(numbers): # write code here d = collections.Counter(numbers) print(type(d)) print(d)...

2018-08-14 15:07:26

阅读数 401

评论数 0

sort 与 sorted 区别:

sort 与 sorted 区别: sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。 list 的 sort 方法返回的是对已经存在的列表进行操作,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。 rever...

2018-08-06 15:35:02

阅读数 31

评论数 0

正则化参数对欠拟合和过拟合的影响

正则化参数太小容易产生过拟合,太大容易产生欠拟合。

2018-08-04 09:32:26

阅读数 577

评论数 0

for 循环 注意点

Python for循环 尽量写成这种形式(names 是一个列表): for j in range(len(names)): 不要写成这种形式: for name in names: 当names是一个空列表时,上面一种情况不会出现空类型错误!  ...

2018-07-31 17:37:35

阅读数 34

评论数 0

神经元个数

隐藏层单元的神经元个数通常是特征个数的 1倍 2倍 4倍 等。

2018-07-30 20:48:26

阅读数 753

评论数 0

神经网络计算过程

计算过程就像是在进行Logistic回归计算,只不过最后的输出结果用的不是原始的x, 是经过计算之后的特征值而已。

2018-07-30 10:12:10

阅读数 239

评论数 0

Logistic and Sigmoid

Logistic function 和 Sigmoid function 表示的是同一个意思。

2018-07-30 09:55:04

阅读数 27

评论数 0

梯度下降和正规方程

执行梯度下降算法,不同属性的取值范围要保持大致一致(大约在-1到1之间)一般认为-3到3就是安全的,这样执行梯度下降算法收敛的更快。 正规方程方法不需要使用特征缩放。 ...

2018-07-29 08:54:19

阅读数 78

评论数 0

逆矩阵存在的条件

逆矩阵充要条件有多种表述方式,以下三条相互等价: 1. 矩阵的行列式不等于零 2. 矩阵为满秩矩阵 3. 矩阵的合同标准型是单位矩阵 逆矩阵: 设A是数域上的一个n阶方阵,若在相同数域上存在另一个n阶矩阵B,使得: AB=BA=E。 则我们称B是A的逆矩阵,而A则被称为可逆矩阵。 没有逆矩阵的矩...

2018-07-28 16:52:48

阅读数 3542

评论数 0

字符串和数字ASCII

字符串的比较与 tuple 类似,也是从第一个字符开始比较 ASCII 码,直到两个字符不相等为止。 字母与数字的ASCII 码大小范围是 "a-z" > "A-Z" > &...

2018-07-24 19:13:01

阅读数 375

评论数 0

fit_transform 和 transform

2018-07-16 17:37:55

阅读数 278

评论数 0

朴素贝叶斯

朴素贝叶斯法对条件概率分布做了条件独立性的假设,由于这是一个较强的假设,朴素贝叶斯也由此得名!这一假设使得朴素贝叶斯法变得简单,但有时会牺牲一定的分类准确率。...

2018-07-16 10:16:25

阅读数 29

评论数 0

全概率公式、贝叶斯公式推导过程

https://www.cnblogs.com/ohshit/p/5629581.html

2018-07-16 09:46:14

阅读数 605

评论数 0

DatetimeIndex 对象

DatetimeIndex 对象可以直接获取日期的 年 月 日time_value 是日期类型的对象time_value = pd.DatetimeIndex(time_value) time_value.year time_value.month time_value.weekday # 周几 ...

2018-07-05 09:59:59

阅读数 665

评论数 0

K近邻

使用K紧邻算法,需要先对数据进行标准化或归一化。

2018-07-04 15:52:20

阅读数 86

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭