- 博客(8)
- 收藏
- 关注
原创 简单易懂的SVM白板推导
深度学习大热,机器学习也不能落下!首先我们要知道SVM是判别模型。让我们一起推导吧。个人认为点到超平面的距离公式推导简单易懂得多。有些同学可能会疑问③式怎么来的?这里补上
2020-08-15 23:43:24
247
原创 笔记:关系抽取算法之Snowball
**信息抽取**指的是从非结构化文本中提取结构化信息的一类技术。定义为:从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。 信息抽取肯定离不开**命名实体识别(NER)**和**关系抽取**,这里就主要说一下关系抽取中的一种算法**Snowball**。 说到Snowball,我们先从Bootstrap说起,Bootstrap是一种基于半监督和无监...
2020-04-25 19:10:25
4406
8
原创 学习笔记-DataFrame的apply方法
DataFrame中的apply方法就是将函数应用到由列或行形成的一维数组上。import pandas as pddf=pd.DataFrame(np.random.randn(4,5),columns=list('abcde'))# 求每列的最大值与最小值的差a = df.apply(lambda x:x.max()-x.min())# 求每行的最大值与最小值的差b = df.a...
2020-04-25 18:16:02
2077
原创 学习笔记-DataFrame求多列平均值
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 3, 3],'B':[1, 4, 3, 2, 1, 3, 3],'C':[1, 4, 3, 2, 1, 3, 3]}) df>>> A B C0 1 1 11 1 4 42 1 3 33 2 2 24 2 1 15 3 3 36 3 3 3df['D'] = df[['A...
2020-02-28 01:46:43
29579
1
原创 学习笔记-DataFrame求多列的众数mode
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 3, 3], 'B':[1, 4, 3, 2, 1, 3, 3], 'C':[1, 4, 3, 2, 1, 3, 3]}) df>>> A B C0 1 1 11 1 4 42 1 3 33 2 2 24...
2020-02-27 22:18:05
1714
1
原创 学习笔记-DataFrame分组按平均数、众数填充缺失值
df = pd.DataFrame({'A': [1, 2, 1, 2, 1, 2, 3],'B':[1, np.NaN, 3, 2, 1, 3, 3]}) df>>> A B0 1 1.01 2 NaN2 1 3.03 2 2.04 1 1.05 2 3.06 3 3.0分组求平均数组内(除以了2)df['B'] = df[['B']].fillna(...
2020-02-26 23:53:07
10704
原创 学习笔记-sklearn的LabelEncoder()和OneHotEncoder()
LabelEncoder():把[1,5,67,100] 变成[0,1,2,3]OneHotEncoder():把[[1],[2],[3],[4]] 变成array( [ [0., 1., 0., 0.],[0., 0., 1., 0.],[1., 0., 0., 0.],[0., 0., 0., 1.] ] )
2020-02-26 23:01:37
400
原创 学习笔记-Python map() 函数
def square(x) : # 计算平方数 return x ** 2 map(square, [1,2,3,4,5]) # 计算列表各个元素的平方>>> [1, 4, 9, 16, 25]map(lambda x: x ** 2, [1, 2, 3, 4, 5]) # 使用 lambda 匿名函数>>> [1, 4, 9, 16,...
2020-02-26 22:14:23
220
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人