![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习包
文章平均质量分 54
snailbuster
这个作者很懒,什么都没留下…
展开
-
nlp竞赛相关内容
切分大文件:few_data = df_train[df_train.id<10000] few_data.to_csv(“D:\pythontest\new_data\few_data.csv”,index=False) TfidfVectorizer transform之后生成的对象为scipy.sparse.csr.csr_matrix,这是个压缩的稀疏矩阵,想...原创 2018-09-06 16:01:16 · 631 阅读 · 0 评论 -
NLP相关学术内容:卡方检验
卡方检验https://blog.csdn.net/snowdroptulip/article/details/78770088卡方检验的的公式中,A为实际值T为理论值,x2用于衡量实际值和理论值的偏差程度。在我们算出来上述例子中卡方值之后,我们应该如何确定是否喝牛奶与感冒独立无关呢?答案是,通过查询卡方分布的临界值表。自由度等于V = (行数 - 1) * (列数 - 1),对四格表,自...原创 2018-09-18 15:56:47 · 1206 阅读 · 0 评论 -
机器学习笔记之支持向量机
目的:给定二分类样本集,想要找一个分离超平面。(鲁棒性最好)其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。分析:超平面可以由以下方程确定b为超平面和原点之间的距离,wT决定超平面的方向。样本空间x到超平面的距离是:由于两个向量之间的间隔为:因此最大化间隔的实质就是满足上式中的w,b使得y最大。也就是||w||/2...原创 2018-09-19 11:09:09 · 116 阅读 · 0 评论 -
西瓜书学习笔记
决策树 输入训练集,和属性集,输出以node为根节点的一个决策树。原创 2018-09-14 09:11:51 · 700 阅读 · 0 评论 -
机器学习笔记之贝叶斯分类
设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号)根据贝叶斯定理:最大化后验概率P(Ci|X)可转化为最大化先验概率P(X|Ci)P(Ci),先验概率P(x1|Ci),P(x2|Ci),…,P(xn|Ci)可以从训练数据集求得。根据此方法,对一个未知类别的样本X,可以先分别...原创 2018-09-20 14:48:45 · 210 阅读 · 0 评论 -
LSTM进行情感分类
原链接:https://blog.csdn.net/u012735708/article/details/827697111.read_raw()函数模块中,主要是写了关于数据清洗的内容。dataset[‘pollution’].fillna(0, inplace=True) 用零填充空位,然后其他的就是指定一下列名。2.def parse(x)模块中,用于返回时间戳。返回了 date...原创 2019-06-08 16:14:18 · 3766 阅读 · 0 评论