![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
技术实现
文章平均质量分 79
慕小白$
邮箱:windclouda@foxmail.com
展开
-
大数据入门——文本情感分类(python实现)2019高校大数据挑战赛
大数据入门——文本情感分类(python实现)文本情感分类总思路详细步骤一、导入数据二、分词三、数据清洗四、构造特征五、分割训练集、测试集六、训练数据svm支持向量机KNN逻辑回归贝叶斯随机森林七、预测数据八、评价模型总结菜鸟小白的第二篇小博文我就拿某高校比赛的数据当例子吧。。这是比赛方提供的训练数据,分为三列,分别是ID、文本、label。文本部分据传说是印尼语的拼音,所以并没有现成的词...原创 2019-06-19 09:30:52 · 3551 阅读 · 5 评论 -
大数据入门——搜索广告的文本点击率预估(python实现)2019高校大数据挑战赛
大数据入门——搜索广告的文本点击率预估(python实现)文本点击率预估概念解释思路分析具体步骤一、工具、原料(gensim包的配置、导入)二、基于词频逆文档矩阵的相似度三、基于集合运算的相似度(jaccard、tanimoto)三、基于词向量的相似度四、合并训练总结这是我的第三篇博文。数据来源于某高校大数据比赛,可以去官网自行下载。由于比赛时间与期末考试冲突的原因,线下模型已经搭建,但是线上数...原创 2019-07-08 16:02:10 · 1691 阅读 · 0 评论 -
|机器学习| - R语言 - 随机森林 - 分类、回归、预测、筛选变量有史以来超详细解析(干货满满)
R语言随机森林详细解析(基于randomforest包和varSelRF包)随机森林 基于R你即将从这里看到你不会看到研究如何用R去实现随机森林也有三个月的时间了,从一开始的完全不理解,到现在的游刃有余,我似乎花了过多的时间,毕竟是初学者嘛。不知各位有没有发现,CSDN上随机森林的教程都说的有些模糊,好像在刻意回避着什么,而且很少有人说变量筛选的问题。所以,今日,我觉得有必要记录一下了。随机森...原创 2019-08-03 21:51:38 · 78866 阅读 · 118 评论