![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
Da_wan
这个作者很懒,什么都没留下…
展开
-
自然语言学习——使用FastText用每日新闻预测金融市场变化
本文主要讲述了通过FastText的分类方法,根据每日新闻来预测金融市场。数据集:Combined_News_DJIA.csv读入数据集:数据集主要分为三个部分:Date(日期),Label(0:股票下跌;1:股票上涨),Top0-25(新闻内容)一、拆分出训练集和测试集由于只有这一个数据集,需要对上面这个数据集拆分出训练集和测试集。代码如下:将2015-01-01...原创 2020-03-09 16:11:06 · 604 阅读 · 0 评论 -
nltk扩展包安装问题以及下载很慢的解决办法
当我们用命令(pip inatall nltk)下载好nltk的时候,如果需要下载其中的扩展包需要使用如下命令:>>>import nltk>>>nltk.download()由于下载的网站时国外的网站,下载速度十分慢,还会引发一系列的问题。接下来给出解决办法一、解决下载慢的问题:从下面这个链接下载nltk的扩展包,里面拥有大部分的nltk模...原创 2020-03-06 17:04:01 · 2929 阅读 · 0 评论 -
自然语言学习——使用word2vec对文本进行情感分析
本文主要讲述了如何对影评数据做情感分析,就是如何判断这条评论是好评还是差评。对文本处理的方法是word2vec,然后用随机森林的方法构建模型,最后训练模型进行预测。前面一、二部分主要是讲述如何处理文档,有点啰嗦可以快速阅读,主要方法从第三部分开始。一、读取文档在进行文本情感分析之前,当然需要大量的文本数据,我使用了一些影评数据(labeledTrainData.tsv)作为训练集来完成。内...原创 2020-03-04 15:23:29 · 5756 阅读 · 5 评论