情感分析方法:
中文情感分析的那个改进:
常规:句子向量:除了单词向量加起来求平均值
改进: 1. 可用tf-idf方法来表示词向量进行分类;
2. 用常规语料进行word2vec训练,不用局限于训练语料。优点类似于用bert进行预训练。
fasttext改进:
1. 加入Bi-gram
2. hashing trick
3. 将softmax回归改成霍夫曼树,计算树的分支的概率。提高速度。
新闻预测股票涨跌项目代码:
总体框架:
1,数据表示
1.1先将数据可视化&#