All our works can be found on the github project.
俗话说得好,万事开头难,往后中间难,最后结尾难……
为什么做这个
这是博主人工智能基础课的大作业,内容是用深度学习做金融文本的情感分类,语言、工具等自选(人生苦短,我用python)。
要做什么
咳咳,要说清楚具体要做什么,首先要弄清楚几个概念:
1.金融文本
金融文本,顾名思义,主要包括金融市场新闻、社交媒体、财报消息等。而金融文本的情感,不局限在文本中所表露的主观情感,更来源于市场的信心指标(如价格、波动率、成交量等)和金融专家的判断(正面、负面)。
2.举个栗子
突发金融舆情导致上市公司股价发生巨幅波动。例如去年年底京东股价大跌,就与某一事件的爆料和持续发酵密切相关。
总而言之,金融文本是有情感的,小J 要做的就是基于深度学习,实现对文本的情感判断(正面、负面或者没有影响)。
拿什么来做
以上文件是老师提供的原始数据集,包括6947则已标注情感的金融相关文本。要进行情感分类,还需要进行分词、词向量转换、搭建训练模型等步骤。
工具
python3.6 + Visual Studio Code
好了,话不多说,开干吧。