目前课题还没有定下来,有点茫,毕竟快毕业了,除了好好课题准备毕业外,还有一个更重要的事就是准备找工作。
由于前段时间做了一些关于情感分析的研究,对情感分析有一定的了解,情感分析属于比较基础理论性的东西,现在打算做一些情感分析的应用方面的东西。
目前情感分析主要用于意见挖掘、舆情监控等领域,而在应用于金融方面还比较少,特别是应用到股票预测上更少,我打算想做有关基于情感分析的股票走势预测。
目前最主要的困境就是缺乏语料,所以必须自己标语料,但自己标语料有个问题就是语料的准确性权威性不高。目前打算先从对股吧的评论进行挖掘开始,先实现基于股吧的股票评论挖掘系统。
刚刚做了一个自动下载股吧语料的网页下载器,包含正文提取功能。目前还没完善,等完善了,在拿出来跟大家共享。
 
下一阶段的主要任务是标语料--主观句提取--情感分析--趋势预测。
金融预测一般可分为两种方法,一种是目前研究的比较透彻的基于历史交易数据的金融预测。大部分是使用历史交易数据,并使用SVM或者ANN对股票的涨跌进行预测。此方法需要的数据是股票历史交易数据,主要是股价吧。算是基于时间序列的金融数据挖掘吧。由于前段时间想帮 做课题的原因,对这个进行了一些学习,相对来说有点了解。
另一种是我上面说的对网络上对某只股票的评论、博客、新闻、交易信息等对股价有影响的信息进行分析,提取出信息流,有点类似于意见挖掘。情感分析只是其中一个小部分。由于还未深入了解所以自己也不是很清晰。