基于文本挖掘和情感分析的股票价格预测系统(一)

想做个如题的预测系统,这两三天利用休息时间在研究,整理下所知。


从网上爬取文本,可以是财经新闻、股吧、垂直投资社区和微博。

过滤得到和某几个被选定观察的股票相关的文本数据,包括过去一段时间的历史数据。

通过统计、文本挖掘和情感分析,

1,发帖量的时间序列与股价的时间序列的对比

2,积极情绪的帖子所占的比例值的时间序列与股价的时间序列的对比


可以通过历史数据检验以上两组时序图是否相似。

从大量的他人的研究来看,是有相似关系的。


但是这里存在一个问题,时序图的相似如何能够被拿来做预测?所需要的并不是对历史数据的检验而是推测未知的明天的值!

就像你无法从股价的历史时序图来推测明天的股价,你无法通过和股价历史时序图相似的其它时序图来推测明天的股价?!


所以需要从结果中寻找的应该是可以被历史数据所检验的预测的正确率,而不是所谓曲线的相似度。


如果不能明显的通过人工和人脑来发现预测性,可以考虑神经网络。








1.系统简介 文本情感分析股票预测系统是一种能够通过对股票市场相关新闻、社交网络、财经报道等文本信息进行情感分析,从而预测股票价格走势的应用系统。 2.系统功能要求 (1)数据采集:系统需要能够实时采集股票市场相关的新闻、社交网络和财经报道等信息,并对这些信息进行分类和筛选。 (2)情感分析系统需要能够对采集到的数据进行情感分析,分析出其中的情感倾向,如正面、负面或中性情感。 (3)股票预测系统需要根据情感分析结果,预测股票价格的涨跌趋势,提供相应的预测分析报告。 (4)数据可视化:系统需要将分析结果以图表的形式呈现,方便用户对分析结果进行直观的理解和分析。 (5)用户管理:系统需要支持用户注册、登录、权限管理等功能,保证用户数据的安全性和隐私保护。 3.技术要求 (1)文本情感分析技术:系统需要采用成熟的自然语言处理技术,如情感词典、机器学习等,进行文本情感分析。 (2)数据挖掘技术:系统需要采用数据挖掘技术,对采集到的大量数据进行分类和筛选,提高数据分析的准确性和效率。 (3)可视化技术:系统需要采用可视化技术,将分析结果以图表的形式呈现,使用户能够直观地理解和分析分析结果。 (4)安全技术:系统需要采用安全技术,如数据加密、用户权限管理等,保证用户数据的安全性和隐私保护。 4.用户需求分析 (1)投资者:投资者需要利用系统提供的预测结果进行股票投资决策,他们需要的是准确、及时的股票预测结果。 (2)分析师:分析师需要利用系统提供的分析结果进行股票市场分析和研究,他们需要的是分析结果的可靠性和详尽性。 (3)媒体人员:媒体人员需要利用系统提供的信息进行新闻报道和分析,他们需要的是系统提供的准确、全面的信息。 (4)普通用户:普通用户需要了解股票市场的最新情况和分析结果,他们需要的是系统提供的易于理解、直观的分析结果。 综上所述,文本情感分析股票预测系统应该具备数据采集、情感分析股票预测、数据可视化、用户管理等功能,采用文本情感分析数据挖掘、可视化、安全等技术,满足投资者、分析师、媒体人员和普通用户的需求。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值