一种互联网文本数据与证券价格波动关联分析的流程图

最新推荐文章于 2024-06-06 14:46:26 发布

scmsqhn

最新推荐文章于 2024-06-06 14:46:26 发布

阅读量257

点赞数 1

分类专栏： NLP 文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qhn614/article/details/84872499

版权

NLP 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一种互联网文本数据与证券价格波动关联分析的流程图

挖掘目的

建立从互联网非结构化文本与证券市场标的特征的关联关系
建立从关联特征到证券标的价格的关联关系

建模思想

尽可能使用非标注数据，降低样本工程成本
向量化，无监督，降低特征工程成本
语言建模使用谷歌开源语言模型，降低训练成本，降低硬件需求
特征工程建模，向量化特征为主，预留规则部分入口
操作信号生成器模型，与文法特征提取关联模型解偶，操作信号的生成与文法特征的关系由单独的矩阵表达．

该模块难度较大．
面向动态的不完整的语料，使用xgboost等回归树模型，对结构化的预测数据进行提升
应用不面向终端用户,效果优先于工程性能

工程化

文本预处理部分

数据复用，提供训练速度，降低ETL数据治理成本

数据整合为数据集，封闭测试验证环境，便于后续对比

文本向量化文档标签化

文档向量化，便于应用数学工具

预留规则化入口，接入规则

特征学习层

字,词,句,段落,文章,文本集合,不同维度的向量化，输入模型进行训练

模型训练
- 周期性数据:ARIMA
- 时间序列预测:Bert, Bilstm
- 分类任务:Bert, SVM

交易信号生成层（风险点不确定）

交易信号生成与文法特征呈变化的映射关系，即当前特征与交易信号的关系，伴随时间空间推移会变化
模型选择GAN Q-估值网络(不确定?有风险)
GAN使用生成器判别器件，动态适配，挑选出可以通过判别器的特征
Q-估值网络，需要较多的反馈与标注成本(成本风险不可控?)

一元

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

scmsqhn CSDN认证博客专家 CSDN认证企业博客

码龄16年

6: 原创

136万+: 周排名

158万+: 总排名

1万+: 访问

: 等级

189: 积分

3: 粉丝

5: 获赞

13: 评论

4: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于Tensorflow的英文评论二分类CNN模型
qq_43250791: 请问怎么实现cross-validation呢
基于Tensorflow的英文评论二分类CNN模型
weixin_43153487: 请问如何用训练好的模型去预测自己的数据啊？
基于Tensorflow的英文评论二分类CNN模型
胖大海瘦西湖: github上是：self.h_pool = tf.concat(pooled_outputs, 3) 而这里是：self.h_pool = tf.concat(3, pooled_outputs) 是因为tensorflow版本的问题吗
基于Tensorflow的英文评论二分类CNN模型
胖大海瘦西湖: 您好，请问在训练过程中，TextCNN类的self.W是如何被更新的呢？
基于Tensorflow的英文评论二分类CNN模型
qq_35653072: 楼主，我想问一个特别白痴的问题，为什么我用Spyder运行时总是报错，这个源码时下载之后直接就可以运行么

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。