股票数据分析
股票相关数据分析方法和工具
xieyan0811
算法工程师,终生学习者,《Python大数据与机器学习实战》作者
展开
-
Python获取国内股票数据
1. 安装支持库$ pip install panda$ pip install tushare2. 说明Pandas是数据分析工具包TuShare是国内股票数据抓取工具,除了股票的实时和历史数据,还有基本面数据,加上自然语言处理(比如情绪分析),或者机器学习,就比较有趣了。3. 程序1) 代码import tushare原创 2017-06-27 15:06:48 · 53734 阅读 · 2 评论 -
Python量化交易之四_聚宽数据
介绍之前测试过一些免费API,比如tushare现在只能下载两年半数据,163有的股票数据无法下载,pandas_reader速度很慢,并且只能下载A股的各股数据,对基金和指数支持不佳。这两天尝试了聚宽平台提供的API,它提供的功能基本够用,总结如下。聚宽平台提供自2005年至今的股票相关数据(包含各股数据、指数、基金等等),需要申请一个免费试用帐号,使用期为一年,每天可下载最多100万条...原创 2019-09-27 08:50:59 · 3510 阅读 · 0 评论 -
Python股票处理之八_大数定律
1. 引子 有一天,我看见一个预测日涨跌的程序,成功率在百分之七十几,于是分享给X同学。结果人家说“70%多,这准确率高么?瞎蒙的准确率也有50%” 这准确率高么?只靠对技术形态的判断,好像也还行吧?如果有70%的正确率,到底怎么做赢的机会比较大?达到多少百分比,才能够满意? 今天看《程序员的数学2:概率统计》中有一道类似的习题:设结果甲出现概率原创 2017-07-31 22:49:05 · 3719 阅读 · 0 评论 -
Python股票处理之七_数据库存储
1. 说明股票数据无需每次都从网上下载,像日线级别的历史数据会常常用到,使用多线程下载一般也需要几个小时,最好存储到本地,除了已有的特征值,还有清洗后的数据,和计算出的新特征值,以及与其它程序共享数据的需要。相对于数据文件,使用数据库更合适。本文介绍pandas(数据结构支持)通过sqlalchemy与数据库连接,存储tushare下载的日线数据,用一套代码操作不同数据库(mys原创 2017-07-21 12:16:22 · 3790 阅读 · 0 评论 -
Python股票处理之六_数据预处理A
1. 说明在数据统计和预测的过程中,工程师基本都使用现成的算法,工程师的主要工作是根据具体业务逻辑预处理数据和选择算法。首先要对数据预处理(数据清洗),包括数据的归一化,去除重复数据,修改错误数据,填充无效数据,抽象数据表示,筛选特征值,分配权重等等,以得到更准确的数据和更有效的结果。继续上次关于股票直方图的话题,来看看简单的股票数据预处理。左图是昨天股票涨跌的直方图原创 2017-07-04 13:32:02 · 5529 阅读 · 0 评论 -
Python股票处理之五_直方图统计
1. 说明直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况(见下图)。直方图是统计中的常用工具,在图像处理中,经常通过边缘或者颜色统计计算直方图,并通过直方图匹配实现图像识别;也可以据此判断颜色分布,以调节色彩均衡;还可以筛选出感兴趣的区域,并做进一步处理。在股票数据处理中,也同理,统计出直方图后,可利用它和原创 2017-07-04 13:27:38 · 2355 阅读 · 0 评论 -
Python股票处理之四_股票筛选
一、说明本例实现了股票筛选功能。前一半是过滤出市盈率在0-30倍之间,且今日换手率>1%,涨幅超2%的股票。后一半统计今日涨停和接近涨停的股票。二、程序#! usr/bin/python #coding=utf-8import pandas as pdimport tushare as tse = ts.get_today_all()code = e[u'code'原创 2017-06-30 17:40:19 · 13750 阅读 · 2 评论 -
Python股票处理之三_实时监测
1. 说明写个脚本帮你每天盯着某几支股票,达到预设值时响铃提醒。这是最简单的股票应用,虽然谈不上智能,但是自动化――老盯着就容易冲动操作。本例中实现了每5秒取一次股票数据,并在上证指数高于3200点,或601318低于49元时响提醒。2. 程序import osimport timeimport tushare as tsimport pandas as原创 2017-06-30 17:37:45 · 10626 阅读 · 3 评论 -
Python股票处理之二_数据存盘
1. 说明有些历史数据不用每次下载,可以存储到本地。尤其在调试阶段,省去了每测一遍都要下载数据的时间和流量。Python存储数据非常方便,完全不用考虑数据库的格式,存进去是那个结构,取出来还是那个结构,屏蔽了所有细节。具体使用HDF格式,该格式可以存储不同类型的图像和数码数据的文件格式。2. 安装相关库$ sudo apt-get install libhd原创 2017-06-30 17:35:39 · 2496 阅读 · 0 评论