2024年Python最全Python学习教程:手把手教你搭建自己的量化分析数据库(1)

#查看交易代码和交易日期个数
print(len(df_all_data.ts_code.unique()))
print(len(df_all_data.trade_date.unique()))
#输出结果:3604;319
d=df_all_data.trade_date.unique()
print(d.max())
print(d.min())
2019-04-25T00:00:00.000000000
2018-01-02T00:00:00.000000000
#获取交易日2019年4月25日数据
pd.read_sql("select * from stock_data where trade_date=‘2019-04-25’ ",engine).head()
复制代码


![Python学习教程:干货实操—手把手教你搭建自己的量化分析数据库](https://img-blog.csdnimg.cn/img_convert/6f22847cb3799cccc6187de55ffbf355.webp?x-oss-process=image/format,png)



构建数据查询和可视化函数:
def plot_data(condition,title):
from pyecharts import Bar
from sqlalchemy import create_engine
engine = create_engine(‘postgresql+psycopg2://postgres:123456@localhost:5432/postgres’)
data=pd.read_sql(“select * from stock_data where+”+ condition,engine)
count_=data.groupby(‘trade_date’)[‘ts_code’].count()
attr=count_.index
v1=count_.values
bar=Bar(title,title_text_size=15)
bar.add(‘’,attr,v1,is_splitline_show=False,linewidth=2)
return bar
查询股价低于2元个股数据分布
c1=“close<2”
t1=“股价低于2元个股时间分布”
plot_data(c1,t1)
复制代码


![在这里插入图片描述](https://img-blog.csdnimg.cn/6704b2f655f94a92a0dad6e6224d9fed.png)


查询股价日涨幅超过9.5%个股数据分布:



c2=“pct_chg>9.5”
t2=“股价涨幅超过9.5%个股时间分布”
plot_data(c2,t2)
复制代码


![Python学习教程:干货实操—手把手教你搭建自己的量化分析数据库](https://img-blog.csdnimg.cn/img_convert/625e725a617ed87891b58eb330d4afcf.webp?x-oss-process=image/format,png)


查询股价日跌幅超过-9.5%个股数据分布:



c3=“pct_chg<-9.5”
t3=“股价跌幅超过-9.5%个股时间分布”
plot_data(c3,t3)
复制代码


![Python学习教程:干货实操—手把手教你搭建自己的量化分析数据库](https://img-blog.csdnimg.cn/img_convert/fd5145c3e3761d85b3ac5501a4878ccc.webp?x-oss-process=image/format,png)


结合选股策略对数据库进行查询和提取数据:



#筛选代码
#获取当前交易的股票代码和名称
def get_new_code(date):
#获取当前所有交易股票代码
df0 = pro.stock_basic(exchange=‘’, list_status=‘L’)
df1 =pro.daily_basic(trade_date=date)
df=pd.merge(df0,df1,on=‘ts_code’)
#剔除2017年以后上市的新股次新股
df=df[df[‘list_date’].apply(int).values<20170101]
#剔除st股
df=df[-df[‘name’].apply(lambda x:x.startswith(‘*ST’))]
#剔除动态市盈率为负的
df=df[df.pe_ttm>0]
#剔除大市值股票
df=df[df.circ_mv<10**5]
#剔除价格高于20元股票
#df=df[df.close<20]
codes=df.ts_code.values
return codes
len(get_new_code(‘20190425’))
#输出结果:46
import talib as ta
#20日均线交易策略
def find_stock(date):
f_code=[]
for code in get_new_code(date):
try:
data=df_all_data.loc[df_all_data.ts_code==code].copy()
data.index=pd.to_datetime(data.trade_date)
data=data.sort_index()
data[‘ma_20’]=ta.MA(data.close,timeperiod=20)
if data.iloc[-1][‘close’]>data.iloc[-1][‘ma_20’]:
f_code.append(code)
except:
pass
return f_code
fs=find_stock(‘20190305’)
print(f’筛选出的股票个数:{len(fs)}')
if fs:
df_find_stocks=pd.DataFrame(fs,columns=[‘ts_code’])
#将选出的股票存入数据库,如果表已存在,替换掉,相当于每次更新
insert_sql(df_find_stocks,‘find_stocks’,if_exists=‘replace’)
print(‘筛选的股票已入库’)
筛选出的股票个数:9
筛选的股票已入库
#查看数据库中筛选的股票池
codes=pd.read_sql(‘find_stocks’,engine)
codes=codes.values.tolist()
codes=[c[0] for c in codes]
#print(codes)
复制代码


对筛选的股票作进一步分析:



select_data=pd.DataFrame()
for code in codes:
try:
df_= df_all_data[df_all_data.ts_code.values==code]
df_.index=pd.to_datetime(df_.trade_date)
df_=df_.sort_index()
select_data[code]=df_.close
except:
pass
select_data.fillna(method=‘ffill’,inplace=True)
select_data.tail()
ret=select_data.apply(lambda x:x/x.shift(1)-1)
ret=ret.dropna()
ret.tail()
prod_ret=ret.apply(lambda x:(1+x).cumprod())
prod_ret.plot(figsize=(12,5))
plt.xlabel(‘’,fontsize=15)
plt.title(‘股票池累计净值’,size=15)
ax = plt.gca()
ax.spines[‘right’].set_color(‘none’)
ax.spines[‘top’].set_color(‘none’)
plt.show()
复制代码


![Python学习教程:干货实操—手把手教你搭建自己的量化分析数据库](https://img-blog.csdnimg.cn/img_convert/1f0c56357989f67deba00492899d54a4.webp?x-oss-process=image/format,png)



#根据代码从数据库中获取数据
def get_data_from_sql(code):
from sqlalchemy import create_engine
engine = create_engine(‘postgresql+psycopg2://postgres:123456@localhost:5432/postgres’)
data=pd.read_sql(f"select * from stock_data where ts_code=‘{code}’",engine)
data.index=pd.to_datetime(data.trade_date)
data=data.sort_index()
#计算20日均线
data[‘ma20’]=data.close.rolling(20).mean()
return data
复制代码


利用20日均线交易策略,搭建数据查询和可视化函数kline\_plot(),完整代码将分享在知识星球上。对选出的股票日K线、20日均线、成交量、买入(buy)和卖出(sell)信号进行可视化,下面以002790.和300573股票的K线图为例。



kline_plot(‘002790.SZ’)
复制代码


![在这里插入图片描述](https://img-blog.csdnimg.cn/d11b915eb3a04b81a99d78bd5163ed49.png)



kline_plot(‘300573.SZ’)
复制代码


![Python学习教程:干货实操—手把手教你搭建自己的量化分析数据库](https://img-blog.csdnimg.cn/img_convert/923bece91269f70b3a2b9ef49bf53054.gif)  
 **结语**


数据库操作其实要学的东西还很多,本文旨在抛砖引玉,简单介绍使用Python 对 PostgreSQL 数据库与 dataframe 型数据进行交互,一步步搭建自己的量化分析数据库。由于文中用到的数据仅为百万条左右,实际上使用excel的csv来读写也很快,并且比较直观,但随着数据的不断增多,要建立自己完善的量化分析系统,数据库的学习就显得尤为重要。注意,文中所提及选股方式和股票代码仅作为示例应用,不构成任何投资建议。


**凡事要趁早,特别是技术行业,一定要提升技术功底。**


其实每个程序员也能意识到目前自己面临的窘境,但能够及时作出改变,顺应时代变化的人太少了。毕竟更多人的情况是,忙着上班,也没人引路,自己也不太会规划。多数人明明“泰山崩于前,而面色如土”只能眼睁睁看着自己被行业淘汰吗?


**点此免费领取:**[CSDN大礼包:《python学习路线&全套学习资料》免费分享]( )


![img](https://img-blog.csdnimg.cn/img_convert/1bfe2d4a7c6ecbfd9dada7770b218db1.webp?x-oss-process=image/format,png)


**包括一些面试真题和一些学习资料,这些资料对于学习软件测试的小伙伴来说是一个很完整的宝库了,也帮助了不少学习软件测试的小伙伴。**


#### Python学习大纲


Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/71e2166464ed45959e2863dae1cc4835.jpeg#pic_center)


#### 入门学习视频




**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友,可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值