自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 Excel超重要函数(1)

1、查找标签对应的数值是什么Vlookup(x,array,cols,0)用于查找某个标签所对应的数值是多少,Vlookup对应的标签是行标签,Hlookup对应的标签是列标签,0代表精确查找2、分位数和分位点Percentrank(array,x,k),求x在一列数中,所处的分位点是多少,k为保留小数点后几位Quartile(array,k),求在一列数中,k分位点取0、1、2、3、43、从左往右查找用offset或者vlookup=VLOOKUP(LARGE(B:B,E10),IF

2021-05-29 22:48:14 240

原创 2021年,易方达蓝筹的网络关注度

主要步骤:1、爬取天天基金的评论和发布评论的时间2、统计每天有几条评论3、取7日移动平均值4、wind下载易方达的净值数据,画图结论1、基本没啥意义, 天天基金能取到的数据有限。2、不过很好爬,是个好网站3、或许这个关注度可以证明损失效应,投资者对损失更加敏感。import requestsimport reimport xlwtimport pandas as pdheader = { # 请求头 'User-Agent': 'Mozilla/5.0 (Wind

2021-04-07 16:20:10 184 1

原创 大市值风格是否会转变?

看到招商证券的一篇文章,认为未来行情会更偏向小市值的股票。于是想验证一下,2021年以来,不同市值股票的表现如何,也就是收益率的大小,然后用excel的条件格式来描绘。主要思路就是把不同股票按市值分成40组,1是最小,40是市值最大,并计算不同组的平均收益率。数据是用choice导出的,这里貌似发不了。选的格式是:横轴是时间,按指标分类,前4000行是涨跌幅,后4000行是总市值。import pandas as pdimport numpy as npdata = pd.read_excel

2021-02-08 17:30:02 159

原创 流动性紧缩与估值、市值、行业

1月29日,由于有人造谣央行将紧缩流动性,造成全市场大跌;而在下午央行紧急辟谣后,市场有一个明显的回升,故而大多数股票都呈现先下跌,后反弹。本文旨在探讨,央行紧缩流动性对市值不同的股票的影响、对估值不同的股票的影响,以及对不同行业的股票的影响。结论:1)市值因子并不对流动性敏感;2)高估值对流动性紧缩更加敏感,毕竟流动性紧缩会带动贴现率的上升,从而对高估值股票不利。3)出现谣言时,国防军工下跌最大,银行下跌最小;辟谣之后,消费者服务反弹最大,银行反弹最小。这是不是意味着可以配点银行股?代码:i

2021-02-04 21:42:20 439

原创 学习笔记(五)

学习笔记(五)聚宽函数学习:在实际聚宽的运用时,用到的函数环境是以聚宽打开的notebook1.得到指数的数据df1 = get_price(‘000300.XSHG’, start_date=‘2017-01-01’,end_date=‘2020-12-01’, frequency=‘daily’, fields=[‘open’, ‘close’])# XSHG是指数,XSHE就是股票df1[‘rate’] = df1[‘close’].pct_change()# 别用收盘价/开盘价-1算收

2021-01-01 19:49:42 1003 1

原创 学习笔记(四)

#导入库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#正常显示中文import warnings# filter warningswarnings.filterwarnings(‘ignore’)from pylab import mplmpl.rcParams[‘font.sans-serif’] = [‘SimHei’]# 以黑体字体显示中文mpl.rcParams[‘axes.unicode_

2020-12-31 19:43:34 211

原创 学习笔记(三)

学习笔记(三)1.Fama-French三因子,计算SMB、HML1)首先对因子分组,两种方法,map或wheredata[‘HL’] = data[0].map(lambda x:‘H’ if x>50 else ‘L’)data[‘HL1’] = np.where(data[0]>50,‘H’,‘L’)如果分位数有两个(a和b,b>a),需要做两次map,但更推荐np.where,只需要一行a,b = pd.quantile([0.3,0.7])#a是第(n+1)*0.3

2020-12-29 15:20:12 276

原创 学习笔记(二)

1.apply若是对于dataframe,apply默认对列若是对于Series,apply会默认对所有的数,一般需要转化为DataFrame2.去极值的方法1)绝对中位数法:data是DataFramemad = (data-data.median()).abs().median()data.apply(lambda x: x.clip(x.median()-3mad,x.median()+3mad))2)3sigma法3)百分位法3.t检验import scipy as stats

2020-12-28 21:21:32 190 1

原创 学习笔记(一)

loc、clip、corrcoef、linspace、jqdata.get_1.code和close都是df的列名若code为000001,取出其close列下的值df[df.code=='000001']['close']#错误df.loc[df.code=='000001']['close']#错误df.loc[df.code=='000001','close']#正确2.clip函数#绝对中位数法mad = (data - data.median()).abs().median()

2020-12-27 18:41:12 97

原创 因子暴露度与因子IC值

因子暴露度与因子IC值注:文中提到的因子值就是纯粹的因子的数据,如roe做各种数据处理之后的大小1.时间序列每到一个时点,抽出所有股票当期的因子(标准差、取极值,市值行业中性化),抽出所有股票下一期的收益率,求相关系数此时的因子暴露度就是因子值,IC值就是相关系数举例:在2010年1月30日,抽出n个股票在1月30日的因子值,做数据处理,再抽出n个股票1月30日到2月28日的收益率,求相关系数2.横截面(回归)对于每一个股票,得到过去30天的因子值,得到过去30天的收益率数据,再由前者算出所有

2020-12-24 16:01:04 8873 1

原创 聚宽打开notebook,notebook导入jqdata库

聚宽打开notebook,导入jqdata库在聚宽上通过 “我的策略”模块,可以轻松地实现回测。但在学习阶段,存在很多问题,无法清晰看到使用的函数能够导出什么类型的数据。而如果通过anaconda打开notebook,实际上只能调用jqdatasdk,jqdata和jqdatasdk的函数调用并不同,且很多函数jqdatasdk并没有。故而通过聚宽打开notebook,可以更方便学习具体如下:打开聚宽网页 - 策略研究 - 研究环境 - 上传然后就可以导入jqdata,而不是jqd...

2020-12-24 13:53:02 1306

原创 Python计算MACD的误区

Python计算MACD时的误区指数函数是重要的基本初等函数之一。一般地,y=a……x函数(a为常数且以a>0,a≠1)叫做指数函数,函数的定义域是 R 。df['EMA_short'] = df['收盘价_复权'].ewm(span=12, adjust=False).mean()df['EMA_long'] = df['收盘价_复权'].ewm(span=26, adjust=False).mean()span=12不能实现取出过去12天的数据。alpha=2/(1+span),spa

2020-12-18 15:08:02 1099 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除