dinghan_333-CSDN博客

原创 Excel超重要函数（1）

1、查找标签对应的数值是什么Vlookup(x,array,cols,0)用于查找某个标签所对应的数值是多少，Vlookup对应的标签是行标签，Hlookup对应的标签是列标签，0代表精确查找2、分位数和分位点Percentrank(array,x,k)，求x在一列数中，所处的分位点是多少，k为保留小数点后几位Quartile(array,k)，求在一列数中，k分位点取0、1、2、3、43、从左往右查找用offset或者vlookup=VLOOKUP(LARGE(B:B,E10),IF

2021-05-29 22:48:14 264

原创 2021年，易方达蓝筹的网络关注度

主要步骤：1、爬取天天基金的评论和发布评论的时间2、统计每天有几条评论3、取7日移动平均值4、wind下载易方达的净值数据，画图结论1、基本没啥意义，天天基金能取到的数据有限。2、不过很好爬，是个好网站3、或许这个关注度可以证明损失效应，投资者对损失更加敏感。import requestsimport reimport xlwtimport pandas as pdheader = { # 请求头 'User-Agent': 'Mozilla/5.0 (Wind

2021-04-07 16:20:10 196 1

原创大市值风格是否会转变？

看到招商证券的一篇文章，认为未来行情会更偏向小市值的股票。于是想验证一下，2021年以来，不同市值股票的表现如何，也就是收益率的大小，然后用excel的条件格式来描绘。主要思路就是把不同股票按市值分成40组，1是最小，40是市值最大，并计算不同组的平均收益率。数据是用choice导出的，这里貌似发不了。选的格式是：横轴是时间，按指标分类，前4000行是涨跌幅，后4000行是总市值。import pandas as pdimport numpy as npdata = pd.read_excel

2021-02-08 17:30:02 166

原创流动性紧缩与估值、市值、行业

1月29日，由于有人造谣央行将紧缩流动性，造成全市场大跌；而在下午央行紧急辟谣后，市场有一个明显的回升，故而大多数股票都呈现先下跌，后反弹。本文旨在探讨，央行紧缩流动性对市值不同的股票的影响、对估值不同的股票的影响，以及对不同行业的股票的影响。结论：1）市值因子并不对流动性敏感；2）高估值对流动性紧缩更加敏感，毕竟流动性紧缩会带动贴现率的上升，从而对高估值股票不利。3）出现谣言时，国防军工下跌最大，银行下跌最小；辟谣之后，消费者服务反弹最大，银行反弹最小。这是不是意味着可以配点银行股？代码：i

2021-02-04 21:42:20 449

原创学习笔记（五）

学习笔记（五）聚宽函数学习：在实际聚宽的运用时，用到的函数环境是以聚宽打开的notebook1.得到指数的数据df1 = get_price(‘000300.XSHG’, start_date=‘2017-01-01’,end_date=‘2020-12-01’, frequency=‘daily’, fields=[‘open’, ‘close’])# XSHG是指数，XSHE就是股票df1[‘rate’] = df1[‘close’].pct_change()# 别用收盘价/开盘价-1算收

2021-01-01 19:49:42 1024 1

原创学习笔记（四）

#导入库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#正常显示中文import warnings# filter warningswarnings.filterwarnings(‘ignore’)from pylab import mplmpl.rcParams[‘font.sans-serif’] = [‘SimHei’]# 以黑体字体显示中文mpl.rcParams[‘axes.unicode_

2020-12-31 19:43:34 228

原创学习笔记（三）

学习笔记（三）1.Fama-French三因子，计算SMB、HML1)首先对因子分组，两种方法，map或wheredata[‘HL’] = data[0].map(lambda x:‘H’ if x>50 else ‘L’)data[‘HL1’] = np.where(data[0]>50,‘H’,‘L’)如果分位数有两个(a和b,b>a)，需要做两次map,但更推荐np.where,只需要一行a,b = pd.quantile([0.3,0.7])#a是第（n+1）*0.3

2020-12-29 15:20:12 283

原创学习笔记（二）

1.apply若是对于dataframe，apply默认对列若是对于Series，apply会默认对所有的数，一般需要转化为DataFrame2.去极值的方法1）绝对中位数法：data是DataFramemad = (data-data.median()).abs().median()data.apply(lambda x: x.clip(x.median()-3mad,x.median()+3mad))2)3sigma法3)百分位法3.t检验import scipy as stats

2020-12-28 21:21:32 206 1

原创学习笔记（一）

loc、clip、corrcoef、linspace、jqdata.get_1.code和close都是df的列名若code为000001，取出其close列下的值df[df.code=='000001']['close']#错误df.loc[df.code=='000001']['close']#错误df.loc[df.code=='000001','close']#正确2.clip函数#绝对中位数法mad = (data - data.median()).abs().median()

2020-12-27 18:41:12 100

原创因子暴露度与因子IC值

因子暴露度与因子IC值注：文中提到的因子值就是纯粹的因子的数据，如roe做各种数据处理之后的大小1.时间序列每到一个时点，抽出所有股票当期的因子（标准差、取极值，市值行业中性化），抽出所有股票下一期的收益率，求相关系数此时的因子暴露度就是因子值，IC值就是相关系数举例：在2010年1月30日，抽出n个股票在1月30日的因子值，做数据处理，再抽出n个股票1月30日到2月28日的收益率，求相关系数2.横截面（回归）对于每一个股票，得到过去30天的因子值，得到过去30天的收益率数据，再由前者算出所有

2020-12-24 16:01:04 9052 1

原创聚宽打开notebook，notebook导入jqdata库

聚宽打开notebook，导入jqdata库在聚宽上通过 “我的策略”模块，可以轻松地实现回测。但在学习阶段，存在很多问题，无法清晰看到使用的函数能够导出什么类型的数据。而如果通过anaconda打开notebook，实际上只能调用jqdatasdk，jqdata和jqdatasdk的函数调用并不同，且很多函数jqdatasdk并没有。故而通过聚宽打开notebook，可以更方便学习具体如下：打开聚宽网页 - 策略研究 - 研究环境 - 上传然后就可以导入jqdata，而不是jqd...

2020-12-24 13:53:02 1336

原创 Python计算MACD的误区

Python计算MACD时的误区指数函数是重要的基本初等函数之一。一般地，y=a……x函数(a为常数且以a>0，a≠1)叫做指数函数，函数的定义域是 R 。df['EMA_short'] = df['收盘价_复权'].ewm(span=12, adjust=False).mean()df['EMA_long'] = df['收盘价_复权'].ewm(span=26, adjust=False).mean()span=12不能实现取出过去12天的数据。alpha=2/（1+span），spa

2020-12-18 15:08:02 1118 1

desafsaf的博客