自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 爬虫_获取天天基金网基金季报对应信息

目标:获取所有公募基金季报中,公募基金经理兼任专户的说明整体思路1.分析网站1.1 动态网站判断1.2 动态网址查找1.3 链接后网址正文2.数据预处理3.解析正文4.总结1.分析网站分析网站目标:找到季度报告正文的网址1.1 动态网站判断方法1:F12 – 刷新 – network – response(这个就是爬虫下来html的内容)方法2:选择不同页码,对应的网址却没有变无法在html中找到对应公告信息,判断为动态网站,数据并不是写死在html中,而是通过js动态载入。动态网站参.

2021-01-22 10:52:47 991 2

原创 python dataframe 增加一行

需求:写个汇总行分析:concat, merge, df.loc[xx] = [a,b,c] 都可以满足也可像 list 一样用append1.append(series) data = pd.DataFrame() series = pd.Series({"x":1,"y":2},name="a") data = data.append(series)2.append(df)与series类似 data = pd.DataFrame() df = pd.

2020-08-27 11:24:33 24394 4

原创 投资交易笔记1

第一本记录的是02年-10年之间利率债的变化,后基本也有信用债的讲解,书中有利率回顾,且是站在当时视角,没有用到未来信息,也没有用上帝视角看待,比较欣赏这一点,文中后面也有研究框架的讲解,但在分析时缺乏对数据的实质检验也缺乏较强说服力,因此在投资交易笔记基础上做出自己的笔记,以期望形成自己的框架1.总览类别nummean3.58std0.6526min1.9825%3.0850%3.3775%4.05max5.412.三个.

2020-06-01 23:53:53 313

原创 pandas 数据比对

问题:df1与另一个乱序df2判断是否一致1,进行数据匹配merge统一排序category# mergedf_load.columns = df_my.columnss_index = df_load['产品名称']df_my_compare = pd.merge(s_index,df_my,on='产品名称')#统一排序df_loadcolumns = df_my.columnsdf_load = df_load.sort_values(by=['产品名称'],ascen

2020-05-29 13:40:32 2385 1

原创 pandas数据替换

1,replace 一次只能替换一个import pandas as pddf1 = pd.DataFrame({'temp':['a','b','c','d','a','e','d']})df2 = df1['temp'].replace('a','ttt')2,map 替换map中的字符,没写在map中的nan填充\df1 = pd.DataFrame({'temp':['a','b','c','d','a','e','d']})df3 = df1['temp'].map({'a':'

2020-05-29 13:39:23 338

原创 python zip

1,zip可视为对应位置打包list1 = [1,2,3,4]list2 = [5,6,7,8]a = list(zip(list1,list2))# 不把a转成list 生成的为<zip at 0x1ace257e688>2,用于迭代list1 = [1,2,3,4]list2 = [5,6,7,8]for (x,y) in zip(list1,list2): print (x,'+',y, "=",x+y)3,用于生成字典k = ["a","b","c"

2020-05-29 13:38:49 134

原创 excel 粘贴只保留数值

对于不规则单元格,选择性粘贴通常会破坏格式,比如这样,就会很麻烦,用vba即可解决~1,alt+F11 打开vba2,sheet右键插入模块3,输入代码Sub save_value()ActiveSheet.UsedRange.Formula = ActiveSheet.UsedRange.ValueActiveSheet.UsedRange.Interior.Pattern = xlNoneEnd Sub4,运行可实现去除公式保留数值和去除单元格颜色...

2020-05-29 11:35:35 2227

原创 python (list,dataframe) 去重

1.list1,set 不能保证顺序new_list = list(set(old_list))2,循环new_list = []for value in old_list: if value not in new_list: new_list.append(value)3,字典(推荐)可以保证顺序new_list = list(dict.fromkeys(old_list))2.dataframe1,seriesdf = pd.DataFrame({'a'

2020-05-29 11:34:50 375

原创 python 字符串处理

import pandas as pdimport numpy as npdf_test = pd.DataFrame({'test_value':['a1','aa1','b1','b2','A2','AA2','Aa2',\ 'are u ok','u are not ok','uu are okey']})-1. str.contains(pat, case=True, flags=0, na=False, re

2020-05-29 11:34:15 798

原创 python group_by

-1.类似字典的调用方式groupby = df.groupby('id')# 遍历for id,group in groupby: print(id) print(group)# 取其中一组data = groupby.get_group('aaa')-2.单列函数df_groupby = df.groupby('id')['salary'].sum()df_groupby = df.groupby(['id','gender'])['salary'].sum()m

2020-05-29 11:33:23 353

原创 python 对时间处理

转格式通常都是str 跟datetime之间转换,int跟datetime的转换,要先进行int跟str之间转换。import datetimedate_beg = 20200330date_end = 20200430date1 = datetime.datetime.strptime(str(date_beg),'%Y%m%d')date2 = datetime.datetime.strptime(str(date_end),'%Y%m%d')a = datetime.dateti.

2020-05-29 11:32:28 94

原创 python 股票策略_每季度仓位写回测

1- 读仓位信息:(1)先简单存到dic中,时间是倒序,在构造time_list中reverse即可(2) str,int转换 int(''.join(str1.split('-'))def read_date(file_name): df_all = pd.read_excel(file_name+'.xlsx',header=None) df_all = df_all.dropna(axis=0,how='all') df_all.columns = ['股票代码','

2020-05-29 11:31:19 922 1

原创 python对outlook邮件整理

网上资料同质化严重,也尝试了很多包,yagmail, zmail, exchanglib,大同小异。以win32com为例,汇总如下。1,发邮件import win32com.client as win32outlook = win32.Dispatch('Outlook.Application')mail_item = outlook.CreateItem(0) # 0: creat mail# 收件人继续写下去mail_item.Recipients.Add('xx@phfund..

2020-05-29 11:27:34 3099

原创 彭博使用_excel api

工作需要开始学习彭博,了解海外债。习惯了wind,感觉彭博又丑又不好用,但真的吹爆彭博客服,专业热情,又快又好,还24小时待机...就是好久没碰英语了...听着费劲,电话沟通还是要同事帮忙,汗颜...(跨境电话是不是接也收费?)目录1. BDP2. 常用指标3. BDH4. YAS5. des1. BDPBDP(“isin_code ISIN”, " indicator", settle_dt = “20200430”)code 和ISIN 中间有空格settle_dt 为下一

2020-05-29 11:09:51 2796

原创 为什么要写函数

1,避免重复性代码比如现在需要计算:3000 * 1.1^12 + 3000 * 1.1^11 + … + 3000 * 1.1^1# 麻烦点 写个循环temp = 0for i in range(1,13): temp = temp + 1.1**(i) result = temp * 3000如果现在需求改了,改成计算下列:3000 * 1.1^12 ...

2020-02-26 11:40:30 306 1

转载 在自定义的类里对jqdatasdk的api进行批量二次封装的方法

(转自:https://zhuanlan.zhihu.com/p/50916846)简介jqdatasdk是聚宽的一个模块,主要用于从本地获取聚宽的金融数据,方便在本地进行量化研究,或者对接本地使用的交易系统。如果要便捷的使用jqdatasdk的话,你可能会希望定义一个自定义的类,然后对jqdatasdk的API进行二次封装,从而实现较高自由度的调用,或者实现一些比较复杂的功能。这里介绍一...

2019-07-22 11:11:55 68

转载 Python量化交易平台:JQData | API使用文档(转)

Python量化交易平台:JQData | API使用文档(转)#原文地址:https://www.joinquant.com/help/api/help?name=JQDataJQData说明书由于内容较多,可使用Ctrl+F搜索您需要的数据。注意:query函数的更多用法详见:query简易教程JQData是什么JQData是聚宽数据团队专门为金融机构、学术团体和量化研究者们提供的...

2019-07-22 11:09:16 930 1

转载 基于JQData的有效前沿组合及投资组合优化

[转载]基于JQData的有效前沿组合及投资组合优化转自 https://www.joinquant.com/community/post/detailMobile?postId=15331&page=&limit=20&replyId=&tag=(1)现代资产组合理论(MTP)是关于在特定风险水平下投资者(风险厌恶)如何构建组合来最大化期望收益的理论,这一理...

2019-07-22 11:05:39 183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除