自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 深入理解pandas.Dataframe.apply

apply的一般用法apply函数既可对Series使用,也可对Dataframe使用当对Series使用时,其会对每个元素运行函数当对Dataframe使用时,其会对列或者行进行迭代当使用groupby与apply联合使用时,可以认为此时传入的是DataFrame...

2021-06-28 23:30:49 172

原创 pandas一些方法的合集--无例子

分箱操作基础分箱pd.cut(data,bins,labels)均匀分箱箱的长度相同只是bins不再是一个区间,而是一个整数百分比分箱pd.qcut()bins是一个整数这时处于每个区间的数据量相同当然也可以指定区间不过是百分比eg:[0,0.1,0.5,0.9,1]any all返回bool值‘...

2021-04-25 10:36:48 85

原创 链接合集

在这里你能学会如何滚动计算两组数的β值

2021-04-23 09:43:52 352

原创 pandas数据清洗与准备

map apply applymap 三者区别知乎详解三者区别稍微总结一下三者功能mapmap函数只能作用于series,即对series的元素逐个使用你所运用的函数‘applyapply函数既可作用于series,也可作用于DataFrame,当作用于series时,会对series逐个元素进行运用函数,此时相当于map函数,当然,并不完全相同,apply函数可以带参数当apply函数作用于DataFrame时,此时会对DataFrame逐列进行操作,当然如果axis=1,会对行进行操作,此

2021-04-21 10:20:11 80

原创 股票知识

股票前的字母表示什么意思深沪两市每逢新股上市首日,在该新股的中文名称前加注“N”以提醒投资者。凡股票名称前加注“N”的股票均为当日上市的新股。“XD”是“exitdivident”的缩写,是指除息的意思;“XR”是“exitright”的缩写,意思是除权;“DR”是“exitdividentandright”的缩写,意思是除息和除权。根据上海证券交易所的有关规定,某股票在除权日当天,在其证券名称前记上XR,为英文Ex-Right的缩写,表示该股已除权,购买这样的股票后将不再享有分红的

2021-04-20 17:21:52 217

原创 股票知识

股票名词本益比(市盈率)益比=普通股每股市场价格/普通股每年每股盈利回档在股市上,股价呈不断上涨趋势,终因股价上涨速度过快而反转回跌到某一价位,这一调整现象称为回档。一般来说,股票的回档幅度要比上涨幅度小,通常是反转回跌到前一次上涨幅度的三分之一左右时又恢复原来上涨趋势。反弹在股市上,股价呈不断下跌趋势,终因股价下跌速度过快而反转回升到某一价位的调整现象称为反弹。一般来说,股票的反弹幅度要比下跌幅度小,通常是反弹到前一次下跌幅度的三分之一左右时,又恢复原来的下跌趋势。套牢是指进

2021-04-20 14:51:43 365

原创 股票基础知识

专有名词(一)集合竞价集合竞价是指对一段时间内接收的买卖申报一次性集中撮合的竞价方式。以我国竞价交易制度为例,集合竞价时成交价格的确定原则是: 1、在有效价格范围内选取成交量最大的价位;2、高于成交价格的买进申报与低于成交价格的卖出申报全部成交;3、与成交价格相同的买方或卖方至少一方全部成交。两个以上价位符合上述条件的,上海证券交易所规定使未成交量最小的申报价格为成交价格。若仍有两个以上申报价格符合条件,取其中间价为成交价格。深圳证券交易所取距前收盘价最近的价位为成交价。集合竞价的所有交易以同一价格成

2021-04-20 14:37:48 743

原创 探索groupby与rolling的结合后索引的变化

仅仅grouby后看看是怎样的import pandas as pdimport numpy as n data = pd.DataFrame({"a":[1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3],"b":list(range(1,19))})data.groupby("a").mean()结果如图所示,仅仅使用grouby后索引变成a列同时使用groupby 与 rolling看看会发生什么import pandas as pdimport numpy

2021-04-19 11:52:37 2426

原创 pandas中groupby与shift的结合

1两者结合后索引会发生什么变化由我的前一篇博文可知,groupby后使用某个函数将会使被分组的那一列作为索引,但是如果我们结合shift函数后会发生什么,我们并不是很清晰,不妨一试上代码import pandas as pdimport numpy as npdf = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[11,22,33,44,55,66]},index=list("abcdef"))df.groupby("a").shift(1)如图所示,我的这个

2021-04-15 09:38:09 2936

原创 pandas中merge的一些基本操作

合并的两张表的索引不相同时import pandas as pddf1 = pd.DataFrame({"a":[1,2,3,4],"c":[11,22,33,44]},index=list("abcd"))df2 = pd.DataFrame({"a":[1,2,3,4],"d":[12,13,14,15]},index=list("efgh"))df = pd.merge(df1,df2,on="a",how="inner")df结果如图所示,其生成的表的索引将会发生变化,及重置索引考

2021-04-14 14:11:58 441

原创 pandas可能不会注意到的小错误

groupby之后使用自己定义的函数与系统函数的区别1.使用系统的函数df = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[1,2,3,4,5,6]})df.groupby("a").mean()结果如图所示,将会使用"a"作为新的索引2.使用自己定义的函数import numpy as npdef me(alist): return alist.max()df = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[1,2,

2021-04-13 19:25:01 125

原创 深入理解使用pandas的groupby与resample后索引的变换

一次使用groupby索引的变化df = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[1,2,3,4,5,6]})last_df = df.groupby("a").mean()print(df)print(last_df)out(1)a b 0 1 1 1 1 2 2 2 3 3 2 4 4 3 5 5 3 6out(2) ba 1 1.52 3.53 5.5

2021-04-13 19:05:12 1389

原创 正则表达式笔记

简单匹配[ ] 在这个中括号中可以加入任何你想匹配的数据特殊序列\d匹配任何十进制数字;这等价于类 [0-9]。\D匹配任何非数字字符;这等价于类 [^0-9]。\s匹配任何空白字符;这等价于类 [ \t\n\r\f\v]。\S匹配任何非空白字符;这相当于类 [^ \t\n\r\f\v]。\w匹配任何字母与数字字符;这相当于类 [a-zA-Z0-9_]。\W匹配任何非字母与数字字符;这相当于类 [^a-zA-Z0-9_]。.匹配除换行符之外的任何内

2021-04-12 19:33:52 149

转载 pandas函数处理日期

import pandas as pdimport dateutil#获取当天的时间curr_time = pd.datetime.today()#对时间进行格式转换为yyyyMMddcurr_date = pd.datetime.strftime(curr_time, "%Y%m%d")#将日期减一天before_1_curr_time = curr_time - dateutil.relativedelta.relativedelta(days=1)#将日期加一天after_1_

2021-04-11 18:17:49 257

原创 pandas阅读文本文件详解

pandas.read_csv()参数详解header该参数的作用是选择你的这份数据的列名,当你的数据没有列明时,你可以选择header=None,默认是header=0.names该参数的作用是直接让你指定列名,即无需考虑header这个参数,但是要注意你所提供的列名个数应当与表的列名个数相同。index_col这个参数是让你指定某一列作为行索引,包括两种,一种是序数,还一种是具体的名字。当然,如果想形成一个分层索引,那么你可以指定多个列作为列名sqp该参数指定分隔符,csv文件默认是"

2021-04-10 16:33:43 145

原创 pandas的小细节(二)

6 为什么pandas中的聚合运算遇到nan不会生成nan6.1 nan的运算import numpy as npprint(np.nan+4)out(1): np.nan #这是因为nan与任何数字进行运算,结果均为nan6.2 pandas中的聚合运算import pandas as pdimport numpy as npdata = pd.DataFrame({"a":[1,2,3,np.nan],"b":[np.nan,2,3,4]})print(data)print(dat

2021-04-10 15:50:40 77

原创 pandas的一些小细节

1 pandas行列对齐 pd.set_option("display.unicode.ambiguous_as_wide",True) pd.set_option("display.unicode.east_asian_width",True)插入此段代码,print出来的数据就会行列对其

2021-04-10 13:17:15 591 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除