![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python的小细节
维维的python学习
正在学习的研究生
展开
-
pandas一些方法的合集--无例子
分箱操作基础分箱pd.cut(data,bins,labels)均匀分箱箱的长度相同只是bins不再是一个区间,而是一个整数百分比分箱pd.qcut()bins是一个整数这时处于每个区间的数据量相同当然也可以指定区间不过是百分比eg:[0,0.1,0.5,0.9,1]any all返回bool值‘...原创 2021-04-25 10:36:48 · 76 阅读 · 0 评论 -
链接合集
在这里你能学会如何滚动计算两组数的β值原创 2021-04-23 09:43:52 · 336 阅读 · 0 评论 -
pandas数据清洗与准备
map apply applymap 三者区别知乎详解三者区别稍微总结一下三者功能mapmap函数只能作用于series,即对series的元素逐个使用你所运用的函数‘applyapply函数既可作用于series,也可作用于DataFrame,当作用于series时,会对series逐个元素进行运用函数,此时相当于map函数,当然,并不完全相同,apply函数可以带参数当apply函数作用于DataFrame时,此时会对DataFrame逐列进行操作,当然如果axis=1,会对行进行操作,此原创 2021-04-21 10:20:11 · 66 阅读 · 0 评论 -
探索groupby与rolling的结合后索引的变化
仅仅grouby后看看是怎样的import pandas as pdimport numpy as n data = pd.DataFrame({"a":[1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3],"b":list(range(1,19))})data.groupby("a").mean()结果如图所示,仅仅使用grouby后索引变成a列同时使用groupby 与 rolling看看会发生什么import pandas as pdimport numpy原创 2021-04-19 11:52:37 · 2375 阅读 · 0 评论 -
pandas中groupby与shift的结合
1两者结合后索引会发生什么变化由我的前一篇博文可知,groupby后使用某个函数将会使被分组的那一列作为索引,但是如果我们结合shift函数后会发生什么,我们并不是很清晰,不妨一试上代码import pandas as pdimport numpy as npdf = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[11,22,33,44,55,66]},index=list("abcdef"))df.groupby("a").shift(1)如图所示,我的这个原创 2021-04-15 09:38:09 · 2892 阅读 · 0 评论 -
pandas中merge的一些基本操作
合并的两张表的索引不相同时import pandas as pddf1 = pd.DataFrame({"a":[1,2,3,4],"c":[11,22,33,44]},index=list("abcd"))df2 = pd.DataFrame({"a":[1,2,3,4],"d":[12,13,14,15]},index=list("efgh"))df = pd.merge(df1,df2,on="a",how="inner")df结果如图所示,其生成的表的索引将会发生变化,及重置索引考原创 2021-04-14 14:11:58 · 430 阅读 · 0 评论 -
pandas可能不会注意到的小错误
groupby之后使用自己定义的函数与系统函数的区别1.使用系统的函数df = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[1,2,3,4,5,6]})df.groupby("a").mean()结果如图所示,将会使用"a"作为新的索引2.使用自己定义的函数import numpy as npdef me(alist): return alist.max()df = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[1,2,原创 2021-04-13 19:25:01 · 117 阅读 · 0 评论 -
深入理解使用pandas的groupby与resample后索引的变换
一次使用groupby索引的变化df = pd.DataFrame({"a":[1,1,2,2,3,3],"b":[1,2,3,4,5,6]})last_df = df.groupby("a").mean()print(df)print(last_df)out(1)a b 0 1 1 1 1 2 2 2 3 3 2 4 4 3 5 5 3 6out(2) ba 1 1.52 3.53 5.5原创 2021-04-13 19:05:12 · 1362 阅读 · 0 评论 -
正则表达式笔记
简单匹配[ ] 在这个中括号中可以加入任何你想匹配的数据特殊序列\d匹配任何十进制数字;这等价于类 [0-9]。\D匹配任何非数字字符;这等价于类 [^0-9]。\s匹配任何空白字符;这等价于类 [ \t\n\r\f\v]。\S匹配任何非空白字符;这相当于类 [^ \t\n\r\f\v]。\w匹配任何字母与数字字符;这相当于类 [a-zA-Z0-9_]。\W匹配任何非字母与数字字符;这相当于类 [^a-zA-Z0-9_]。.匹配除换行符之外的任何内原创 2021-04-12 19:33:52 · 129 阅读 · 0 评论 -
pandas函数处理日期
import pandas as pdimport dateutil#获取当天的时间curr_time = pd.datetime.today()#对时间进行格式转换为yyyyMMddcurr_date = pd.datetime.strftime(curr_time, "%Y%m%d")#将日期减一天before_1_curr_time = curr_time - dateutil.relativedelta.relativedelta(days=1)#将日期加一天after_1_转载 2021-04-11 18:17:49 · 245 阅读 · 0 评论 -
pandas阅读文本文件详解
pandas.read_csv()参数详解header该参数的作用是选择你的这份数据的列名,当你的数据没有列明时,你可以选择header=None,默认是header=0.names该参数的作用是直接让你指定列名,即无需考虑header这个参数,但是要注意你所提供的列名个数应当与表的列名个数相同。index_col这个参数是让你指定某一列作为行索引,包括两种,一种是序数,还一种是具体的名字。当然,如果想形成一个分层索引,那么你可以指定多个列作为列名sqp该参数指定分隔符,csv文件默认是"原创 2021-04-10 16:33:43 · 130 阅读 · 0 评论 -
pandas的小细节(二)
6 为什么pandas中的聚合运算遇到nan不会生成nan6.1 nan的运算import numpy as npprint(np.nan+4)out(1): np.nan #这是因为nan与任何数字进行运算,结果均为nan6.2 pandas中的聚合运算import pandas as pdimport numpy as npdata = pd.DataFrame({"a":[1,2,3,np.nan],"b":[np.nan,2,3,4]})print(data)print(dat原创 2021-04-10 15:50:40 · 62 阅读 · 0 评论 -
pandas的一些小细节
1 pandas行列对齐 pd.set_option("display.unicode.ambiguous_as_wide",True) pd.set_option("display.unicode.east_asian_width",True)插入此段代码,print出来的数据就会行列对其原创 2021-04-10 13:17:15 · 576 阅读 · 2 评论