自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 pandas聚合&分组函数记录

(2)应用:对groupby对象应用多个聚合函数时使用agg()/aggregate()函数,结果一致。(1)整体聚合:df.aggregate(np.sum),默认按列聚合,内置函数可更换。(1)拆分:groupby(“key”)函数,沿任意轴分组,指定的key键可作为组名。(2)对某一列聚合:df['A'].aggregate(np.sum)(6)对不同列运用不同函数:df.aggregate((4)对每个列都运用不同函数:df。(5)对单个列运用不同函数:df。(3)对多列分别聚合:df。

2024-04-11 16:41:41 597 1

原创 pandas的窗口函数记录

3.加权移动函数:ewm(),必须指定加权元素 span、com、halflife 、alpha ——>学不懂跳过先。min_periods=n表示至少n个值求一次函数值(在实际运用中未达到n值时无结果用NaN表示)min_periods表示窗口里的最小元素数量,默认min_periods=window。center表示是否以当前元素为中心移动窗口,默认False。window等于某个标量n,则意味着从当前下标位置向前数n。closed参数具体可查看。

2024-04-08 13:58:01 283

原创 pandas的统计函数记录

method=(average、min、max、first)分别为平均排名、相同数据分配最小排名、相同数据分配最大排名、相同数据根据出现在数组中的顺序进行排名。,返回一个包含原序列元素值和名次的序列,默认当元素相同时返回平均排名。,一般对列进行操作,如需对行进行操作需注明axis=1。

2024-04-07 16:22:28 163

原创 pandas处理字符串的注意点

(1)islower():是否全是小写;(2)issupper():是否全为大写;(3)isnumeric():是否全为数字;(4)startswith(pattern):是否以指定字符串开头;(5)endswith(pattern):是否以指定字符串结尾;(1)strip():去除字符串左右空格;(2)split(" "):指定分隔符切割字符串;(1)lower():转为小写;(2)upper():转为大写;(3)swapcase():交换大小写。3.处理时自动忽略缺失值数据(NaN)

2024-04-07 11:13:20 119

原创 pandas数据清洗

(2)删除缺失值:df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)(1)替换缺失值:df.fillna(n)或者df.replace(old,new)或者df.replace({0:'a',1:'b'})(1)按标签排序:df.sort_index(axis=0/1,ascending=True/False)inplace指定是否修改当前df,inplace=True则修改,False则返回新的结果df。

2024-04-03 15:46:51 795 1

原创 Series与DataFrame的增删改查

df.head(n):显示前n行 df.tail(n):显示后n行 df.info():显示信息。df.describe():显示统计信息(平均数之类的) df.shape():显示df的行数列数。(2)字典dict、数组ndarray、涉及到:pandas、numpy。标量(纯数字之类的)

2024-04-03 14:42:20 572 1

原创 loc与iloc的使用记录

(5)指定数据选取:df.loc[ df ['a'] ==10, ['b','c'] ]——>选取了当a=10时,b和c行的结果。(4)选择多列:df.loc[:, [col_index1,col_index2] ](3)选择多行:df.loc[ [row_index1,row_index2] ](2)选择列:df.loc[:,col_index]2.iloc的使用:依据自然索引(无自定义)进行检索。(1)选择行:df.loc[row_index]1.loc的使用:依据标签/索引检索。

2024-04-02 15:17:42 259

原创 mysql字段过滤——正则(记录)

【代码】mysql字段过滤——正则(记录)

2023-08-31 15:07:51 143 1

原创 float无法作用于split函数解决方法

解决问题:map函数——接收一个函数和一个list,函数会作用在list每个元素上。输入要求:一行输入三个浮点数,通过空格间隔。牛客网学习python遇到的问题记录。报错,无法将float类型做间隔。

2023-03-10 16:40:51 219

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除