Python-pandas

最新推荐文章于 2022-06-24 20:06:48 发布

风儿你慢慢吹

最新推荐文章于 2022-06-24 20:06:48 发布

阅读量218

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woshisunyizhen/article/details/100524801

版权

Pandas是封装在Numpy基础之上的；

1. pandas 里对字符型值叫Object

a=pandas.read_csv("") read_csv: 默认第一行为列名；

print(type(a))

print(a.dtypes)

print(help(pandas.read_csv))

a.head()默认显示前几条

a.head(3) 显示前2条

a.tail() 显示后几条

a.column, 第一行名称

a.shape 行列，数据的规模；

a.loc[0] 第一个数据

a.loc[6] 第六个数据

2.常用的类型

object- for string values;

int- for integer values;

float- for float values;

datatime-for time values;

bool- for Boolean values;

3. a.loc[3:6]

b=a[''""]

names=a.columns.tolist() 把当前的列名做成了一个list

print(names)

gram_columns=[]

for c in names:

if c.endswith("(g)"):

gram_columns.append(c)

gram_df=food_info[gram_columns]

print(gram_df.head(3))

4.在dataframe中新建列；

5.a.sort_values("ab",inplace=True); Sort_values: 排序；默认从小到大排序；

inplace 代表创建一个新的dataframe.

a.sort_values("ab",inplace=True，ascending=False); 降序操作；

NaN, python将之认为缺失值；

6.数据预处理

age=titanic_survival[''age'']

print(age.loc[0:10])

age_is_null=pd.isnull(age)

print(age_is_null)

age_null_true=age[age_is_null]

print(age_null_true)

age_null_count=len(age_null_true)

print(age_null_count)

缺失值处理：mean=sum()/len()

good_ages=t_survival["age"][age_is_null==False]

快速计算：

passenger_survival=titanic_survival.pivot_table(index="Pclass", values="Survived",aggfunc=np.mean) 默认按均值；

#index tells the method which column to group by

#values is the column that we want to apply the application to

#aggfunc specifies the calculation we want to perform

ports_stats=titanic_survival.pivot_table(index="Embarked",values=["fares","survived"], aggfunc=np.sum) 算总值

print(ports_stats)

#specifying axis=1 or axis='columns' will drop any columns that have null values 丢弃缺失值

drop_na_columns=titanic_survival.dropna(axis=1)

new_survival=titanic_survival.dropna(axis=0,subset=["age","sex"])

row_index_83_age=titanic_survival.loc[83,"Age"]

reset.index(drop=true) 对索引重新排序！

7. This function returns the hundredth item from a series

def hundredth_row(column):

#extract the hundredth item

hundredth_item=column.loc[99]

return hundredth_item

hundredth_row=a.apply(hundredth_row) apply 函数；

8.定义一个求缺失值个数的函数；

def not_null_count(column):

column_null=pd.isnull(column)

null=column[column_null]

return len(null)

#应用

column_null_count=titanic_survival.apply(not_null_count)

print(column_null_count)

9. #Series (collection of values)

#DataFrame (Collection of Series objects)

风儿你慢慢吹

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python-pandas

Pandas是封装在Numpy基础之上的；1. pandas 里对字符型值叫Objecta=pandas.read_csv("") read_csv: 默认第一行为列名；print(type(a))print(a.dtypes)print(help(pandas.read_csv))a.head()默认显示前几条a.head(3) 显示前2条a.tail() 显示...
复制链接

扫一扫

风儿你慢慢吹 CSDN认证博客专家 CSDN认证企业博客

码龄7年

68: 原创

2万+: 周排名

21万+: 总排名

21万+: 访问

: 等级

1815: 积分

1054: 粉丝

176: 获赞

29: 评论

611: 收藏

私信

关注

热门文章

分类专栏

Linux 20篇
笔记 1篇
Python 31篇
C语言 2篇
visual studio 1篇
C# 2篇
文档输出C# 1篇
数据结构 4篇
算法 4篇
SQL 1篇
Github 1篇
SourceTree 1篇
量化投资软件工程师 1篇

最新评论

Linux打补丁遇到Hunk# succeeded at提示
rosemary512: 这个消息是来自`patch`命令的输出，表示补丁已经成功应用。 "Hunk #1 succeeded at 7242 (offset 354 lines)"的意思是，补丁文件中的第一个部分（或"hunk"）已经成功应用于目标文件的第7242行。"offset 354 lines"表示这个部分在补丁文件中的位置与原始文件中的位置有354行的偏移。这种偏移通常是由于目标文件在创建补丁后已经被修改过，导致行号发生了变化。`patch`命令会尝试找到最佳的位置来应用补丁，即使这个位置与补丁文件中指定的位置有所偏移。
Linux打补丁遇到Hunk# succeeded at提示
rosemary512: "Hunk #1 succeeded at * with fuzz" 表示补丁已经成功应用，但是需要使用"fuzz"因子来应用。"fuzz"因子是指patch命令在应用补丁时，允许忽略一些行的不匹配，以便在源代码已经略有改动的情况下仍然可以应用补丁。所以，这个消息表示补丁已经成功应用，但是可能并不完全符合原始的补丁文件。这可能是因为目标文件在创建补丁后已经被修改过，导致一些行不再匹配。在这种情况下，如果修改不影响补丁的应用，那么patch命令会使用"fuzz"因子来忽略这些不匹配的行，并成功应用补丁。但是，由于"fuzz"因子的使用，补丁的应用可能并不完全符合原始的补丁文件。因此，你应该检查补丁应用后的代码，确保它的行为符合预期。
2022大数据中心-事业单位考试专业题目-回忆分享
pursue_Crazy_NLP: 您好哪里的呢
python itertools模块chain函数功能详解 itertools.chain(*iterable)
终不似少年游: 例子1.3那个应该是集合不是字典吧
Spyder 运行时kernels启动报错
风儿你慢慢吹: 你安过TensorFlow吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。