30 个 Python 技巧,加速你的数据分析处理速度

本文介绍了30个Python pandas库的数据处理技巧,包括数据下载、DataFrame创建、读写文件、缺失值处理、条件筛选、字符串操作、数据统计、列操作、时间提取等,旨在加速数据分析过程。
摘要由CSDN通过智能技术生成

又到了学习干货的季节~

今天我们就来学习一下python干货~

在这里插入图片描述

pandas的下载

使用命令下载:

pip install pandas 

在这里插入图片描述
或者自行下载whl文件安装

https://www.lfd.uci.edu/~gohlke/pythonlibs/

在这里插入图片描述

创建DataFrame数据

pd_data = pd.DataFrame({
   
    "name":["小明","小红","小孙","王小","关宇","刘蓓","张菲"],
    "age":[20,18,27,20,28,18,25],
    "sex":["男","女","男","男","男","女","女"],
    "score":[669,570,642,590,601,619,701],
    "address":["北京","深圳","广州","武汉","深圳","广州","长沙"]
})

print(pd_data)

在这里插入图片描述

读取本地文件

pd_data = pd.read_excel('./测试.xlsx')

pd.set_option('display.max_columns', None)   # 显示完整的列
pd.set_option('display.max_rows', None)  # 显示完整的行
pd.set_option('display.expand_frame_repr', False)  # 设置不折叠数据

print(pd_data)

在这里插入图片描述

查看数据是否有缺失

# 如果缺失显示为True,否则显示False
isnull = pd_data.isnull()        
print(isnull)

在这里插入图片描述

统计缺失值个数

null_count = pd_data.isnull().sum()
print(null_count)

在这里插入图片描述

缺失值填充

# 填充数据 我选择了8.888,你随意
pd_data.fillna(8.888, inplace=True)
print(pd_data)

在这里插入图片描述

缺失值删除

# 如果有缺失值,删除此行
exist_col = pd_data.dropna()
print(exist_col)

在这里插入图片描述

查看头尾文件

# 查看头尾文件
print('头文件:', pd_data.head())
print
  • 7
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值