机器学习之pandas库(一)使用基础

本文介绍了pandas库的基础操作,包括新建DataFrame、删除和修改列、查看统计信息、数据去重、替换字符串等,旨在帮助理解如何高效地处理数据。
摘要由CSDN通过智能技术生成

总览

1 DataFrame() 创建一个DataFrame对象
2 df.values 返回ndarray类型的对象
3 df.index 获取行索引
4 df.columns 获取列索引
5 df.axes 获取行及列索引
6 df.T 行与列对调
7 df. info() 打印DataFrame对象的信息
8 df.head(i) 显示前 i 行数据
9 df.tail(i) 显示后 i 行数据
10 df.describe() 查看数据按列的统计信息

新建dataframe

dataframe相当于numpy中的二维数据

# 新建
import pandas as pd
a = pd.DataFrame([[1,2,3],
                  [4,5,6],
                  [7,8,9]],columns = ["feature_1", "feature_2", "label"])
# 效果
feature_1	feature_2	label
0	1	2	3
1	4	5	6
2	7	8	9
# 读取
import pandas as pd
df = pd.read_csv("datas/hour.csv", sep=",")
# 读取csv结尾的文件,以逗号作为分割符

删除dataframe列及修改列名

# 删除列名所指的列
del df["列名"]
df.drop(columns=["列名1","列名2"])
# 修改列名
# 暴力修改
a.columns = ['a','b','c']
# 较好的方法(以字典的形式对应替换)
a.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace = True)

查看字段信息

# 查看信息
a.info()

                
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值