数据挖掘笔记之Pandas

本文介绍了使用Pandas库进行数据挖掘的一些关键操作,包括读取txt和csv文件,设置转换函数,处理日期,更改千分位符,读取Excel文件时的参数设置,以及数据预处理操作如转换数据类型、处理缺失值、计算概率、处理相对时间、提取信息和删除列。
摘要由CSDN通过智能技术生成

Pandas

索引方式:

ser = pd.Series([1,2,3,4])
ser[[0,1]]

读取txt,csv:

pd.read_table(filepath,sep,header,names,index_col,usecols,dtype,converters,skiprows,
		skipfooter,nrows,na_values,skip_blank_lines,parse_dates,thousand,comment,encoding)

converters:字典格式,为某些字段设置转换函数
nrows:读取行数
prase_dates:若为列表,解析为日期;若为嵌套,合并为日期;若为字典,解析列,生成新名
thousand:改变千分位符

读取excel:

pd.read_excel(io,sheetname,header,skiprows,skipfooter,index_col,names,prase_col,prase_dates,
			na_values,thousand,conver_float,converters)

conver_float:数值转换为浮点
pand.head() #读取前5行
pand.tail() #读取后5行

例:
cars.xlsx
在这里插入图片描述
读取数据


                
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值