python 大数据入门之pandas

作为一名全栈程序员,广种薄收,我也很苦恼,但是又没有办法,自己是块砖,哪里需要哪里搬。

常用的pandas命令和技巧:

1、读取CSV文件:

data = pd.read_csv("{路径.csv}")

2、读取部分CSV文件:

data = pd.read_csv("E:/豪总导出数据/hw_register_user_20220317.csv",nrows=500)

3、查看某一列数据:

data['首次充值时间']

4、更改某一列数据:

data['首次充值时间'] = data['首次充值时间'].replace("-", "1970-01-01 08:00:00")
#此处是将“-”替换为日期再赋值给‘首次充值时间’

5、查询指定值数据:

data.loc[data["phone"]=='00004E34633A22C355506CE983BC30D5',:]

6、查看数据结构

data.info()

7、查看N条数据

data.head(10)

8、保存数据到CSV文件

df.to_csv('save_path', header=None, index=None)#header第一行,index第一列(默认数字)
#mode = 'a'为追加数据
df.to_csv('save_path', mode='a', header=None, index=None)

9、python列表转dataframe:

#phone_decode = ["a","b","c","d"]
df1 = pd.Series(phone_decode)

10、python列表转numpy

lst = [["a","b"],["c","d"]]
nlst = np.array(lst)

输出:
[['a' 'b']
 ['c' 'd']]

11、numpy转pandas.DataFrame:

df = pd.DataFrame(nlst,index=["xx","yy"],columns=["xxx","yyy"])

12、解决pandas保存中文乱码:

df.to_csv('changed.csv', header=None, index=None, encoding='utf_8_sig')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能-肥鹅

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值