前言
之前数学建模的时候处理了3天的数据,也是那次第一次正式使用pands,但是到今天我写这篇博客又过了1个月的时间,现在又对Pandas有了新的认识,所以说代码还是要多写多练。其实具体来说也不是写的很深,由于本人比较懒,还是先写一些放在这,方便以后我使用,其实我之前有习惯就是把自己要记录下来的东西写下来,但是就是不怎么会用这个想用这个编辑器再加上自己很菜,还是不愿意写和总结的。由于最近帮别人解决了一些小问题,同时也希望自己日后的时候方便查阅,然后最近希望整理一些自己编程上的一些方法。一、pandas是什么?
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
二、使用步骤
1.引入库
import pandas as pd
2.读入数据
data = pd.read_excel(
'table.xlsx')
print(data.head())
pands可以读取很多格式,可以称之为read系列函数。
3.查看表格数据
print(data.head())#读取表格的前5行
print(data.tail())#读取表格的后5行
head里面的参数默认是5,即使前5行,可以同理修改。
4.分组操作
df = data.groupby('id')
for name, group in df:
# data按照id分组后的表有多个子表 迭代读取df中的每一个子表
print(name)
print(name)
5.导出表
data.to_excel('data_new.xlsx')
6.字符串str转float格式
df[u"利润"] = pd.to_numeric( df[u"利润"])
# 总结 以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法,由于本人懒,更多函数后续会慢慢更新,期待有生之年吧。