这篇文章是python操作excel的干货。
干货的潜台词是:看完别忘了结合源数据练练啊!
EXCEL是日常办公最常用的软件,然而遇到数据量特别大(超过10W条)或者需要很复杂的公式时就显得没那么方便了(卡卡卡),所以还是那句话,“Life is short, you need Python”,下面就总结一些python替代EXCEL的常用操作,方便大家学习。
本例数据集采用网上公开的数据源,某地森林大火数据,共有13个特征,X和Y代表地理位置,month代表月份,day代表星期几,FFMC代表细小可燃物湿度码,DMC代表粗腐殖质湿度码,DC代表干旱码,ISI代表初始蔓延指数,temp代表温度,RH代表相对湿度,wind代表风速,rain代表降雨量,area代表地区。
若有兴趣的同学可以从网盘获取数据源:
链接: https://pan.baidu.com/s/19Wlq8Lm7Btpqua151_5TJg
提取码: sii8
目录:
1、导入数据源
2、数据基本操作
3、描述性统计
4、缺失值处理
5、筛选
6、替换
7、排序
8、关联
9、聚合
10、数据透视表pd.pivot_table()
一、导入数据源
#导入相关库
import pandas as pd
import numpy as np
import os
from pandas import DataFrame,Series
import re
df =pd.read_csv(r’E:\work\dai