目录
一、excel处理常用模块
方式 | 功能 | 文件格式 | 备注 |
xlrd | 只能读 | xls, xlsx | |
xlwt | 只能写 | 只能xls格式 | |
openpyxl | 读+写 | 只能xlsx格式 | 读写速度不如xlrd和xlwt |
csv | 读+写 | csv格式 |
二、模块使用
1、pandas
1) 通过读取excel,创建DataFrame
df = pd.read_excel('excel_name')
2) 筛选
df_filtered=df[condition],condition为筛选条件
a、常用筛选条件
条件关系 | 举例 | 扩展 |
等于 | df['col_name']=='val' | |
不等于 | df['col_name']!='val' | |
或 | (df['col_name']=='val1') | (df['col_name']=='val2' ) | df['col_name']=='val1'| 'val2' ?? |
且 | (df['col_name']=='val1') & (df['col_name']!='val2') | |
属于 | df['col_name'].isin(list) | |
包括 | df['col_name'].str.contains('val') | df['col_name'].str.contains('val1'|'val2'|……) |
非 | [~df['col_name'].str.contains('val')] |
b、筛选时间
df['date']).dt.date,得到date数据的日期,精确到天
eg: df['创建时间']).dt.date>='2023-06-10',创建时间从2023年6月10日至今为止的dts单
详细可参考:
Pandas学习(二)_dfjxj_CP3?的博客-CSDN博客
3)