生活中很多地方我们需要使用文档文件来存储我们的列表数据,Excel数据类型文件就是很常见的列表数据文档。但是存储在文件里头的数据我们又该怎样去将他们取出呢?
Python 对 Excel 数据的分析提供了强大的操作方法,并且使用起来十分的便捷。
下面介绍下 Python 是如何对 test.csv 文件数据进行访问的:
文件数据:
A | B |
index01 | 处理话单 |
index02 | 处理话单 |
index03 | 处理话单 |
index04 | 保存话单 |
index05 | 推送业务话单 |
index06 | 推送业务话单 |
index07 | 推送业务话单 |
index08 | 推送客户话单 |
index09 | 推送客户话单 |
index10 | 推送客户话单 |
index11 | 推送客户话单 |
index12 | 推送客户话单 |
index13 | 分拣话单 |
index14 | 分拣话单 |
index15 | 分拣话单 |
index16 | 话单源 |
index17 | 业务测试 |
index18 | 业务测试 |
实验代码:
# -*- coding : utf-8 -*-
import numpy as np
import pandas as pd
#import matplotlib.pyplot as plt
'''
=======================================================================
# Python 读取 .csv 文件数据
# author :xiawp
# date :2018/12/19
=======================================================================
'''
print ('=' * 70)
#打开文件/文件 stream
f = open("D:/test/test.csv");
#df = pd.read_csv(f); # 默认 header=0
df = pd.read_csv(f,header=None, names=['编号','业务类型']); # 设置无标题,并添加自定义标题
print (df)
print ()
print ('=' * 70)
#df.columns = ['A','B']
#print (df)
# 根据标题筛选数据
dataArr = np.array(df[df["业务类型"]=="推送业务话单"]["编号"]);
print (dataArr);
'''
---------- python ----------
======================================================================
编号 业务类型
0 index01 处理话单
1 index02 处理话单
2 index03 处理话单
3 index04 保存话单
4 index05 推送业务话单
5 index06 推送业务话单
6 index07 推送业务话单
7 index08 推送客户话单
8 index09 推送客户话单
9 index10 推送客户话单
10 index11 推送客户话单
11 index12 推送客户话单
12 index13 分拣话单
13 index14 分拣话单
14 index15 分拣话单
15 index16 话单源
16 index17 业务测试
17 index18 业务测试
======================================================================
['index05' 'index06' 'index07']
输出完成 (耗时 0 秒) - 正常终止
'''
实验环境:
test.csv 文件
numpy 和 pandas 模块
PS:(通过dos命令到python安装目录的脚本目录下 执行 : pip list(已经配置了环境变量的,这步骤可以忽略),即可查看当前python环境下拥有哪些模块,如果不存在对应的模块,可以通过命令:pip install [module-name] 进行安装)
read_csv() 函数 参数说明参考:https://blog.csdn.net/sinat_35562946/article/details/81058221
概括总结:以上 Python 案例中,核心代码仅仅只有3行,涵盖了pandas.read_csv()接收什么样的文件流作为参数,并且在.csv文件中未定义表头列名标题的情况下,如何添加自定义列名标题,如何运用切片函数进行进行简单的数据操作。