Python处理Excel数据-pandas篇
非常适用于大量数据的拼接、清洗、筛选及分析
在计算机编程中,pandas是Python编程语言的用于数据操纵和分析的软件库。特别是,它提供操纵数值表格和时间序列的数据结构和运算操作。它的名字衍生自术语“面板数据”(panel data),这是计量经济学的数据集术语,它们包括了对同一个体的在多个时期上的观测。它的名字是短语“Python data analysis”自身的文字游戏。
一、安装环境
1、打开以下文件夹(个人路径会有差异):
C:\Users\Administrator\AppData\Local\Programs\Python\Python38\Scripts
2、按住左Shift右键点击空白处,选择【在此处打开Powershell窗口(s)】
3、输入以下代码通过Pip进行安装Pandas库
./pip install pandas
./pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas
安装完成后会有提示:Successfully installed pandas
二、数据的新建、保存与整理
1、新建数据保存到Excel
import pandas as pd
path = 'E:\python\测试\测试文件.xlsx'
data= pd.DataFrame({
'序号':[1,2,3],'姓名':['张三','李四','王五']})
data= data.set_index('序号') #设置索引列为'序号'列
data.to_excel(path)
2、读取txt文件,将内容保存到Excel(引用B站UP 孙兴华示例文件)
Txt文件:
E:\python\练习.txt
男,杨过,19,13901234567,终南山古墓,2000/1/1
女,小龙女,25,13801111111,终南山古墓,2000/1/2
男,郭靖,40,13705555555,湖北襄阳,2020/1/1
女,黄蓉,35,13601111111,湖北襄阳,2000/1/4
男,张无忌,18,13506666666,明教,2000/1/5
女,周芷若,17,13311111111,明教,2000/1/6
女,赵敏,17,18800000000,明教,2000/1/7
import pandas as pd
path = r'E:\python\练习.txt'
data = pd.read_csv(path,header=None,names=['性别','姓名','年龄','地址','号码','时间'])
data.to_excel( r'E:\python\练习.xlsx') #将数据储存为Excel文件