【高效办公】pandas库学习，对excel的简单操作

最新推荐文章于 2024-07-08 00:01:13 发布

於陵樺暉

最新推荐文章于 2024-07-08 00:01:13 发布

阅读量149

点赞数

分类专栏：数据分析 panda库的使用文章标签： python

本文链接：https://blog.csdn.net/wyh33200/article/details/104625344

版权

数据分析同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

panda库的使用

2 篇文章 0 订阅

订阅专栏

panda函数对excel的简单操作

任务需求：把一个文件夹所有的csv文件打开，对某一列进行运算

import pandas as pd
import os
dir = ''D:\工作\业务策略板块\项目\线上学时\'    #设定路径
filenames=os.listdir(dir)		#获取文件名
p=0
for study_online in filenames:	#设置循环
	date = i[:3]	#用切片器把文件名中的“日期”放到date中，也可以用`os.path.splitext(i)[0]`
	open_file = pd.read_csv('D:\\工作\\业务策略板块\\项目\\线上学时分析\\{}'.format(study_online)）
	#把文件用pd库打开，这个`open_file`的文件格式是`DataFrame`数据类型
	study_time_sum = round(open_file['学习时长，单位秒'].sum()/3600,2) 	
	#open_file['学习时长，单位秒'].sum()  将DataFrame中'学习时长，单位秒'列打开，用sum（）求和
	p=p+study_time_sum	#循环控制器
	row = round(len(list(set(open_file['工号'])))/902,2)	
	#对[工号]列进行去重复，也可以用unique去重，row = round(len(list(open_file['工号'].unique()))/902,2)

对于 open_file = pd.read_csv('D:\\工作\\业务策略板块\\项目\\线上学时分析\\{}'.format(study_online)）可以用os.path.dirname(path)进行代码优化

於陵樺暉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【高效办公】pandas库学习，对excel的简单操作

panda函数对excel的简单操作任务需求：把一个文件夹所有的csv文件打开，对某一列进行运算import pandas as pdimport osdir = ''D:\工作\业务策略板块\项目\线上学时\' #设定路径filenames=os.listdir(dir) #获取文件名p=0for study_online in filenames: #设置循环 date...
复制链接

扫一扫