python数据分析
情懷#妳懂嗎
这个作者很懒,什么都没留下…
展开
-
六、将数据写入Excel的不同sheet(基于python)
在数据分析的过程中经常会遇到需要将需要将大量excel文件处理后保存到同一个Excel的不同sheet。但大多数情况下,我们保存的sheet会覆盖上一次保存的结果,本节分享一个比较好的方法实现保存到不同的sheet。from openpyxl import load_workbookwriter = pd.ExcelWriter(file_path,engine='openpyxl')#file_path为自己需要保存到的路径book = load_workbook(writer.path)writ原创 2020-08-31 10:59:50 · 3195 阅读 · 0 评论 -
五、dataframe中根据某一列的值的大小排序
1.数据实例:import pandas as pddict={"name":["小王","小明","小辉","小红","小李"], "education":["大专","本科","研究生","本科","本科"], "salary":[8000,7000,12000,10000,9000]}df=pd.DataFrame(dict)df数据结果:2.按salary大小排序df.sort_values("salary",inplace=True)df排序结果:原创 2020-08-21 20:44:31 · 9220 阅读 · 0 评论 -
四、基于python的字符串的处理(字符串的拆分与类型转换)
本章分享一个字符串的拆分技巧,以及字符串怎么转化为整形数据用于计算。任务要求:将salary列数据转换为最大值与最小值的平均值1.数据的创建import pandas as pddict={"name":["小王","小明","小辉","小红","小李"], "education":["大专","本科","研究生","本科","本科"], "salary":["6k-10k","7k-9k","10k-15k","10k-12k","5k-8k"]}df=pd.DataFr原创 2020-08-21 20:22:02 · 702 阅读 · 0 评论 -
三、基于python的数据批量读取、处理与保存
1.数据的批量读取#导入需要用到的库函数import numpy as npimport pandas as pdimport os#文件路径dir_str=r"F:\车联网数据\所有车辆数据\数据" #此处填文件的路径file_name=os.listdir(dir_str)file_dir=[os.path.join(dir_str,x) for x in file_name]file_dir[:,5] #显示前5个结果如下:2.数据的批量处理与保存此处可写个循环,将数据原创 2020-08-14 17:29:00 · 2711 阅读 · 0 评论 -
二、python时间序列数据的相减
在此记录自己学习python数据分析过程中学到的一些数据处理的小技巧。本节主要分享时间数据的相减。1.将读取的时间序列数据转化为timestamp格式#导入numpy库和pandas库import numpy as npimport pandas as pd#读取待处理的数据#file_path为文件路径名,sheet_name为需要读取的excel数据页data=pd.read_excel(file_path,sheet_name)#将'/'替换为'-'data["时间"]=data原创 2020-08-02 10:44:07 · 3211 阅读 · 0 评论 -
一、python时间序列数据转为timestamp格式
**第一部分**在此记录自己学习python数据分析过程中学到的一些数据处理的小技巧。1.数据的读取#导入numpy库和pandas库import numpy as npimport pandas as pd#读取待处理的数据#file_path为文件路径名,sheet_name为需要读取的excel数据页data=pd.read_excel(file_path,sheet_name)#显示数据前5行data.head()数据读取的结果:由读取结果可以看出,时间序列数据并原创 2020-08-02 10:14:47 · 2566 阅读 · 3 评论