数据处理
情懷#妳懂嗎
这个作者很懒,什么都没留下…
展开
-
七、基于python创建一个和已有dataframe相同columns的空白dataframe
说明:创建一个和我们已有的数据文件相同columns的dataframe。1、导入数据import pandas as pdimport numpy as npdata = pd.read_excel(filepath)#filepath为文件路径名data.head(3)#查看数据前3行显示结果:2、创建一个和data相同columns的dataframedata1 = pd.DataFrame(columns = data.columns.to_list())data1显示结原创 2020-09-19 20:21:50 · 1634 阅读 · 0 评论 -
SQL面试必备50题(超详细步骤讲解)
注:#比较难的题目–12,19,22,24,25,42,46(基于oracle编写),其余题目均是基于mysql。1.首先说明几个表的关系如下图所示。一共四个表student、score、course、teacher。其中student表中有字段s_id,s_name,s_birth,s_sex;score表中有字段s_id,c_id,s_score;course表中有字段c_id,c_name,t_id;teacher表中有字段t_id,t_name;各表两两相互关联。2.建立数据库与表需要的同原创 2020-09-03 15:27:33 · 743 阅读 · 1 评论 -
六、将数据写入Excel的不同sheet(基于python)
在数据分析的过程中经常会遇到需要将需要将大量excel文件处理后保存到同一个Excel的不同sheet。但大多数情况下,我们保存的sheet会覆盖上一次保存的结果,本节分享一个比较好的方法实现保存到不同的sheet。from openpyxl import load_workbookwriter = pd.ExcelWriter(file_path,engine='openpyxl')#file_path为自己需要保存到的路径book = load_workbook(writer.path)writ原创 2020-08-31 10:59:50 · 3150 阅读 · 0 评论 -
五、dataframe中根据某一列的值的大小排序
1.数据实例:import pandas as pddict={"name":["小王","小明","小辉","小红","小李"], "education":["大专","本科","研究生","本科","本科"], "salary":[8000,7000,12000,10000,9000]}df=pd.DataFrame(dict)df数据结果:2.按salary大小排序df.sort_values("salary",inplace=True)df排序结果:原创 2020-08-21 20:44:31 · 9163 阅读 · 0 评论 -
四、基于python的字符串的处理(字符串的拆分与类型转换)
本章分享一个字符串的拆分技巧,以及字符串怎么转化为整形数据用于计算。任务要求:将salary列数据转换为最大值与最小值的平均值1.数据的创建import pandas as pddict={"name":["小王","小明","小辉","小红","小李"], "education":["大专","本科","研究生","本科","本科"], "salary":["6k-10k","7k-9k","10k-15k","10k-12k","5k-8k"]}df=pd.DataFr原创 2020-08-21 20:22:02 · 677 阅读 · 0 评论 -
二、python时间序列数据的相减
在此记录自己学习python数据分析过程中学到的一些数据处理的小技巧。本节主要分享时间数据的相减。1.将读取的时间序列数据转化为timestamp格式#导入numpy库和pandas库import numpy as npimport pandas as pd#读取待处理的数据#file_path为文件路径名,sheet_name为需要读取的excel数据页data=pd.read_excel(file_path,sheet_name)#将'/'替换为'-'data["时间"]=data原创 2020-08-02 10:44:07 · 3156 阅读 · 0 评论 -
一、python时间序列数据转为timestamp格式
**第一部分**在此记录自己学习python数据分析过程中学到的一些数据处理的小技巧。1.数据的读取#导入numpy库和pandas库import numpy as npimport pandas as pd#读取待处理的数据#file_path为文件路径名,sheet_name为需要读取的excel数据页data=pd.read_excel(file_path,sheet_name)#显示数据前5行data.head()数据读取的结果:由读取结果可以看出,时间序列数据并原创 2020-08-02 10:14:47 · 2463 阅读 · 3 评论