自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 matplotlib可视化处理

Matprolib可视化处理图片与子图颜色、标记、线类型刻度、标签、图例设置轴标题、轴标签、刻度、刻度标签添加图例注释与子图加工将图片保存到文件使用pandas和seaborn绘图折线图柱状图直方图&密度图散点图&点图分面网格与分类数据图片与子图首先导入库import matplotlib.pyplot as pltimport pandas as pdimport numpy as np图片与子图画布与图像生成#绘图需要重新拟定一个单元格,尽量避免和其他的数据处理部分放在一

2021-04-18 19:36:32 360 1

原创 时间序列

时间序列日期和时间数据的类型及工具字符串与datetime互相转换时间格式转字符格式字符串格式转时间格式时间序列基础索引、选择、子集日期和时间数据的类型及工具delta=datetime(2011,1,7)-datetime(2008,6,24,8,15)deltadelta.daysdelta.seconds#timedelta表示两个datetime值之间的差from datetime import timedeltastart=datetime(2011,1,7)start+time

2021-04-17 19:05:32 247

原创 数据聚合与分组操作

数据聚合与分组操作group by机制遍历各分组选择一列或所有列的子集数据聚合返回不含行索引的聚合数据压缩分组键(group_keys=False)分位数与桶分析group by机制遍历各分组for name,group in df.groupby('key1'): print(name) print(group) for (k1,k2),group in df.groupby(['key1','key2']): print((k1,k2)) print(gr

2021-03-30 13:45:46 388

原创 数据规整操作(索引分层、merge合并)

文章目录数据规整一、分层索引1.数组重新排列2.设置层级名称3.重排序和层级排序4.按层级进行汇总统计5.对dataframe重设索引二、联合与合并数据集1.SQL式联合:merge函数2.根据索引合并(merge&join)3.沿轴向连接数据规整一、分层索引相当于Excel表中主表头和次表头data=pd.Series(np.random.randn(9),index=[['a','a','a','b','b','c','c','d','d'],[1,2,3,1,3,1,2,2,3]])

2021-03-29 13:52:15 718

原创 Python数据分析,数据清洗常见方法|(《利用Python进行数据分析》)

处理缺失值先导入需要用的库import pandas as pdimport numpy as npfrom pandas import DataFramefrom pandas import Series下面开始各种缺失值处理函数,其实只是罗列,具体的方法需要啥用啥第一步:先检查缺失值#检查缺失值string_data=pd.Series(['aardvark','artichoke',np.nan,'avocado'])string_datastring_data.isnull(

2021-02-03 11:18:04 391

原创 SQL将同一分组的数据放在一起:group_concat()函数

背景:查找一个客户对应所有的销售,把所有销售放在同一个单元格中,即将相同的客户对应的销售组合起来。group_concat([DISTINCT] 要连接的字段 [Order BY 排序字段 ASC/DESC ] [Separator '分隔符'])以一个例子来讲解这个函数select customer,employeefrom Agroup by customer如果不加处理,上述代码处理的结果应展示如下:customeremployeeaa1aa2a

2021-02-01 16:17:28 5199

原创 Python数据分析|pandas入门必看!(《利用Python进行数据分析》)

pandas数据结构介绍SeriesSeries为一维数组型对象,是一个长度固定且有序的字典,可以将索引值和数据值按位置配对。import pandas as pdobj=pd.Series([4,7,-5,3])obj.indexobj.valuesobj2=pd.Series([4,7,-5,3],index=["d",'b','a','c'])obj2obj2[['c','a']]obj2[obj2>0]obj2*2'b' in obj2sdata={"ohio":3

2021-01-31 16:25:15 361 1

原创 Python数据分析|Numpy库的使用

Numpy的基本方法数组创建数组创建import numpy as nparr=np.array([1,2,3,4,5])print(arr)print(type(arr))

2021-01-24 16:58:12 960 2

原创 Python基本语法|入门必看篇

python教程基础数字数据类型转换字符串操作检查合并数组基础数字调用random包创建随机数randrange(start,stop,step)import randomprint(random.randrange(1,10))数据类型转换int()-用整数转换其他数据类型格式数据float()-用浮点数转换其他数据类型格式数据str()-用字符串转换其他数据类型格式数据字符串操作a="hello,world!"print(a[1]) #返回位置为1的字符,第一个字符的位置为

2021-01-16 23:34:40 427

原创 书写Group by 等聚合函数的常见错误及解决方法(经典!)

Group by 常见错误及解决方法错误一:在select 子句中写了多余且不唯一的列select A.a,min (A.aa) as t,B.bbfrom Aleft join B on B.b=A.agroup by A.a上述代码块中的B.bb为多余列,A.a与A.aaA.aA.aam1m2n3m3而A.aa与B.bb中的对应关系如下A.aaB.bb172839310错误原因在

2021-01-06 15:02:46 1647

原创 SQL连接根本区别是什么?

SQL连接根本区别left join 左联接,A为主表(左表),B为右表,查询结果返回A、B公共部分,并且保留A全部数据,匹配不到的部分右表不显示select A.afrom Aleft join B on B.b=A.aright join 右联接,A为主表(左表),B为右表,查询结果返回A、B公共部分,并且保留B全部数据,匹配不到的部分左表不显示select A.afrom Aright join B on B.b=A.ainner join 内联接,查询结果返回A、B公共部分,其

2021-01-03 21:17:51 82

原创 SQL拓展及应用| SQL中的left join ……on 以及left join ……on ……and

SQL中的left join ……on 以及left join ……on ……and背景:写连接查询时需要对某个字段进行筛选问题:1、需要明确是想从整个查询表中筛选符合要求的所有数据还是筛选单个条件下的部分数据2、左连接的左表老是忘……(艾玛)场景:要查看某个客户的续费金额,负责收款的这个销售需要在该客户的维护团队中,表名字段收款表Aamount,employee_id销售表Bemployee_id客户维护表Cemployee_id,status(0为不在

2021-01-03 14:30:39 429

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除