自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Python矩阵图表

1、多个变量,一起展示,形成n*n矩阵2、默认情况下,PairGrid 只能展示数值变量g = sb.PairGrid(data = df, vars = ['num_var1', 'num_var2', 'num_var3'])#直方图放在对角线g.map_diag(plt.hist)#其余的放置散点图g.map_offdiag(plt.scatter)3、对于其他关系,Pai...

2020-03-21 17:28:46 646

原创 python 三个变量-其他可视化图

1、两个分类变量和一个数值变量ax = sb.barplot(data = df, x = 'cat_var1', y = 'num_var2', hue = 'cat_var2')ax.legend(loc = 8, ncol = 3, framealpha = 1, title = 'cat_var2')2、“hue” 参数也可以在函数 boxplot, violinplot 和 p...

2020-03-21 16:59:41 3021

原创 python 三个变量-分面

g = sb.FacetGrid(data = df, col = 'cat_var1', size = 4)g.map(sb.boxplot, 'cat_var2', 'num_var2')g = sb.FacetGrid(data = df, col = 'cat_var2', row = 'cat_var1', size = 2.5,margin_titles = True)g.m...

2020-03-20 23:44:08 233

原创 Python 三个变量

如果一个图表需要展示三个变量,那么将会有以下四种情况:(1) 三个变量都是数值变量(2)两个是数值变量,一个是分类变量(3)一个是数值变量,两个是分类变量(4)三个都是分类变量如果三个变量中至少有两个是数值型的,用散点图画出数值变量,然后使用非位置编码的方式可视化第三个变量。非位置的编码方式主要有三种:形状,大小,颜色1、形状对于无序分类变量,形状是一个很好的编码方式。每一个类别,可...

2020-03-20 18:52:59 2190

原创 Python 折线图

1、作用描绘一个数值变量相对于第二个数值变量的变化趋势,在折线图中,每个唯一 x 值或 x 值的分组区间仅绘制一个点(就像直方图一样)。如果一个 x 分组区间中有多个观测值,那么该点在折线图中绘制的 y 值将为该数据点在分组中的概括统计值(例如均值或中位数)。绘制的点用线条连接起来,强调 x 值的顺序或相连特性。2、如果 x 变量表示时间,则数据的折线图通常称之为时间序列图表3、# set...

2020-03-19 00:14:05 589

原创 Python 分面

1、作用分类变量和数值变量2、绘制bin_edges = np.arange(-3, df['num_var'].max()+1/3, 1/3)g = sb.FacetGrid(data = df, col = 'cat_var')g.map(plt.hist, "num_var", bins = bin_edges)g.set_titles('{col_name}')3、每行几个...

2020-03-18 21:08:07 226

原创 Python 分组条形图

1、作用两个分类变量之间的关系2、绘制sb.countplot(data = df, x = 'cat_var1', hue = 'cat_var2')

2020-03-18 20:30:20 1523

原创 python 小提琴图和箱线图

1、作用绘制一个数值变量和一个分类变量之间的关系,小提琴图是较低级别的抽象2、绘制删除箱线图,可以在 violinplot 调用中设置 inner = Nonebase_color = sb.color_palette()[0]sb.violinplot(data = df, x = 'cat_var', y = 'num_var', color = base_color,inner =...

2020-03-18 20:04:13 831

原创 Python 散点图

1、作用研究两个数值变量之间的关系plt.scatter(data = df, x = 'num_var1', y = 'num_var2')#带有回归曲线sb.regplot(data = df, x = 'num_var1', y = 'num_var2')sb默认的回归函数是线性回归...

2020-03-18 00:41:40 633

原创 Python 直方图

1、和条形图的区别直方图的x轴代表的是区间范围,包含左边,不包含右边2、hist 函数会根据值的范围将数据分成 10 个组,df[‘num_var’].describe()估计组下限和组上限最合适arange 仅返回完全小于上限的值。“+1” 可有效地确保最右侧的分组边界至少是数据的最大值,以便所有数据点都能绘制出来import matplotlib as pltplt.hist(dat...

2020-03-17 20:29:10 1449

原创 Python 饼图

1、使用情况(1)整体是由哪几部分组成(2)绘制比较少的部分,比如两个到3部分,某些类别所占的比例很小,那可以将它们组合到一起,或者将这些比例很小的类别放到 “其他” 类别中(3)系统地绘制数据。绘制饼图的一种常见方法是从圆圈的顶部开始,然后沿着顺时针方向绘制每个分类级别,从最常见的到最不常见的排列。如果有三个类别,并且想要对比其中两个,一种常见绘制方法是将这两个类别放在 12 点钟方向的两...

2020-03-17 19:26:37 552

原创 Python条形图

1、条形图import seaborn as sb#data指pd的dataframe,x指的坐标,也可以设置为ysb.countplot(data = df, x = 'cat_var')#返回一个 RGB 元组列表,每个元组由三个数字组成,分别对应红绿蓝通道值,这三个值确定一个颜色sb.color_palette()#选择第一个base_color = sb.color_pale...

2020-03-16 22:36:30 382

原创 Python 可视化

1、类库Matplotlib:功能强大的数据可视化库,但是画一些常用的图也可能需要花时间研究代码。Seaborn:架构在 matplotlib 的基础上,但添加了一些函数或方法,使常见的统计可视化变得更便捷。pandas:虽然这个库包含一些便捷的、基于 matplotlib 的数据可视化方法,但是它的主要功能是进行数据处理,我们也会将其视为处理数据的主要工具。...

2020-03-13 23:48:25 232

原创 python清理数据

1、替换列里的内容# 使用字符串分割,删除每个动物名称前面的 'bb' df_clean['Animal'] = df_clean['Animal'].str[2:]# 在体重和脑重量两列,将 ! 替换为 . df_clean['Body weight (kg)'] = df_clean['Body weight (kg)'].str.replace('!', '.')df_clean[...

2020-03-13 23:23:21 266

原创 python 评估数据

从两个方面评估:数据质量问题(即内容问题)和整洁度(即结构性问题)。(1)脏数据:不准确、损坏的、重复的数据(2)messy data:不整洁,整洁的数据就是一行一列...

2020-03-12 18:28:57 332

原创 python收集数据

1、request库import requestsresponse=request.get(url)response.content//得到了字节,而不是text2、beautifulsoup 解析html3、word_cloud可视化库

2020-03-11 22:47:38 433

原创 数据分析

收集、评估、清洗import pandas as pdimport zipfile# 从压缩文件中提取所有内容with zipfile.ZipFile('armenian-online-job-postings.zip', 'r') as myzip: myzip.extractall()# 读取逗号分隔文件到 DataFramedf = pd.read_csv('onlin...

2020-03-08 21:47:56 156

原创 Jquery 技巧

1、通过button 的onclick传参<td><button class="icon-edit button border-main" type="button" name="update1" onclick="update('${obj.userName}')" value="${obj.userName}">更新</button></td>...

2020-03-02 00:09:23 107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除