自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 seaborn的多样化图表及图表样式设置

单变量条形散点图sns.stripplot(x, y, data)可用于绘制单变量条形散点图,第一个参数x为横坐标方向上的特征,第二个参数y为纵坐标方向上的特征,参数 data 用于指定数据集。sns.swarmpot()使用避免重叠点的算法将分类轴上的每个散点图点定位。双变量条形散点图在绘图的过程中,传入参数hue可以设置条形柱中的另一个变量名。箱线图和琴形图sns.boxplot( )可绘制箱线图。sns.violinplot( )用于绘制琴形图,琴形图是箱线图和核密度图的结合。多变量

2021-07-24 16:56:29 1586

原创 小象学院数据分析笔记:绘制常见的图形

折线图:plt.plot(x,y): x,y分别为x和y轴数据# 添加数值标注import pandas as pdimport matplotlib.pyplot as pltimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinestock_df = pd.read_csv('../data/stock_df.csv')plt.figure(figsize = (10,5))# 绘制贵州茅台每日股价收盘价折

2021-07-13 16:23:01 220

原创 小象学院_数据分析_第6关 洗掉观看记录中的脏数据_笔记

1.缺失值判断:isnull():得到的是一个与源数据同样行列维度的DataFrame,结果元素的值由True和False组成,当结果元素值为True时,表示源数据中对应位置上包含了空值。当数据量较大的时候,我们可以借助方法any(),让结果更加简洁:如果我们希望按行进行统计,可以将any()的axis参数指定为1:2.缺失值处理:丢弃或填充。丢弃缺失值:dropna():(1)包含空值的行全都被删除了;(2)dropna()不会修改原始DataFrame中的数据,如果希望

2021-06-29 23:49:16 137

原创 presto解析json串中的布尔值

presto解析json串中的布尔值json串为:{ "status":"SUCCESS", "bank_account_number":"8***22", "bank_code":"BCA", "updated":"2021-06-29T07:41:09.388Z", "is_normal_account":true, "name_matching_result":"MATCH", "id":"60dace954b96181226cfbac7"

2021-06-29 16:14:09 750

原创 小象学院_数据分析_第5关 全球哪个国家最年轻_筛选与排序笔记

1.数据筛选:# 计算各个国家的年龄中位数大于39的行数据,若是大于39,则会返回True,表示该行被标记为True,否则被标记为Falsebooleans= df['Med Age']>39#打印booleans的前10行数据booleans.head(10)# 通过以上操作得到了一组bool值,每个bool值对应了一行数据,为True,表示对应的行会留下,否则,则去除df[booleans]# TODO# 打印数据的维度df[booleans].shape1.1多条件联合筛选

2021-06-27 22:45:41 79

原创 python拆分长串及排序

工作时需要把一堆混在一起的衍生变量归类,并对应其归属的数据源:方法1:excel的分列功能,选择分隔符号(TAB&逗号),然后一步一步往下走即可。接着把分隔好的单元格全部复制,粘贴复制成列——筛选排序即可。方法2:python实现# 列表排序list=['topup_0_30_avg_rate_180_360', 'phoneinquiries_3d_rate_360', 'topup_0_30_times_std_60_90', 'topup_30_60_avg_std_180_360',

2020-12-25 17:03:42 245

原创 python连接presto

python连接presto折腾了好久看了各种教程,发现都没法连上presto,今天终于找到大神出马,帮忙解决了连接的问题:from sqlalchemy import *from sqlalchemy.engine import create_enginefrom sqlalchemy.schema import *import pandas as pdeng = create_engine('presto://10.*.*.113:5797/hive/dp_ods')df = pd.

2020-12-22 14:04:17 1611

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除