自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 seaborn的多样化图表及图表样式设置

单变量条形散点图 sns.stripplot(x, y, data)可用于绘制单变量条形散点图, 第一个参数x为横坐标方向上的特征,第二个参数y为纵坐标方向上的特征,参数 data 用于指定数据集。 sns.swarmpot()使用避免重叠点的算法将分类轴上的每个散点图点定位。 双变量条形散点图 在绘图的过程中,传入参数hue可以设置条形柱中的另一个变量名。 箱线图和琴形图 sns.boxplot( )可绘制箱线图。 sns.violinplot( )用于绘制琴形图,琴形图是箱线图和核密度图的结合。 多变量

2021-07-24 16:56:29 1563

原创 小象学院数据分析笔记:绘制常见的图形

折线图: plt.plot(x,y): x,y分别为x和y轴数据 # 添加数值标注 import pandas as pd import matplotlib.pyplot as pltimport pandas as pd import matplotlib.pyplot as plt %matplotlib inline stock_df = pd.read_csv('../data/stock_df.csv') plt.figure(figsize = (10,5)) # 绘制贵州茅台每日股价收盘价折

2021-07-13 16:23:01 202

原创 小象学院_数据分析_第6关 洗掉观看记录中的脏数据_笔记

1.缺失值判断: isnull():得到的是一个与源数据同样行列维度的DataFrame,结果元素的值由True和False组成,当结果元素值为True时,表示源数据中对应位置上包含了空值。 当数据量较大的时候,我们可以借助方法any(),让结果更加简洁: 如果我们希望按行进行统计,可以将any()的axis参数指定为1: 2.缺失值处理: 丢弃或填充。 丢弃缺失值:dropna(): (1)包含空值的行全都被删除了; (2)dropna()不会修改原始DataFrame中的数据,如果希望

2021-06-29 23:49:16 126

原创 presto解析json串中的布尔值

presto解析json串中的布尔值 json串为: { "status":"SUCCESS", "bank_account_number":"8***22", "bank_code":"BCA", "updated":"2021-06-29T07:41:09.388Z", "is_normal_account":true, "name_matching_result":"MATCH", "id":"60dace954b96181226cfbac7"

2021-06-29 16:14:09 721

原创 小象学院_数据分析_第5关 全球哪个国家最年轻_筛选与排序笔记

1.数据筛选: # 计算各个国家的年龄中位数大于39的行数据,若是大于39,则会返回True,表示该行被标记为True,否则被标记为False booleans= df['Med Age']>39 #打印booleans的前10行数据 booleans.head(10) # 通过以上操作得到了一组bool值,每个bool值对应了一行数据,为True,表示对应的行会留下,否则,则去除 df[booleans] # TODO # 打印数据的维度 df[booleans].shape 1.1多条件联合筛选

2021-06-27 22:45:41 66

原创 python拆分长串及排序

工作时需要把一堆混在一起的衍生变量归类,并对应其归属的数据源: 方法1:excel的分列功能,选择分隔符号(TAB&逗号),然后一步一步往下走即可。接着把分隔好的单元格全部复制,粘贴复制成列——筛选排序即可。 方法2:python实现 # 列表排序 list=['topup_0_30_avg_rate_180_360', 'phoneinquiries_3d_rate_360', 'topup_0_30_times_std_60_90', 'topup_30_60_avg_std_180_360',

2020-12-25 17:03:42 229

原创 python连接presto

python连接presto 折腾了好久看了各种教程,发现都没法连上presto,今天终于找到大神出马,帮忙解决了连接的问题: from sqlalchemy import * from sqlalchemy.engine import create_engine from sqlalchemy.schema import * import pandas as pd eng = create_engine('presto://10.*.*.113:5797/hive/dp_ods') df = pd.

2020-12-22 14:04:17 1575

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除