自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 数据异常排查

1.目前数据本身有问题 2.业务本身有问题 数据异常排查的前期准备: 业务理解 指标口径 当前数据产出过程 异常排查步骤: 判断是否异常 最大概率法则归类 闭环 第一步判断是否异常,有4个关键点: 亲自去看数据准确性,不要人云亦云 时间轴拉长,看是近期异常(3个月)还是历史异常 看和该指标关联的其他指标或其他核心指标是否也异常 找到一个关键人物(产品/数据),提前沟通 第二部就是最大概率法则归类 假期效应:开学季、暑假、四大节、当地节日 热点事件:常规热点(世

2020-09-28 19:01:36 500

原创 笔记整理1

# unique()返回的是值为布尔型的数组,nunique()返回的是唯一值的数量的多少 dataframe.nunique() # 保留2017.11.25-2017.12.3期间的数据 startTime = datetime.datetime.strptime("2017-11-25 00:00:00","%Y-%m-%d %H:%M:%S") endTime = datetime.datetime.strptime("2017-12-03 23:59:59","%Y-%m-%d %H:%M:%S

2020-09-13 22:31:00 91

原创 信用卡欺诈检测详细整理

import pandas as pd import matplotlib.pyplot as plt import numpy as np %matplotlib inline data = pd.read_csv("creditcard.csv") data.head() count_classes = pd.value_counts(data['Class'], sort = True).sort_index() count_classes.plot(kind = 'bar') plt.ti

2020-09-12 21:24:32 877

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除