数据分析
一地明月两袖清风
这个作者很懒,什么都没留下…
展开
-
数据异常排查
1.目前数据本身有问题2.业务本身有问题数据异常排查的前期准备:业务理解指标口径当前数据产出过程异常排查步骤:判断是否异常最大概率法则归类闭环第一步判断是否异常,有4个关键点:亲自去看数据准确性,不要人云亦云时间轴拉长,看是近期异常(3个月)还是历史异常看和该指标关联的其他指标或其他核心指标是否也异常找到一个关键人物(产品/数据),提前沟通第二部就是最大概率法则归类假期效应:开学季、暑假、四大节、当地节日热点事件:常规热点(世原创 2020-09-28 19:01:36 · 488 阅读 · 0 评论 -
笔记整理1
# unique()返回的是值为布尔型的数组,nunique()返回的是唯一值的数量的多少dataframe.nunique()# 保留2017.11.25-2017.12.3期间的数据startTime = datetime.datetime.strptime("2017-11-25 00:00:00","%Y-%m-%d %H:%M:%S")endTime = datetime.datetime.strptime("2017-12-03 23:59:59","%Y-%m-%d %H:%M:%S原创 2020-09-13 22:31:00 · 87 阅读 · 0 评论 -
信用卡欺诈检测详细整理
import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedata = pd.read_csv("creditcard.csv")data.head()count_classes = pd.value_counts(data['Class'], sort = True).sort_index()count_classes.plot(kind = 'bar')plt.ti原创 2020-09-12 21:24:32 · 854 阅读 · 0 评论