自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 游戏日常运营数据:DAU分解及留存

(一)游戏日常运营数据:DAU分解及留存 附代码斜体样式对于游戏内一般会建立每日用户信息整合日志ods_p1_day(一般基于当日玩家登录登出消费三个基础日志进行整合操作),以及对于历史用户整合日志 ods_p1_all (基于前1日all表与当天day表日志进行整合操作,数据量较大,需定期对间隔较长数据进行删除(14日前),保留月初月末数据)。ods_p1_day表常用设计在这里插入图片描述](https://img-blog.csdnimg.cn/20200525124435314.png)如

2020-05-25 13:06:16 1434

转载 几大分布:正态分布、卡方分布、t分布、F分布整理

一、正态分布 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。二、卡方分布 三、t分布 四、F分布 ...

2019-06-25 17:29:52 56624

原创 游戏数据分析(思维导图)

游戏相关日常运营数据分析思维导图,希望各位大佬帮忙补充~

2019-03-06 19:39:18 7788 1

转载 k-means算法总结

一、算法描述 k-means算法思想可描述为:首先初始化K个类簇中心;然后计算各个数据对象到聚类中心的距离,把数据对象划分至距离其最近的聚类中心所在类簇中;接着根据所得类簇,更新类簇中心;然后继续计算各个数据对象到聚类中心的距离,把数据对象划分至距离其最近的聚类中心所在类簇中;接着根据所得类簇,继续更新类簇中心;……一直迭代,直到达到最大迭代次数T,或者两次迭代J的差值小于某一阈值时,迭代终止,...

2018-08-21 14:22:21 3835

转载 用户画像整理

用户画像: 一、定义用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。用户信息标签化 用户画像是对现实世界中用户的建模,用户画像应该包含目标,方式,组织,标准,验证这5个方面。 目标:指的是描述人,认识人,了解人,理解人。 方式:又分为非形式化手段,如使用文字、语言、图像、视频等方式描述人;形式化手段,即使用数据的方式来刻画人物的画像。 ...

2018-08-19 15:43:33 1943

转载 参数估计方法整理

参数估计:是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。参数估计包括点估计和区间估计。常见点估计方法:矩估计、最小二乘估计、极大似然估计、贝叶斯估计区间估计:利用已知的抽样分布、利用区间估计与假设检验的联系、利用大样本理论一、点估计 1、矩估计矩估计法的理论依据是大数定律。矩估计是基于一种简单的“替换”思想,即用样本矩估计总体矩 优点:简单易行, 并不需要事先...

2018-08-06 10:33:27 39167

原创 kaggle :房屋价格预测问题 ,如何解决get_dummies导致训练数据和测试数据编码不一致的情况

kaggle :房屋价格预测问题~#!user/bin/env python# -*- coding:utf-8 -*-import numpy as npimport pandas as pdfrom scipy.stats import modefrom sklearn import linear_modelfrom sklearn.cross_validation impor...

2018-08-02 19:46:16 1560

原创 kaggle:tatanic遇难预测 xgboost实现

没有对特征工程做过多的扩展,第一次用随机森林试了一下,提交之后只有可怜的50多通过率,之后尝试用xgboost。数据下载链接#!user/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npimport xgboost as xgbfrom sklearn.cross_validation ...

2018-07-31 19:43:13 620 1

原创 PCA、TSNE、LDA、FA降维方法可视化对比

#!user/bin/env python # -- coding:utf-8 -import numpy as np from sklearn.datasets import load_digits from sklearn.decomposition import PCA from sklearn.decomposition import FactorAnalysis from...

2018-07-29 19:59:52 7000 1

原创 no.1

欢迎使用Markdown编辑器写博客hello,world~快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q插入链接 Ctrl + L插入代码 Ctrl + K插入图片 Ctrl + G提升标题 Ctrl + H有序列表 Ctrl + O无序列表 Ctrl + U横线 Ctr...

2018-07-29 19:55:10 136

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除