- 博客(10)
- 收藏
- 关注
原创 游戏日常运营数据:DAU分解及留存
(一)游戏日常运营数据:DAU分解及留存 附代码斜体样式对于游戏内一般会建立每日用户信息整合日志ods_p1_day(一般基于当日玩家登录登出消费三个基础日志进行整合操作),以及对于历史用户整合日志 ods_p1_all (基于前1日all表与当天day表日志进行整合操作,数据量较大,需定期对间隔较长数据进行删除(14日前),保留月初月末数据)。ods_p1_day表常用设计在这里插入图片描述](https://img-blog.csdnimg.cn/20200525124435314.png)如
2020-05-25 13:06:16 1434
转载 几大分布:正态分布、卡方分布、t分布、F分布整理
一、正态分布 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。二、卡方分布 三、t分布 四、F分布 ...
2019-06-25 17:29:52 56624
转载 k-means算法总结
一、算法描述 k-means算法思想可描述为:首先初始化K个类簇中心;然后计算各个数据对象到聚类中心的距离,把数据对象划分至距离其最近的聚类中心所在类簇中;接着根据所得类簇,更新类簇中心;然后继续计算各个数据对象到聚类中心的距离,把数据对象划分至距离其最近的聚类中心所在类簇中;接着根据所得类簇,继续更新类簇中心;……一直迭代,直到达到最大迭代次数T,或者两次迭代J的差值小于某一阈值时,迭代终止,...
2018-08-21 14:22:21 3835
转载 用户画像整理
用户画像: 一、定义用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。用户信息标签化 用户画像是对现实世界中用户的建模,用户画像应该包含目标,方式,组织,标准,验证这5个方面。 目标:指的是描述人,认识人,了解人,理解人。 方式:又分为非形式化手段,如使用文字、语言、图像、视频等方式描述人;形式化手段,即使用数据的方式来刻画人物的画像。 ...
2018-08-19 15:43:33 1943
转载 参数估计方法整理
参数估计:是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。参数估计包括点估计和区间估计。常见点估计方法:矩估计、最小二乘估计、极大似然估计、贝叶斯估计区间估计:利用已知的抽样分布、利用区间估计与假设检验的联系、利用大样本理论一、点估计 1、矩估计矩估计法的理论依据是大数定律。矩估计是基于一种简单的“替换”思想,即用样本矩估计总体矩 优点:简单易行, 并不需要事先...
2018-08-06 10:33:27 39167
原创 kaggle :房屋价格预测问题 ,如何解决get_dummies导致训练数据和测试数据编码不一致的情况
kaggle :房屋价格预测问题~#!user/bin/env python# -*- coding:utf-8 -*-import numpy as npimport pandas as pdfrom scipy.stats import modefrom sklearn import linear_modelfrom sklearn.cross_validation impor...
2018-08-02 19:46:16 1560
原创 kaggle:tatanic遇难预测 xgboost实现
没有对特征工程做过多的扩展,第一次用随机森林试了一下,提交之后只有可怜的50多通过率,之后尝试用xgboost。数据下载链接#!user/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npimport xgboost as xgbfrom sklearn.cross_validation ...
2018-07-31 19:43:13 620 1
原创 PCA、TSNE、LDA、FA降维方法可视化对比
#!user/bin/env python # -- coding:utf-8 -import numpy as np from sklearn.datasets import load_digits from sklearn.decomposition import PCA from sklearn.decomposition import FactorAnalysis from...
2018-07-29 19:59:52 7000 1
原创 no.1
欢迎使用Markdown编辑器写博客hello,world~快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q插入链接 Ctrl + L插入代码 Ctrl + K插入图片 Ctrl + G提升标题 Ctrl + H有序列表 Ctrl + O无序列表 Ctrl + U横线 Ctr...
2018-07-29 19:55:10 136
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人