数据分析案例
文章平均质量分 62
稻蛙
这个作者很懒,什么都没留下…
展开
-
【数据案例】苹果手机的安卓用户潜在客群
案例来源:@怡通案例地址:https://tech.meituan.com/user-funnel-analysis-design-build.html1. 目标:如果苹果想要扩大用户群,如何争取安卓手机的用户2. 思路:收集苹果发布会时期的用户微博,微博中包含了用户的手机型号,做客群分析3. 过程:1)采集iPhone X发布会当天的微博讨论2)对微博文本进行分类,从价格、外观、功能三个方面分析...原创 2018-04-03 21:44:38 · 1188 阅读 · 0 评论 -
【数据分析案例】从XGBoost算法开始,更好地理解和改进你的模型
案例来源:@将门创投案例地址:https://mp.weixin.qq.com/s/oeetxWMM3cr1BgvIaGU54A1. 目标:使用xgb评估客户的信贷风险时,还希望得出揭示2. xgb全局特征重要性度量1)weight:根据特征用于划分的次数2)cover:根据特征用于划分的次数和每次划分的样本数加权计算得来3)gain:特征用于划分时所带来的训练损失减益的平均值3. 评价特征度量的...原创 2018-06-28 09:56:53 · 2336 阅读 · 0 评论 -
【数据分析案例】留存率分析方法
案例来源:@GrowingIO檀润洋 @鸟哥笔记 @TalkingData @陈维贤案例地址:http://wwv.cyzone.cn/a/20160414/294127.html,http://www.yixieshi.com/51954.html,http://www.youxituoluo.com/4108.html,http://www.woshipm.com/operate/372455...原创 2018-05-31 19:52:54 · 18173 阅读 · 0 评论 -
【数据分析案例】使用机器学习做游戏留存数据挖掘的一种尝试
案例来源:@深极智能案例地址:https://zhuanlan.zhihu.com/p/312135531. 目标:针对K游戏数据,预测玩家留存情况,并找出影响留存的因素2. 数据:玩家id,动作,动作时间戳,玩家关键属性(金币、装备、等级等)3. 数据清洗:1)剔除操作数<16的玩家,这类对游戏题材不感兴趣,非目标用户2)剔除冷门动作信息(在这里绝大部分冷门动作信息是玩家固有的聊天动作)4...原创 2018-06-21 18:35:55 · 4586 阅读 · 0 评论 -
【数据分析案例】DOTA2先干掉中路一塔后有多大胜算?
案例来源:@何求知案例地址:https://zhuanlan.zhihu.com/p/367769671. 问题:dota2中先拿掉对方中路一塔是否对赢得比赛很重要?2. 数据来源:调用OPENDOTA的API(原文中有api使用方法,作者之前也专门写过如何调用dota api的方法)3. 分析过程:1)计算采集比赛样本中“先破塔一方”的胜率a. 由于OPENDOTA有限制访问速度,因此无法获取大...原创 2018-05-29 22:52:38 · 1307 阅读 · 0 评论 -
【数据分析案例】机器学习进入Instagram,利用社交媒体揭秘服饰变化规律
案例来源:@DeepTech深科技案例地址:https://mp.weixin.qq.com/s?__biz=MzA3NTIyODUzNA==&mid=2649532527&idx=3&sn=eda4e9ff6e287351d08d732671c491fd1. 目标:基于instagram数据, 研究服饰风格随着时间、空间的变化规律2. 数据来源:1)采集instagram...原创 2018-05-28 21:46:00 · 452 阅读 · 0 评论 -
【数据分析案例】数据下的城市拥堵秘密:“抄小路”也是一门智慧
案例来源:@DT数据侠案例地址:https://mp.weixin.qq.com/s/fYJHA74UQUHyb6aeDSIpAw1. 问题:1)北京市是否存在支路利用率低的问题?2)哪些地方支路利用率低?2. 数据:2012年北京市和纽约市的出租车运营轨迹数据3. 思路:定义绕路比指标,用该指标结合时间、空间维度进行对比分析。 绕路比指标:R = Dt / DI DI是两地直线距离,...原创 2018-05-23 11:56:34 · 960 阅读 · 0 评论 -
【笔记】如何用共享单车数据来做城市规划
基于摩拜单车提供的数据,回答一个问题:共享单车提高了地铁站的服务范围么?答案是共享单车可以提高地铁站服务范围。共享单车使更多人能在20分钟内抵达地铁站,同时让更多房子成为“地铁房”。原创 2017-10-19 19:03:32 · 3377 阅读 · 0 评论 -
【笔记】比起余文乐和MC天佑,观致5可能更需要论坛KOL
观致5是国产汽车品牌,2016年请余文乐代言,2017年请MC天佑代言,效果好么?基于汽车垂直论坛的数据,初步分析了代言的效果。使用社会网络方法形成KOL网络,提出请代言不如更好地运营论坛,培养优质意见领袖,效果会更好。原创 2017-10-25 20:17:44 · 561 阅读 · 0 评论 -
【笔记】机器破译古文能否找回逝去的人类文明?
印度河流域发现的大量印章中包含了符号,这些符号是文字么?它们的来源地是哪里?采用条件熵、马尔科夫等方法,试图解答上述问题。原创 2017-11-02 19:52:04 · 324 阅读 · 0 评论 -
【案例】H&N木材火炉公司
from《数据挖掘技术:应用于市场营销、销售与客户关系管理》背景:1. H&N公司主营木材、火炉及其相关附属产品2. 该公司正计划将其业务从纽约州扩张到福蒙特州3. 需要找到与纽约走最佳业务实践相类似的地区过程:1. 使用公开的美国人口普查数据,用使用木头取暖家庭比例表示为H&N公司在该地的市场空间2. 区分好与坏地区 · 区分变量除了是好的共性,还要能显著区分好与坏 ...原创 2018-03-10 20:29:59 · 407 阅读 · 0 评论 -
【笔记】杂志选择合适的地区打广告
from《数据挖掘技术:应用于市场营销、销售与客户关系管理》背景:1. 一家全国性的杂志社2. 用户构成如下:过程:1. 首先考虑两个用户,如何判断两个用户谁是目标用户? 1)依靠与用户构成的相似度打分,鲍勃胜 2)然后该杂志定位的目标用户是受过高等教育、收入较高的人,那艾米应该更匹配 → 根据人口统计学特征重新计算指数(越特殊的人口构成指数越高:读者构成* (1/美国人...原创 2018-03-11 00:14:04 · 276 阅读 · 0 评论 -
【数据分析案例】如何定义你的“亲密关系”
案例来源:@将门创投案例地址:https://mp.weixin.qq.com/s/vhOvZyL8ihacFTCfqs8LVg 1. 目标:对恋人间的亲密关系做量化,并找出影响亲密关系的关键因素 2. 数据来源:利用happy couple,恋人可以在上面回答一些与彼此相关的问题。收集到两大类数据: 1)回答的结果相同,那么定义为“相似” 2)关于对方的问...原创 2018-07-19 09:46:00 · 1139 阅读 · 0 评论