- 博客(3)
- 收藏
- 关注
原创 pandas练习_同期群分析(Cohort Analysis)
1. 同期群分析理论回顾参考 https://www.jianshu.com/p/145a13355fa12. 构造练习数据(Excel)我们设计一份数据, 2019年期间某店铺的成交订单明细, 包含以下4个字段:这里使用Excel中的rand函数, 来构造随机数据, 具体操作略(用户id需要重复)最终, 获取10万条随机的数据3. 数据处理思路生成每月新增用户明细生成每个月份的用户明细将上面生成的数据按用户id关联生成总表总表按月份聚合调整格式4. 用pandas实现整.
2020-05-28 00:26:52 630
原创 机器学习笔记_决策树
一、决策树简介决策树是一种既能做分类,又能做回归的算法。基本形状为:理解上图中的重要概念(根节点,分支,内部节点,叶子节点)二、信息熵的概念(entropy)假设有两个篮子A和B:A装了 [鸡蛋、苹果、香蕉、橘子、芒果、牛奶]B装了 [鸡蛋、鸡蛋、鸡蛋、鸡蛋、鸡蛋、牛奶]从上面两个篮子中随机取一个出来,A有6中结果,B有2种结果A的不确定性大,B的不确定性小,A的熵 >...
2019-06-30 23:17:00 578
原创 定制powerbi形状地图——geojson编辑后转topojson格式
定制powerbi形状地图——geojson编辑后转topojson格式关于powerbi形状地图设置添加自定义地图什么是geojson 和topojson格式接下来获取带有中国行政边界线的地图代码分析geojson格式用Python写代码编辑geojson关于powerbi形状地图设置文件>选项>预览功能>形状映射视觉对象添加自定义地图拖入形状地图>加个字段...
2018-12-25 23:25:30 6876 11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人