自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 抖音用户浏览行为分析(作者聚类)

##项目背景数据为抖音用户浏览数据,此份数据指标以“作品发布时间”为准,是以作者/作品的角度研究分析出发的一份数据###分析思路###数据字段描述###读取数据,数据预处理###数据概览###变量可视化%的人。

2023-08-16 18:19:56 2363 8

原创 (时间序列-时间间隔)基于每日上线时间与下线时间,计算用户最长连续登录时间

【代码】(时间处理)基于每日上线时间与下线时间,计算用户最长连续登录时间。

2023-08-08 16:19:56 233 1

原创 人力资源分析1.1-为什么离职

kaggle平台数据,人力资源分析数据集汇聚了对大量员工的信息数据统计,包括企业因素(如部门)、员工行为相关因素(如参与过项目数、每月工作时长、薪资水平等)、以及工作相关因素(如绩效评估、工伤事故),这些因素都有很好的分析价值。

2023-07-19 18:47:45 392 1

原创 跨境电商+RMF+kmeans

### 数据说明kaggle描述:这是一个跨国数据集,其中包含在 2010 年 1 月 12 日到 2011 年 9 月 12 日之间发生的英国某电商在线零售的交易数据。数据量很庞大,在分析思路上可以使用机器学习K-Means 等算法,根据客户在市场上的购买行为来细分客户。

2023-06-02 17:16:43 3431 2

原创 PUBG_Mobile:pyspark.ml,随机森林

【代码】PUBG_Mobile:pyspark.ml,随机森林。

2023-05-20 09:10:56 123 1

原创 PUBG_Mobile:随机森林+逻辑回归

kaggle上的绝地求生游戏数据,数据一共4446966条,共计47965场比赛,玩家ID没有明确标示,参与人数未知。以winplaceperc出发,相关性比较强的,玩家步行距离、使用增益物品的数量,与杀死玩家的数量为负相关。ELo分1000为中间点,得分达到1000以上,同时击杀人数需超过30人。从上图可以看出,一局游戏一般玩家受到的伤害0-500。从结果来看,四排的吃鸡概率是最高1.4%1.在一局游戏中,玩家自己所受到的伤害。哈哈,大部分人都很善良,未曾击倒1人。7.载具移动的距离与吃鸡的关系。

2023-05-20 09:08:49 228 1

原创 陌陌-pyspark

【代码】pyspark-陌陌案例分析。

2023-05-20 09:08:34 287 1

原创 共享单车数据-pyecharts

共享单车用户使用数据:2016年8月1日至8月31日,有16887名用户使用了共享单车,共计102361条数据。从日均订单来看,工作日与周末的差距不明显。然而,需要注意的是,由于订单数量持续上升,这一数据并不能作为定论。2.在第二和第三周,周末的订单量相对于工作日略有下降。订单主要分布在30分钟以内,占比89%工作日与周末时间订单量趋势差异明显。月频分布在2-8次,属于正偏态分布。订单量小时分布,工作日与周末对比。订单星期分布,日均订单量对比。1.8月份,订单持续增长。订单量小时分布,星期对比。

2023-05-20 09:05:37 405 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除