![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 74
Python风控模型与数据分析
这个作者很懒,什么都没留下…
展开
-
BOSS直聘上java岗位的薪资分析
数据包括职位名称、base地点、薪资水平、经验及学历要求、招聘公司、行业、融资阶段、员工规模等 文末获取数据集。原创 2024-02-29 11:22:12 · 871 阅读 · 0 评论 -
最简数据挖掘|房租价格预测
数据源自最简数据挖掘系列,内容包括位置、出租方式、卧室/客厅/卫生间数量、楼层、面积、装修情况、户型朝向、小区房源情况等等信息,其中包括位置、区、小区名、Label等在内的多个字段都已经过编码/脱敏处理。数据获取见文末。原创 2024-01-29 10:00:00 · 435 阅读 · 0 评论 -
最简数据挖掘|垃圾邮件分类
数据源自最简数据挖掘系列,Email英文的邮件内容,其中Label列ham为正常邮件、spam为垃圾邮件。数据获取见文末统计邮件是否为垃圾邮件的标签分布如下,可以看到4458样本中有592条垃圾邮件。原创 2024-01-24 10:00:00 · 621 阅读 · 0 评论 -
最简数据挖掘|房价预测
数据源自最简数据挖掘系列,内容出售日期、卧室/浴室数量、楼层、生活面积、停车坪面积、地下室面积、建筑面积、修成年份、经纬度等等信息。数据获取见文末字段含义。原创 2024-01-15 10:00:00 · 712 阅读 · 0 评论 -
BOSS直聘上算法岗位的薪资分析
数据包括职位名称、base地点、薪资水平、经验及学历要求、招聘公司、行业、融资阶段、员工规模等 文末获取数据集。原创 2024-01-02 10:42:30 · 1025 阅读 · 0 评论 -
Pandas爬虫-只需要一行
还在为论文、大作业的数据获取而发愁吗,来试试Pandas爬虫、代码只需要一行,让爬取数据不再遥不可及。众所周知数据的获取极其重要,而Python爬虫既实用又听起来高大上,本文通过两个实战小例子来介绍Pandas爬取表格数据。原创 2023-12-25 17:13:55 · 1061 阅读 · 0 评论 -
2023第二届全国大学生数据分析大赛A题思路
首先看整个题目和问题,最终目的是通过用户的交易行为、交易金额、 交易频率、交易时间等信息,分析用户的行为,可促进二次营销,精准营销,促活;题目中要求建模来定位给那些用户发放优惠券,而发优惠券正是促销手段的一种。原创 2023-11-05 10:20:05 · 2207 阅读 · 4 评论 -
Pandas表格样式,你有table-style吗
Pandas提供了style功能,可以直接实现excel里的高亮、色阶、数据条、单元格格式设置、字体设置等等功能,简单场景下不需要把数据导出再调整样式了,本文逐条盘点一下原创 2023-11-20 08:05:35 · 582 阅读 · 0 评论 -
DataCastle企业风险算法赛实战(进阶难度)
DataCastle的华录杯算法赛实战,本文数据处理较为复杂、特征挖掘内容较多,适合统计学/机器学习相关专业、或者有一定模型算法/数据挖掘经验的同学,经验较浅的也可以作为进阶项目实战提升。原创 2023-11-03 10:00:00 · 328 阅读 · 1 评论 -
Python租房价格分析及预测(xgb+catboost+rf)
早年爬取过我爱我家上北京的部分租房信息,现在重新拿来分析和建模,以往文章大多偏二分类、这次来个数据分析+回归模型的文章。原创 2023-10-30 10:00:00 · 975 阅读 · 0 评论