![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析实战
文章平均质量分 96
蓝皮怪
普通双非毕业生,应用统计学专业,在校期间,获得了多项省级和全国竞赛的奖项,包括第十二届全国大学生数学竞赛省级二等奖、正大杯第十一届全国大学生市场调查与分析大赛省级三等奖,以及2021年全国大学生数学建模竞赛云南赛区本科组三等奖、首届云南省大学生市场调查与分析大赛本科组一等奖、第八届全国大学生统计建模大赛云南赛区选拔赛本科组一等奖;目前,我已经在社区发布了30多个项目,和鲸主页:https://www.heywhale.com/home/user/profile/620b264cc1ae5e00174705fa/overview,公众号:蓝皮怪的数据坊。
展开
-
用户画像与相关性分析揭示麦当劳满意度提升关键
在当今的餐饮行业中,顾客满意度已成为衡量服务质量和市场竞争力的关键指标,准确了解并提升顾客满意度,对于麦当劳制定有效的营销策略和优化产品服务至关重要。通过深入分析影响顾客满意度的主要因素,可以帮助麦当劳更好地理解顾客行为,从而制定更有针对性的策略,提高整体满意度和忠诚度。本项目深入探讨了影响麦当劳顾客满意度的关键因素,并构建了顾客群体画像,进行了斯皮尔曼相关性分析,研究结果为优化营销策略提供了重要参考,有助于提升整体顾客满意度和增强市场竞争力。原创 2024-07-08 14:25:37 · 1056 阅读 · 0 评论 -
基于随机森林模型对用户转化进行分析与预测
本项目通过可视化分析对数据进行初步探索,再通过斯皮尔曼相关性检验和卡方检验探究用户转化的影响因素,最后建立了随机森林模型,预测某个用户的转化情况,并研究了影响模型的重要特征。原创 2024-07-03 16:24:59 · 1023 阅读 · 0 评论 -
[Kaggle比赛题目]基于统计检验与随机森林回归模型预测房价
本项目主要通过斯皮尔曼相关性分析、方差分析得出影响房价的显著因素,通过这些因素建立随机森林回归模型,预测精度高,最后通过输出模型的重要特征,为房产估值提供科学依据。原创 2024-06-26 17:00:18 · 1105 阅读 · 0 评论 -
智慧购房:链家网上海在售楼盘数据解析与模型构建
随着中国经济的快速发展,上海作为国际化大都市,其房地产市场一直备受关注,购房者在面对庞大且复杂的楼盘信息时,往往感到困惑和不知所措,为了帮助购房者更好地了解市场行情,做出明智的购房决策,本项目选择了链家网上海市在售楼盘数据,进行了全面的数据分析和建模,希望能找出影响上海市房价的关键因素,并建立一个可靠的价格预测模型,为购房者提供科学的决策支持,将通过描述性分析、统计检验和机器学习模型的构建与优化,深入挖掘数据背后的价值,帮助购房者在纷繁复杂的房地产市场中找到最适合自己的房产。原创 2024-06-19 14:04:45 · 1236 阅读 · 0 评论 -
统计检验与机器学习双管齐下:深入解析糖尿病风险
本项目通过可视化分析对数据进行初步探索,再通过斯皮尔曼相关性检验和卡方检验探究患糖尿病的影响因素,因为考虑到患高血压和患糖尿病有的显著性,使用结构方程构建了高血压引发糖尿病的模型和糖尿病引发高血压的模型,通过对比两个模型之间的拟合优度,得出究竟是哪个病症引发另一个病症,最后建立了随机森林模型,在不知道临床测量结果的前提下,去预测某人是否会患有糖尿病,并且研究了影响模型的重要特征。原创 2024-06-17 09:00:00 · 1094 阅读 · 0 评论 -
当当网近4年图书畅销榜单分析(看看你喜欢的书籍/作者是否在里面)
在图书市场中,了解读者的行为和需求对于制定有效的营销策略至关重要。本项目通过分析当当网2020至2023年的畅销书排行榜数据,利用可视化分析和数据挖掘技术,对上榜图书和作者进行深入分析,出版商和网站能够更好地理解读者的需求,从而制定更有效的市场策略,提升用户满意度,最终推动业务发展。原创 2024-06-12 17:29:14 · 1065 阅读 · 0 评论 -
基于聚类与统计检验深度挖掘电商用户行为
在当今竞争激烈的电商市场中,了解用户的行为和需求对于制定成功的市场策略至关重要,本项目通过建立RFM模型、K-Means聚类模型,将1000个用户进行划分,针对不同类的用户,提出不同的营销策略,最后通过统计检验来探究影响用户消费行为的因素和影响用户上网行为的因素,通过这些分析,商家能够更好地理解消费者,从而制定更有效的市场策略,满足用户期望,提升用户体验,最终推动业务发展。原创 2024-06-05 21:58:40 · 900 阅读 · 0 评论 -
必看项目|多维度揭示心力衰竭患者生存关键因素(生存分析、统计检验、随机森林)
心力衰竭影响全球数百万人的健康,了解其生存因素至关重要。本项目结合Kaplan-Meier生存曲线、Cox比例风险回归模型、斯皮尔曼相关性分析、t检验和卡方检验,深入分析了心力衰竭患者的数据。结果表明,年龄、射血分数、血清肌酐、血清钠和随访期对生存率有显著影响。通过随机森林模型,我们预测了患者的死亡几率,并确定了关键影响因素。研究成果为制定有效的预防和治疗策略提供了重要参考,旨在提高心力衰竭患者的生存率和生活质量。原创 2024-05-29 17:06:19 · 1236 阅读 · 1 评论 -
数据清洗到站点聚类,全面解析伦敦共享单车使用规律!
本项目对伦敦共享单车数据进行了全面分析,涵盖了数据清洗、特征工程(构建新特征)、骑行高峰期分析、站点流量分析,以及通过聚类分析将800个站点划分为5类,并对每一类站点提出建议,最后通过方差分析探讨了影响共享单车流量的因素,通过这些步骤,可以识别高频使用的时间段和站点,为运营商提供优化调度和资源分配的科学依据。原创 2024-05-21 10:52:11 · 1484 阅读 · 0 评论