AI研习星球-CSDN博客

原创 2023/12 拜个师傅带你学算法写论文

本人是985大学计算机硕士毕业，已经工作了8年。在国内大厂工作，目前仍奋战在机器学习深度学习一线。计算机视觉、自然语言处理、推荐系统、大模型等也有相对应的开发老师。已经辅导过近4000+个国内外本科、硕士、博士同学以及高校老师学生等，对其毕业、实习、升职、转行、科研算法论文创新产生过很多帮助。

2023-12-19 13:11:44 1706

原创数据分析-83-从一线城市到各地的春节火车班次热力可视化（包含数据及代码）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-23 18:49:16 1148

原创数据分析-82-共享单车数据可视化（包含代码和数据）

本次分析明确了共享单车的使用场景：工作日早晚高峰的通勤需求周末白天无明显峰值的外出需求短距离骑行（2公里内）的外出需求改善性意见：可以针对早晚高峰，提前从需求较少的区域投放车辆至高峰期高需求区域用户使用频次有提升空间，有近50%的用户使用频次不超过5次，用户粘性较差，可以推广月卡或优惠套餐等进一步提升用户粘性算法学习4对1辅导论文辅导核心期刊项目的代码和数据下载可以通过公众号滴滴我。

2025-01-23 18:46:16 1707

原创数据分析-81-1919年到2020年飞机历史空难数据（包含代码和数据）

历史上发生空难最多的国家是美国，高达4320次，其次是俄罗斯及英国，分别有1405次及838次截至当前，我国共发生了504次空难。

2025-01-22 11:09:51 1909

原创数据分析-80-针对家庭用电数据进行时序分析（包含代码和数据）

该家庭近60%的功率都是由电热水器和空调所消耗的；在三月末四月初时，该家庭的总用电量达到了最高峰值，在二月末该家庭的总用电量达到了最低谷，并在四月中上旬和四月末有两个用电量低谷期；周日是该家庭一周中总用电量最大的一天，其次是周六和周三，周二和周五是一周中总用电量最少的两天；一天之中，晚上8点到10点是该家庭的用电高峰，其次是上午9点到10点，后半夜4点至6点用电量最低；厨房电器和洗衣房电器晚上8点到10点是使用高峰期，电热水器和空调在上午8点到10点是使用高峰期，其次是晚上8点到10点。

2025-01-22 11:08:10 1324

原创数据分析-79-北上广深天气预报（包含数据及代码）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-16 11:23:44 840

原创数据分析-78-电信用户流失预测探索性分析（决策树、逻辑回归）（包含数据及代码）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-16 11:21:22 1511

原创数据分析-77-CDNow网站用户消费行为分析（包含代码和数据）

orderdt_min=df.groupby('用户ID').购买日期.min()#第一次消费orderdt_max=df.groupby('用户ID').购买日期.max()#最后一次消费#计算用户的平均生命周期所有用户的平均生命周期是134天，比预想的高，但是平均数不具有代表性，接下来还是看一下分布情况。#因为数据类型是timedelta时间，无法直接作出直方图，所以先换算成数值。

2025-01-15 10:20:39 1399

原创数据分析-76-TED演讲数据集探索之可视化分析（包含代码和数据）

Richard Dawkins的演讲。

2025-01-15 10:17:06 1567

原创数据分析-75-关于【小红书】服饰行业数据的探索（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-14 10:23:36 1057 2

原创数据分析-74-医院药品销量可视化（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-14 10:20:52 725

原创数据分析-73-快餐店热销分析与未来销售预测（包含数据和代码）

本项目主要采用了可视化分析，快餐是交易量最大的类别，表明快餐可能是该餐厅的主打产品，现金和在线支付是最常见的两种交易方式，其中现金比在线支付更多一点，其他支付方式的使用频率较低，男性服务员和女性服务员接待顾客的订单数量可能大致相等，显示出性别在工作分配上的均衡，下午和晚上的销售量高于其他时段，这可能与顾客的生活习惯或该餐厅的营业高峰时段有关，销售最多的商品是冷咖啡，最少的是三明治。

2025-01-13 15:00:00 924

原创数据分析-72-关于京东消费行为分析：用户标签及剪辑的探索（包含数据和代码）

针对第一个文件：用户实际产生购买的订单数据（约包含订单号、客户id、消费物品的类别（大类、小类）与牌子、购物日期等）

2025-01-13 10:52:20 1645 1

原创数据分析-71-关于B站每周必看系列榜单数据可视化（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-09 10:34:43 10664

原创数据分析-70-关于近年我国结离婚数据的可视化分析（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-09 10:31:52 2351

原创数据分析-68-2024年春节档电影票房数据分析（包含代码和数据）

总结报告：在2024年春节档期间，中国各城市的票房表现呈现出明显的分级趋势。二线城市因其庞大的市场规模和丰富的电影资源，成为了票房的主力军。三线城市和四线城市也表现不俗，但相对于二线城市略显逊色。一线城市的票房表现相对较差，可能与春节人口流动的有限性有关。而“其它”类别的城市则表现中规中矩，居于所有城市等级的中间位置。这一趋势反映出中国电影市场在不同城市之间的分布差异，也暗示了电影发行和营销策略可能需要根据节假日期间城市等级进行差异化调整。

2025-01-08 14:30:00 3012

原创数据分析-69-关于脱发数据集的探索（包含代码和数据）

随着年龄增长，脱发成为许多人关注的健康问题之一。头发的丰盈与否不仅影响着外貌，更与个体的健康状态息息相关。本数据集汇集了各种可能导致脱发的因素，包括遗传因素、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等。通过数据探索分析，可以深入挖掘这些因素与脱发之间的潜在关联，从而为个体健康管理、医疗干预以及相关产业的发展提供有益参考。

2025-01-08 14:30:00 2391 2

原创数据分析-66-中国黄金股票数据分析及其预测（包含代码和数据）

如上图所示，是股票收盘价格随时间变化的走势图。

2025-01-07 16:00:00 1549

原创数据分析-67-上海餐饮业顾客满意度分析（包含代码和数据）

相关性分析（热力图）：点评数量与口味评分之间的相关性较高（约为0.18），表明点评数量越多的餐饮店，口味评分通常也越高。点评数量与环境评分之间的相关性也很高（约为0.18），说明点评数量较多的餐饮店通常提供的环境质量也较好。点评数量与服务评分之间的相关性相对较低（约为0.17），表明虽然点评数量多的餐饮店通常也有较好的服务评分，但这种关系不如口味和环境评分那么紧密。散点图分析在口味评分与点评数量的散点图中，可以看到随着点评数量的增加，口味评分整体呈现上升趋势。在环境评分与点评数量。

2025-01-07 16:00:00 1678

原创数据分析-64-中国各省以及世界各国预期寿命分析（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-06 16:00:00 3811

原创数据分析-65-全面解析伦敦共享单车使用规律（包含代码和数据）

本项目对伦敦共享单车数据进行了全面分析，涵盖了数据清洗、特征工程（构建新特征）、骑行高峰期分析、站点流量分析，以及通过聚类分析将800个站点划分为5类，并对每一类站点提出建议，最后通过方差分析探讨了影响共享单车流量的因素。共有800个站点，最常用的起始站为Hyde Park Corner, Hyde Park，最常用的终点站为Waterloo Station 3, Waterloo。高峰日的骑行次数达到30132次（2023年8月9日），周三为骑行最高峰，总计136595次。

2025-01-06 16:00:00 1382

原创数据分析-63-基于逻辑回归模型的医疗数据分析（拟合度差）（包含数据及代码）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-04 17:40:36 1195

原创数据分析-62-亿欧企业榜单探索（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-04 17:37:43 1391

原创数据分析-60-历届奥运会奖牌榜变迁（1896到2022年）的探索（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2025-01-01 10:30:00 3784

原创数据分析-61-基于可视化与卡方检验探索emoji表情使用情况（包含代码和数据）

使用最多的表情符号是🤣，最少的是😉，不同情境下常用的表情符号如下：愤怒 (angry) 情境下常用的表情符号有：😭、🤔 和 😜。喜欢 (love) 情境下常用的表情符号有：👍、🙏 和 🎉。困惑 (confusion) 情境下常用的表情符号有：👏、😏 和 😅。庆祝 (celebration) 情境下常用的表情符号有：😘、😇 和 🤪。搞笑 (funny) 情境下常用的表情符号有：🙏、🥰 和 💔。支持 (support) 情境下常用的表情符号有：💕、🎉 和 😅。

2025-01-01 10:30:00 1881

原创数据分析-59-AHP+TOPSIS | 新能源汽车推荐模型

主要选择【价格，排量，NEDC纯电续航里程】等特征来进行建模#主要选择【价格，排量，NEDC纯电续航里程】等特征来进行建模features=['价格', '排量', 'NEDC纯电续航里程']

2024-12-31 16:00:00 1074

原创数据分析-58-《创造营2020》豆瓣短评数据分析（包含数据和代码）

在当今的综艺市场中，《创造营 2020》无疑是一部具有相当影响力的选秀节目。而豆瓣作为一个汇聚了众多观众评价的平台，其上关于《创造营 2020》的短评数据犹如一座蕴藏丰富信息的宝藏。对这些短评数据进行深入分析，能够让我们从多个维度窥探观众对这档节目的真实看法。

2024-12-31 15:30:00 624

原创数据分析-57-爬取KFC早餐，搭配出你的营养早餐（包含代码和数据）

在当今快节奏的生活中，早餐的选择变得至关重要。而肯德基（KFC）作为全球知名的快餐连锁品牌，其早餐系列丰富多样。想象一下，通过巧妙地爬取 KFC 早餐的相关信息，我们能够轻松地为自己搭配出一份营养均衡的早餐。通过爬取到的丰富数据，通过多个因素可以分析出早餐主食的最多选择。

2024-12-30 16:00:00 771

原创数据分析-56-旧金山员工薪水探索性分析（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2024-12-30 11:01:05 939

原创数据分析-55-电商用户行为可视化分析（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2024-12-27 11:31:13 1447

原创数据分析-54-逻辑回归预测用户是否会点击广告（包含代码和数据）

广告推荐主要基于用户对广告的历史曝光、点击等行为进行建模，如果只是使用广告域数据，用户行为数据稀疏，行为类型相对单一。而引入同一媒体的跨域数据，可以获得同一广告用户在其他域的行为数据，深度挖掘用户兴趣，丰富用户行为特征。引入其他媒体的广告用户行为数据，也能丰富用户和广告特征。

2024-12-27 11:28:40 508

原创数据分析-53-「猛男的童年回忆」三大类型玩具在京东平台的销售分析

万代奥特曼与万代高达及乐高三种不同类型的玩具中，乐高的最大值远高于其它两类的评价人数。三大类型玩具的数据对比分析，消费者更爱哪一类？来自京东平台上的数据，该数据共三份，分类是。

2024-12-26 10:59:22 954

原创数据分析-51-小Red书达人画像（包含代码和数据）

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2024-12-26 10:56:28 1054

原创数据分析-50-客户价值分析-用Python实现RFM模型

由于数据的原因，该图的视觉效果不佳，通过前面的直方分布图也可发现该份数据严重右偏态分布不适合直接利用方法二进行分类，需要先对数据进行处理和数据规范后再用方法二进行分类。这里有一个关于欧洲某商家2010年12月-2011年12月的销售数据截取的部分片段。目标是根据RF模型对顾客进行划分。最大日期是： 2011-12-09 12:50:00。最小日期是： 2010-12-01 08:26:00。

2024-12-25 19:02:34 1232

原创数据分析-52-关于ADX游戏广告投放数据的探索

print('投放时间从 {} 至 {} 期间'.format(data['投放时间'].min(),data['投放时间'].max()))print('共有 {} 家游戏公司'.format(data['游戏公司'].nunique()))print('共有 {} 款游戏'.format(data['游戏名称'].nunique()))print('共有 {} 类游戏'.format(data['游戏类型'].nunique()))

2024-12-25 17:06:57 868

原创数据分析-49-客户细分_K-Means聚类分析

在市场营销中，了解客户的需求和偏好对于企业至关重要。通过聚类分析，可以将客户群体划分为不同的细分市场，从而更好地理解每个市场的特点和需求。其中，K-means算法是一种常用的聚类算法，它可以快速有效地将数据划分为K个聚类。在本案例中，我们将使用Python进行K-means聚类分析，并通过实际数据来演示市场细分的过程。

2024-12-23 14:21:44 836

原创数据分析-48-某平台广告投入分析与销售预测

预测测试集前5个结果为：[23578.57086849 36801.30495453 44865.95512791 27227.60356541 45623.96791729]某销售公司为了查找某产品的销售额与电视广告投入、收音机广告投入、报纸广告投入之间的关系，提供了过往历史数据请求进行分析。测试集R^2值为： 0.8136667665662118。数据相对符合正太分布。

2024-12-23 14:19:10 657

原创数据分析-58-谷歌应用市场的APP分析

算法学习4对1辅导论文辅导可以通过公众号滴滴我。

2024-12-22 17:59:58 597

原创数据分析-46-JD某商品比价分析

自营类店铺以不到 10%的商品数量赢得了超过 80% 的成交量超过 90%的非自营类店铺需要竞争被剩下的不到 20%的资源,更可怕的是超 30 % 的专营店类店铺只能瓜分剩下不到 3% 的成交量算法学习4对1辅导论文辅导核心期刊项目的代码和数据下载可以通过公众号滴滴我。

2024-12-21 16:21:53 521

原创数据分析-47-2010人口普查数据分析完整版

本项目涉及到通过python进行2010年人口普查的数据，这对于研究社会趋势、人口分布以及进行相关分析非常有用。接下来，我们将详细讨论相关知识点。

2024-11-19 11:29:34 1285

数据分析-63-基于逻辑回归模型的医疗数据分析（拟合度差）

文中使用了逻辑回归模型对病人如约就诊与相关变量进行分析，结果发现该数据对逻辑回归模型的拟合程度很差，需要在后续使用其他模型进行进一步的拟合。因此，**该文章未能成功探索到相关变量和如约就诊之间的关系，不能提供准确的参考，可以作为小白的逻辑回归模型流程参照使用**。且待后续更新（课程和考试繁忙，学习进度较为缓慢，尚在学习中，但一定会进行补充）

2025-01-04

数据分析-62-亿欧企业榜单探索

亿欧是一家专注科技、产业和投资的信息平台和智库，会发布众多行业的企业榜单。

2025-01-04

数据分析-61-基于可视化与卡方检验探索emoji表情使用情况

Emoji，作为数字交流中的色彩斑斓的小图标，已经成为了现代沟通中不可或缺的一部分，从简单的笑脸到复杂的场景描绘，表情符号为线上对话增添了情感和语境，使得信息传达更加生动且富有表现力，随着社交媒体和即时通讯应用的普及，表情符号的使用范围日益广泛，甚至超越了语言和文化的界限，成为全球用户之间跨文化交流的通用语言。本项目旨在通过对不同社交平台上 emoji 表情符号使用状况的深入分析，揭示表情符号在不同情境、平台、性别和年龄群体中的使用模式。为此，通过可视化和卡方检验的方法，探讨表情符号的使用规律以及其与用户特征之间的关系。

2024-12-30

数据分析-60-历届奥运会奖牌榜变迁（1896到2022年）的探索（包含代码和数据）

历届奥运会奖牌数据（1896年-2024年）奥运会，全称奥林匹克运动会（Olympic Games），是国际奥林匹克委员会主办的世界规模最大的综合性体育赛事，每四年一届，会期不超过16天。这项历史悠久的赛事起源于古希腊，现代奥运会则始于1896年的希腊雅典。奥运会分为夏季奥运会和冬季奥运会，旨在通过体育竞技促进世界各国之间的友谊与文化交流，体现“更快、更高、更强、更团结”的奥林匹克精神。奥运会不仅是全球顶尖运动员展示才华的舞台，也是展现举办城市文化和促进国际交流的重要平台。奥运会奖牌是授予在奥运会比赛中获得前三名的运动员的荣誉标志，象征着运动员在体育竞技中的卓越成就。不仅是对运动员个人努力的认可，也是国家和地区在国际体坛地位的象征。本次分享的数据为1896年-2024年间奥运会奖牌数据，包括届次、国家地区、名次、金牌、银牌、铜牌等数据

2024-12-30

数据分析-59-AHP+TOPSIS - 新能源汽车推荐模型

该项目旨在构建一个基于Pandas和TOPSIS（Technique for Order Preference by Similarity to an Ideal Solution）多准则决策分析方法的新能源汽车推荐模型。通过收集和整理新能源汽车的各项指标数据，如续航里程、充电时间、价格、车内空间、安全性等，利用Pandas对数据进行清洗、标准化处理，并应用TOPSIS方法对各个指标进行综合评分，从而为消费者提供客观、科学的车型推荐。该模型能够帮助用户在多种选车条件下，快速找到最符合其需求的新能源汽车，为消费者的购车决策提供有效支持。

2024-12-30

数据分析-58-《创造营2020》豆瓣短评数据分析

2024-12-30

数据分析-57-爬取KFC早餐，搭配出你的营养早餐（包含代码和数据）

2024-12-30

数据分析-56-旧金山员工薪水探索性分析（包含代码和数据）

旧金山，这座充满科技与创新活力的城市，如同璀璨的明珠镶嵌在加利福尼亚州的海岸线上。在其繁华的表象之下，隐藏着一个值得深入探究的领域 —— 员工薪水。对旧金山员工薪水进行探索性分析，犹如开启一场神秘的宝藏探寻之旅。

2024-12-30

数据分析-55-电商用户行为可视化分析

在真实的业务场景下，我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中，我们不仅需要利用用户在这个商品子集上的行为数据，往往还需要利用更丰富的用户行为数据。

2024-12-27

数据分析-54-逻辑回归预测用户是否会点击广告（包含代码和数据）

2024-12-27

数据分析-53-「猛男的童年回忆」三大类型玩具在京东平台的销售分析

来自京东平台上的数据，**万代奥特曼**与**万代高达**以及**乐高**三大类型玩具的数据对比分析，消费者更爱哪一类？

2024-12-26

数据分析-51-小红书达人画像

小红书的用户画像是小红书品牌营销的必备技能，也是小红书推广种草的一个重要前提。通过对小红书用户画像进行分析，对品牌进行精准营销，实现更高的流量转化。

2024-12-26

数据分析-50-客户价值分析-用Python实现RFM模型

这里有一个关于欧洲某商家2010年12月-2011年12月的销售数据截取的部分片段。目标是根据RF模型对顾客进行划分。

2024-12-25

数据分析-46-JD某商品比价分析

1. 确定分析方向，公子比较想知道同样的商品是不是自营店铺普片比较贵（以消费者搜索的角度） 2. 从京东平台上输入搜索关键字，定向爬取该关键字商品的信息（共100页） 3. 数据分析验证第1小点

2024-12-25

数据分析-32-被淘汰的6271家公司的特点分析

本项目主要分析近年来6271家倒闭公司所拥有的特征，总计 6,272 条记录，大小为 2.3 M，包含 21 个字段。如果你想创业或找工作不妨看看或许还能避坑

2024-12-25

数据分析-58-谷歌应用市场的APP分析

通过分析，了解谷歌应用商店app的总体情况。

2024-12-25

数据分析-31-疫情数据分析（包含代码和数据）

这是一份来自开源的全球新冠肺炎数据集，每日时间序列汇总，包括确诊、死亡和治愈。所有数据来自每日病例报告。数据持续更新中。由于数据集中没有美国的治愈数据，所以在统计全球的现有确诊人员和治愈率的时候会有很大误差，代码里面先不做这个处理，期待数据集的完善。

2024-12-25

数据分析-52-关于ADX游戏广告投放数据的探索

ADX英文全称“Ad Exchange”，是一个汇聚各种媒体流量的大规模交易平台。本期我们将进行游戏公司广告投放平台分析，看看游戏公司都喜欢投放在哪些媒体平台，希望对你有所帮助。

2024-12-25

数据分析-30-7万条天猫订单数据分析

【7万条天猫订单数据分析】案例是一个包含代码和数据集的数据分析项目，主要涉及数据清洗、数据分析和可视化的过程。该案例采用离线处理方式，使用的技术栈包括pandas库进行数据清洗和分析，以及pyecharts库进行数据可视化，整个项目在jupyter notebook环境下完成。 - 内容概要：通过对7万条天猫订单数据进行分析，探索订单数据的特征、趋势和规律，从而为商家提供决策支持和业务优化建议。 - 适用人群：适合对数据分析感兴趣的数据分析师、数据科学家、商业分析师等人群，也适合希望了解如何利用Python进行数据清洗、分析和可视化的初学者。 - 使用场景及目标：该案例适用于电商领域的数据分析，可用于分析用户购买行为、产品销售情况、营销策略效果等方面。通过分析订单数据，可以发现用户购买偏好、热门商品、销售季节性等信息，帮助商家优化产品推广、库存管理和营销策略，提高销售效益。 - 其他说明：该案例中的数据集规模较大，需要一定的数据处理和分析能力。通过学习该案例，可以掌握使用Python进行数据清洗、分析和可视化的基本方法，提升数据分析能力和实践经验。

2024-12-25

数据分析-29-260万用户大型家电和电子产品购买分析（包含数据代码）

1. 平台在家电和电子产品方面的营运情况如何？ 2. 哪些品牌和类别销量最高? 3. 用户消费规律 4. 哪些是我们的重点用户？ 5. 平台有哪些优势和不足，需要如何改进？

2024-12-25

数据分析-83-从一线城市到各地的火车班次热力可视化（包含数据及代码）

## 一、项目背景数据集《2021春运火车票余量数据》中，包含了从2021年2月6日至11日，一线城市出发前往二三四线城市的火车票余量数据。本问题关注点在火车班次，问题就可以转变为 **2021年2月6日至11日，对一线城市出发前往二三四线城市的火车班次进行热力图可视化**。但是，这个数据集中呈现的是出发站和到达站的信息，而不是城市的信息。由于一个城市可能有多个火车站，如广州市就有广州南、广州东、广州北、广州站等多个站点，故需要先将站点信息转化为城市信息才能进行进一步的分析和可视化。数据集《中国火车站站点地理数据》含全国3K个火车站站点数据，包含**站点名称、站点地址、铁路局、省、市、经纬度** 通过这个数据集，就可以把**站点数据转变为城市数据**了。 ## 二、数据说明本数据集一共28个文件，为：从2021年2月6日-11日，一线城市出发前往二三四现城市的火车票余量数据。

2025-01-23

数据分析-82-共享单车数据可视化（包含代码和数据）

## 一、项目背景共交通工具的“最后一公里”是城市居民出行采用公共交通出行的主要障碍，也是建设绿色城市、低碳城市过程中面临的主要挑战。共享单车（自行车）企业通过在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供服务，完成交通行业最后一块“拼图”，带动居民使用其他公共交通工具的热情，也与其他公共交通方式产生协同效应。共享单车是一种分时租赁模式，也是一种新型绿色环保共享经济。自2014年ofo首次提出共享单车概念，至今已陆续产生了25个共享单车品牌，与传统的有桩借还自行车相比，无桩的共享单车自由度更高，广受用户好评。本次分析拟取2016年8月某共享单车在北京地区的车辆订单数据，从时间、空间、频次三个维度进行分析，对该品牌共享单车的发展方向提出改善性意见。 ## 二、数据说明该数据共超过`10w`行数据，共`14个`字段。

2025-01-23

数据分析-81-1919年到2020年飞机历史空难数据（包含数据及代码）

## 一、项目背景空难（air crash），指飞机等在飞行中发生故障、遭遇自然灾害或其他意外事故所造成的灾难。指由于不可抗拒的原因或人为因素造成的飞机失事，并由此带来灾难性的人员伤亡和财产损失。通常与“空难”意义相同的词汇还有“飞机坠落事件”或“坠机事件”。汉语中对各种飞行器包括各种载人航空飞行器在起飞、飞行或降落过程中，由于人为因素或不可抗拒的原因导致的灾难性损失，对此类事件统称为空难，如对美国哥伦比亚号航天飞机的失事有时称为“哥伦比亚空难”。 ## 二、数据说明该数据集共超过`2w条`数据，共`8个`字段。

2025-01-22

数据分析-80-针对家庭用电数据进行时序分析（包含代码和数据）

## 一、项目背景本项目所用数据集包含了一个家庭6个月的用电数据，收集于2007年1月至2007年6月。这些数据包括有功功率、无功功率、电压、电流强度、分项计量1（厨房）、分项计量2（洗衣房）和分项计量3（电热水器和空调）等信息。 ## 二、数据说明该数据集共收集了一个月内的`260640条`数据，共`9个`字段。

2025-01-22

数据分析-79-北上广深天气预报（包含数据及代码）

北山广深近10年来的天气预报

2025-01-16

数据分析-78-电信用户流失预测探索性分析（决策树、逻辑回归）（包含数据及代码）

- Kaggle平台数据集，项目目标对流失用户进行预测并找出影响用户流失的重要因子。 - 本项目仅对数据集进行探索性分析，意图找出影响用户流失的重要因子，并给出有业务价值的建议。

2025-01-16

数据分析-77-CDNow网站用户消费行为分析（包含代码和数据）

CDNow曾经是一家在线音乐零售平台，后被德国波泰尔斯曼娱乐集团公司出资收购，其资产总价值在最辉煌时曾超过10亿美元。本文主要通过分析CDNow网站的用户购买明细来分析该网站的用户消费行为，使运营部门在营销时更加具有针对性，从而节省成本，提升效率。

2025-01-15

数据分析-76-TED演讲数据集探索之可视化分析（包含代码和数据）

## 一、项目背景 TED由Richard Saulman创立于1984年，是一家旨在将技术(technology)，娱乐(entertainment)和设计(design)领域的专家聚集在一起的非盈利组织。Ted的口号是"Ideas worth spreading"，也就是“值得传播的思想”。每年2-3月，TED大会在北美召集众多领域的杰出人物，为他们提供了一个平台，将多年的工作和研究提炼为简短有力的演讲（通常少于18分钟），并上传到TED官网供观众免费收看。同时，独立运行的TEDx鼓励各地的TED粉丝自发组织TED风格的活动，在世界各地的社区分享想法。 ## 二、数据说明本研究首先针对`ted_main.csv`数据集，该数据集包含了2017年9月21日之前上传到官方网站TED.com的所有TED Talks演讲录制信息。另一个数据集`transcripts.csv`包含了具体的演讲文本信息。

2025-01-15

数据分析-75-关于小红书服饰行业数据的探索（包含代码和数据）

## 一、项目背景通过对小红书服饰行业的数据相关信息进行分析。从而得到关于 - 分析行业笔记数据趋势 - 分析服饰行业内容关键字 - 分析服饰行业品类数据 - 分析服饰行业品类数据 - 分析服饰行业年龄分布数据 - 分析服饰行业分析地域分布数据 - 分析服饰行业评论热词 ## 二、数据说明主要为包含【小红书】服饰行业数据 20220421~20220520数据。

2025-01-14

数据分析-74-医院药品销量可视化（包含代码和数据）

## 一、项目背景本期我们通过分析某医院半年内的药品销售数据，看看医院那些药物购买者较多，那些天购药者较多等等，希望对小伙伴们有所帮助，如有疑问或者需要改进的地方可以在评论区留言。 ## 二、数据说明该数据共`6578条`数据，共`7个`字段。分别是：`购药时间`、`社保卡号`、`商品编码`、`商品名称`、`销售数量`、`应收金额`、`实收金额`。

2025-01-14

数据分析-73-快餐店热销分析与未来销售预测（包含数据和代码）

2025-01-13

数据分析-72-关于京东消费行为分析：用户标签及剪辑的探索（包含数据和代码）

京东消费行为分析数据报告是基于京东平台所积累的大量消费数据，对消费者在京东平台上的消费行为进行系统研究、统计和分析后形成的报告。

2025-01-13

数据分析-71-关于B站每周必看系列榜单数据可视化

**数据介绍** - 数据名称：【B站每周必看】截至最新290期数据 - 数据年份：2019-2024 **数据来源：B站** **数据用途** - 分析B站必看推荐数据变化，各个类型，up主上榜次数等 **数据指标** - 期数描述,标题,视频类型,视频标签,视频链接,视频时长,up主,up主_id,aid,投币数,弹幕数,收藏数,点赞数,评论数,分享数,播放数,发布时间

2025-01-09

数据分析-70-关于近年我国结离婚数据的可视化分析（包含代码和数据）

近年来，我国结婚、离婚呈现以下几个特点： 1. 结婚数据方面 - 结婚登记数持续下降后有短暂回升但又出现下降趋势 - 结婚年龄不断推迟 - 适婚人口总数减少 - 地区差异明显 2. 离婚数据方面 - 离婚登记数在达到顶峰后下降 - 离婚率有所回落 - 离婚冷静期制度影响明显总体而言，我国结婚登记数呈下降趋势，离婚登记数在经历了一段时间的增长后也开始下降，这些变化受到适婚人口总数下降、婚姻观念变化、结婚成本上升、离婚冷静期制度等多种因素的综合影响。

2025-01-09

数据分析-68-2024年春节档电影票房数据分析（包含代码和数据）

这份电影相关的数据集主要包括了影片地域分布、电影票房以及每日电影票房等多个方面的指标，涵盖了大量与电影票房相关的数据信息。具体包括了每日电影票房数据的变化、影片地域分布情况、热门电影票房数据等40+个指标。这份数据集可以用于多方面的分析和应用： 1. **电影市场趋势分析**：可以通过分析每日电影票房数据的变化，来了解电影市场的整体趋势，包括票房变化、观众人次变化等，以及各种票房环比、场次环比、人次环比等指标，从而洞察电影市场的发展趋势。 2. **影片地域分布分析**：可以通过影片地域分布数据，了解不同城市区域对于各个电影的票房表现，以及黄金场、上午场、下午场等不同场次的票房表现，从而针对不同地域推出更有针对性的营销策略。 3. **热门电影票房分析**：可以通过热门电影票房数据，了解当前热门电影的票房表现，并进行票房占比、排名等方面的分析，有利于影院管理者进行放映计划的调整和票价制定。通过对这些数据进行深入分析，可以帮助影视行业从业者了解市场需求、观众偏好，优化排片方案、票价制定等经营策略

2025-01-08

数据分析-69-关于脱发数据集的探索（包含代码和数据）

2025-01-08

数据分析-67-上海餐饮业顾客满意度分析（包含代码和数据）

通过分析口味、环境、服务评分以及人均消费等数据，来深入了解上海餐饮业的顾客满意度情况。

2025-01-07

数据分析-66-中国黄金股票数据分析及其预测

近年来，随着全球经济的不确定性增加，黄金作为一种避险资产，其价格波动备受关注。中国作为全球最大的黄金消费国之一，黄金股票在中国股市中也占据重要地位。因此，对中国黄金股票价格进行数据探索和预测，对于投资者来说具有重要的参考价值。

2025-01-07

数据分析-65-全面解析伦敦共享单车使用规律（包含代码和数据）

随着共享单车在全球范围内的普及，城市交通出行模式发生了巨大变化。伦敦作为国际化大都市，交通拥堵问题日益严重，共享单车作为一种绿色、环保、便捷的出行方式，逐渐成为解决交通问题的重要组成部分，然而，要实现共享单车系统的高效运营，必须深入了解用户的使用习惯和需求。本项目对伦敦共享单车数据进行了全面分析，涵盖了数据清洗、特征工程（构建新特征）、骑行高峰期分析、站点流量分析，以及通过聚类分析将800个站点划分为5类，并对每一类站点提出建议，最后通过方差分析探讨了影响共享单车流量的因素，通过这些步骤，可以识别高频使用的时间段和站点，为运营商提供优化调度和资源分配的科学依据。

2025-01-06

数据分析-64-中国各省以及世界各国预期寿命分析（包含代码和数据）

人类预期寿命是指在特定年龄出生的人群，按照当前的死亡率水平，预期平均能够存活的年数。预期寿命衡量一个国家和地区卫生健康状况、社会经济发展水平和生活条件的重要参数本次分享的数据为世界各国（1960-2022年）、中国省域（历次人口普查）的历史平均预期寿命数据，数据来源为世界银行、第四-七次全国人口普查数据

2025-01-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人