![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 80
蚂蚁*漫步
这个作者很懒,什么都没留下…
展开
-
pyecharts 旭日图
pyecharts 旭日图原创 2022-10-02 15:50:28 · 1959 阅读 · 1 评论 -
K-means原理分析
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优化Mini Batch K-Means算法。1. K-Means原理初探 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连转载 2021-11-17 20:39:28 · 303 阅读 · 0 评论 -
深圳二手房房价分析及预测
分析目标: 通过处理后的房价数据,筛选对房价有显著影响的特征变量。 确定特征变量,建立深圳房价预测模型并对假设情景进行模拟 数据预处理 import pandas as pdimport osfile_path="D:\Python数据分析与挖掘实战\深圳二手房价分析\data"#读取file_path目录下的所有文件file_name=os.listdir(file_path)df=pd.DataFrame()lis=[]#使用两种方法读取数据for i in fil...原创 2021-11-15 22:19:19 · 4742 阅读 · 6 评论 -
淘宝用户行为分析
数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1一、项目背景本数据报告以淘宝app平台为数据集随机选取了大约 100 万用户在 2017 年 11 月 25 日至 12 月 3 日期间具有点击、购买、添加商品到购物车和商品偏好等行为。二、项目目标通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析, 付费率分析, 复购行为分析, 漏斗流失.原创 2021-11-12 20:15:15 · 1620 阅读 · 0 评论 -
教育平台的线上课程智能推荐策略
题目来自:http://www.tipdm.org一、 背景近年来,随着互联网与通信技术的高速发展,学习资源的建设与共享呈现出新的发展趋势,各种网课、慕课、直播课等层出不穷,各种在线教育平台和学习应用纷纷涌现。尤其是 2020 年春季学期,受新冠疫情影响,在教育部“停课不停学”的要求下,网络平台成为“互联网+教育”成果的重要展示阵地。因此,如何根据教育平台的线上用户信息和学习信息,通过数据分析为教育平台和用户提供精准的课程推荐服务就成为线上教育的热点问题。本赛题提供了某教育平台近两年的运.原创 2021-11-08 11:35:19 · 4597 阅读 · 2 评论 -
2020年“泰迪杯”数据分析职业技能大赛B题疫情数据分析
一、背景2020年1月新型冠状病毒(以下简称新冠)肺炎在极短时间内就在全球范围内大规模流行,据美国约翰斯·霍普金斯大学11月8日发布的新冠疫情最新统计数据显示,截至美国东部时间11月8日11时24分全球累计确诊人数超过5000万,死亡人数超过125万。由于新冠病毒的传播速度快、致死率较高,世界卫生组织称新冠是百年一遇的人类公敌。自新冠肺炎爆发以来,面对社会对疫情信息的迫切需求,各级政府部门通过多种渠道及时发布第一手相关数据,许多组织和个人也迅速行动,利用多种分析手段为公众提供疫情数据的解读分析,以消除公众原创 2021-11-03 21:03:00 · 8686 阅读 · 3 评论