自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 关于大数据分析与应用

值得注意的是,在实际的大数据分析场景中,这些方法并非孤立存在。我们可能会先通过聚类分析对用户分群,再针对不同群体用分类或回归模型进行精准预测,同时结合关联分析挖掘群体内的消费关联规则。大数据分析的魅力,就在于通过灵活运用这些方法,让冰冷的数据转化为可落地的决策建议。随着技术的不断发展,大数据分析的边界还在持续拓展,但关联、分类、回归、聚类这些基础方法,始终是我们探索数据价值的基石。

2026-01-05 08:45:17 448

原创 Hadoop 核心技术学习心得:从理论到实操的分布式技术探索

之后在做日志分析的小项目时,我先梳理清楚需求:从海量日志中统计不同 IP 的访问次数,再拆解成 Map 阶段的数据切分与键值对输出、Reduce 阶段的聚合计算,一步步调试代码,最终成功得到统计结果。解决这些问题的过程,不仅让我熟悉了 Hadoop 的配置文件和集群部署流程,更培养了我独立解决技术问题的能力。课程初期,我对 Hadoop 的核心组件仅停留在概念层面,HDFS 的分布式存储原理、MapReduce 的并行计算模型、YARN 的资源调度机制,这些抽象的理论知识让我一度陷入困惑。

2025-12-23 16:05:43 402

原创 关于数据可视化

对零售企业而言,数据从来不是 “闲置资源”—— 门店的实时销量、仓库的库存余量、会员的消费轨迹、促销的转化效果,每一组数据都藏着生意增长的关键。但现实往往是:销售看 “Excel 表” 找热销品要 1 小时,供应链凭 “经验” 备货要么积压要么断货,营销不知道 “哪类客群该推哪类货”。2025 年,AI 驱动的数据可视化已成为零售企业的 “生意导航仪”,不再是总部分析师的 “专属工具”,而是门店店长、采购专员、运营人员都能上手的 “实战利器”。

2025-10-25 14:34:14 1011

原创 关于数据可视化

当企业数据以 “每日 PB 级” 速度增长,客户行为数据散落在 APP 日志里,销售业绩藏在多套 Excel 表中,供应链数据困在独立系统内 ——“数据多、洞察难、决策慢” 成为普遍痛点。数据可视化早已不是 “画图表” 的简单技术,而是打通 “数据 - 洞察 - 行动” 的核心枢纽。据 Gartner 2025 年最新报告,91% 的高绩效企业将数据可视化列为 “决策优先工具”,其决策响应速度较行业平均水平快 7 倍;

2025-10-16 17:14:23 525

原创 使用python数据分析不同行政级别城市的幸福指数分布差异

在城市化进程持续加速的当下,城市居民的幸福指数已然成为衡量城市综合发展水平的关键标尺。幸福,这一抽象而又深刻的概念,承载着人们对生活的美好期许。不同行政级别的城市,宛如形态各异的生态系统,在资源分配、经济活力、生活环境等方面存在显著差异。这些差异是否会在居民的幸福指数上留下独特的印记?带着这样的疑惑,我们深入剖析相关数据,探寻其中的奥秘。

2025-07-03 18:29:51 977

原创 用Python数据分析中国城市幸福指数可视化

的相关系数为 0.4262333329520165,根据默认保留两位小数的规则,结果约为 0.43,这表明两者之间存在一定的正相关性。的相关系数为 -0.6853939196329851,根据默认保留两位小数的规则,结果约为 -0.69,这表明两者之间存在较强的负相关性,即随着。的相关系数为 0.34065501148455807,根据默认保留两位小数的规则,结果约为 0.34,表明两者之间存在一定的正相关性,意味着。基于执行结果可知,数据集有 221 行 15 列数据,推测参与分析的字段为。

2025-06-30 09:39:49 862

原创 脱发因素分析及预测

隐藏过程python基于执行结果可知,数据集共有 999 行 13 列数据。推测参与分析的字段及其含义如下:接下来,我会对进行分箱,然后按和进行分组统计,以探究二者之间的关系。隐藏过程python代码运行报错,结果显示字段不存在。下面我将查看所有列名,从而找到正确的字段名。隐藏过程python根据执行结果可知,列名的末尾存在一个空格,正确的列名应该是。接下来,我将使用正确的列名对进行分箱,然后按和进行分组统计,以探究二者之间的关系。隐藏过程python基于执行

2025-06-26 15:58:43 721

原创 关于MySQL和使用MySQL设计一个医院管理系统

MySQL是一款开源的关系型数据库管理系统(RDBMS),由瑞典公司 MySQL AB 开发,目前属于 Oracle 旗下产品。它以高性能、可靠性、易扩展性和开源免费等特点,成为全球最流行的数据库之一,广泛应用于 Web 开发、企业级应用、数据分析等领域。MySQL 凭借开源、高效、灵活的特性,成为中小型项目和互联网应用的首选数据库。尽管在超大规模场景下存在局限性,但其生态的成熟度和持续的技术迭代(如 MySQL 8.0 引入的窗口函数、CTE 等新特性)使其依然保持强大的竞争力。

2025-05-23 12:17:32 788

原创 大数据技术学习python的心得体会

python是一种高级编程语言,它具有简单易学,代码简洁,易维护等特点,因此被广泛应用于科学计算,数据分析,人工智能等领域python的语法简洁,代码易于阅读和编写,因此它被广大开发者所喜爱。‌人工智能与机器学习‌:Python是人工智能和机器学习的首选语言,常用的库包括Numpy、pandas、scikit-learn、TensorFlow、PyTorch等,用于机器学习和深度学习模型的开发。‌Python编程具有广泛的应用领域,包括数据分析、自动化、Web开发、游戏开发、人工智能等多个方面。

2024-12-20 09:34:01 394

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除