自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 大数据分析与应用:那些新手必须掌握的核心知识点

摘要: 本文为大数据分析新手梳理了四大核心知识点:1)基础认知:理解大数据的三大特征(数据量大、类型杂、速度快)及核心目标(解决业务问题);2)工具技能:掌握Python(Pandas、NumPy、可视化库)、数据存储(MySQL/HDFS)及可视化工具(Tableau/Matplotlib);3)实操流程:从明确需求、数据清洗到分析建模与结果落地;4)行业场景:电商(用户行为分析)、金融(风控)、医疗(疾病预警)的应用逻辑。强调避免盲目追求复杂工具,需聚焦基础与业务结合,通过实战逐步进阶。

2025-12-31 10:28:19 512

原创 Hadoop核心技术入门:一篇看懂HDFS和MapReduce

本文介绍了大数据时代下Hadoop框架的核心组件HDFS和MapReduce。HDFS作为分布式文件系统,通过数据分片和副本机制实现海量数据存储;MapReduce采用"分而治之"思想,将计算任务分解为Map和Reduce两个阶段进行并行处理。二者协同工作,HDFS负责数据存储,MapReduce负责计算处理,形成大数据处理的基础架构。文章通过WordCount案例解析了MapReduce的工作原理,并建议新手从伪分布式环境入手实践,掌握核心概念后逐步深入更复杂的大数据技术。

2025-12-22 21:33:14 685

原创 大数据可视化入门:5个核心概念,让复杂图表秒懂

本文介绍了大数据可视化入门的5个核心概念:1)数据维度(定量与定性维度);2)视觉编码(6种常见方式);3)基础图表类型(5种常用图表);4)数据聚合(3种简化方法);5)交互设计(4种基础功能)。掌握这些概念能帮助初学者快速理解数据可视化逻辑,从简单的柱状图、折线图入手,逐步学会用图表清晰呈现数据信息。

2025-11-05 19:38:53 1079

原创 Python数据分析可视化实战:解决matplotlib中文显示异常问题

摘要:本文针对Python数据可视化中matplotlib中文显示问题(乱码/方块),提供三种解决方案:1)修改配置文件永久设置中文字体;2)代码中动态配置rcParams参数;3)加载自定义字体文件。通过实际案例演示,说明各方法适用场景(Windows/macOS/Linux),并给出字体推荐、缓存处理等注意事项。特别强调临时设置与全局配置的选择策略,以及多语言混排、PDF输出等扩展场景的优化建议,附有系统字体检测方法。最后指出其他可视化库(如seaborn)的类似解决方案。

2025-06-25 23:19:47 1162 1

原创 Python心得

Python 作为一门功能强大且简洁优雅的编程语言,在我深入学习的过程中,为我打开了一扇通往编程世界的新大门,让我收获了许多宝贵的知识与技能,也经历了一段充满挑战与惊喜的学习之旅。列表的切片操作让数据的提取变得轻而易举,而字典的键值对形式则为数据的存储和查找提供了极大的便利。在未来的学习和工作中,我将继续深入学习 Python 的高级特性和应用框架,不断拓展其在人工智能、数据分析、Web 开发等领域的应用,努力用 Python 这把强大的工具创造更多的价值,开启更加精彩的编程之旅。

2024-12-19 15:48:53 351

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除