![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
我的名字叫大数据
文章平均质量分 94
以第一人称的视角,讲述大数据的那些事。
大数据张老师
Java大数据专家、讲师,先后多次给中国海洋大学、曲阜师范大学、青岛理工大学等多所高校举行大数据专题讲座与实训授课。著有畅销书《Hadoop大数据技术开发实战》《Spark大数据分析实战》《Hadoop3.X大数据开发实战(视频教学版)》《Spark3.X大数据分析实战(视频教学版)》《Flink大数据分析实战》。
展开
-
我的名字叫大数据: 第7章 我的自拍展
条形图(Bar Chart)是一种通过矩形条的长度来表示数据值的图表类型。它适用于比较不同类别的数据,能够清晰地展示数据的大小和差异。条形图的结构:X轴:通常表示类别或分组。Y轴:表示数值或频率。矩形条:每个条的长度或高度对应于该类别的数值。条形图是一种简单而有力的数据可视化工具,能够清晰地展示不同类别的数据大小和差异。无论是基本的条形图还是高级的堆叠和群组条形图,都能帮助我们更好地理解和展示数据。散点图(Scatter Plot)是一种通过在坐标平面上绘制点来展示两个变量之间关系的图表。原创 2024-06-06 19:57:06 · 983 阅读 · 0 评论 -
我的名字叫大数据:第6章 跟我去健身吧!
数据清洗是数据处理的第一步,通过识别和处理数据中的错误和异常,我们可以获得干净、整洁的数据,为后续的分析和挖掘打下坚实的基础。虽然数据清洗存在一定的挑战,但通过合理的策略和工具,我们可以有效地解决这些问题。通过标准化和归一化,我们能够让数据变得更加整齐划一,提高数据的可比性和分析效果。这些数据转换技巧在各个领域都有广泛的应用,为后续的建模和分析提供了坚实的基础。无论是pandas、dplyr这样的编程工具,还是OpenRefine、Trifacta这样的交互式软件,它们都为数据清洗提供了强有力的支持。原创 2024-06-05 12:04:12 · 978 阅读 · 0 评论 -
我的名字叫大数据:第1~4章
这就是我的文件王国中的三位代表。每一种文件格式都有它独特的用途和优势,它们共同支撑着我这个丰富多彩的大数据世界。从结构化的数据表到多样的文件格式,我都希望能为你展现出大数据背后的魅力与价值。接下来,我还有更多的秘密等待你的发掘,让我们一起继续探索吧!原创 2024-05-30 15:51:49 · 1291 阅读 · 0 评论 -
我的名字叫大数据:第5章 我如何思考?
逻辑与数学是我思考的基石,是我处理和分析数据的核心工具。通过逻辑结构和数学运算,我能够实现复杂的算法,解决各种问题。从条件判断和循环结构,到代数运算、线性代数、概率与统计,逻辑与数学的结合让我具备了强大的思考和决策能力。深度学习是我变得更像人类的关键技术。通过模拟人类大脑的神经网络结构,深度学习算法能够处理和分析大量复杂的数据,实现图像识别、语言理解和趋势预测等任务。神经网络的层次结构和训练过程使得深度学习具备强大的智能和适应能力。原创 2024-06-05 09:11:02 · 1099 阅读 · 0 评论