大数据00

最新推荐文章于 2024-02-07 22:09:49 发布

生产队的驴儿

最新推荐文章于 2024-02-07 22:09:49 发布

阅读量111

点赞数

分类专栏：大数据文章标签： database

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46969441/article/details/119900433

版权

大数据专栏收录该内容

4 篇文章 0 订阅

订阅专栏

大数据

基本单位：
1T = 1024G
1P = 1024T
1E = 1024P
1Z = 1024E
1Y = 1024Z
1B = 1024Y
1N = 1024B
1D = 1024N

1. 定义

无法在一定时间范围内使用常规软件工具进行捕捉，管理和处理的数据集合。
存储问题：海量数据存储----分布式存储
计算问题：海量数据计算----Hadoop Spark

廉价计算机组成集群，分散存储数据。

特点

大多值快信
大：数量体积大目前 5EB 企业都达到E级了
多：种类多，结构化，半结构化，非结构化数据（从左到右，越来越乱）
来源杂。
值：大海捞针。选出优秀价值的数据。（密度低->密度高，价值低->价值高）
快：数据增长快，处理速度快。
离线分析 + 在线分析（实时分析）
信：数据的准确性和可信赖度，数据质量可靠。

2.分析步骤

1. 明确分析目的和思路
2. 数据收集（1手/2手数据爬虫）
3. 数据处理（清洗转换提取计算）
4. 数据展现
5. 报告填写

数据分析工具：
mysql hive hbase kudu redis

大数据典型部门架构：
在这里插入图片描述
ETL 把收集过来的数据编程可以用的数据
Hive 数仓建模主用 sql语句

数据挖掘：和算法相关
强调数学能力

后续知识整理：
Linux系统
Mysql数据库
ETL框架

生产队的驴儿

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据00

大数据基本单位：1T = 1024G1P = 1024T1E = 1024P1Z = 1024E1Y = 1024Z1B = 1024Y1N = 1024B1D = 1024N1. 定义无法在一定时间范围内使用常规软件工具进行捕捉，管理和处理的数据集合。存储问题：海量数据存储----分布式存储计算问题：海量数据计算----Hadoop Spark廉价计算机组成集群，分散存储数据。特点大多值快信大：数量体积大目前 5EB 企业都达到E级了多：种类多
复制链接

扫一扫

专栏目录

生产队的驴儿 CSDN认证博客专家 CSDN认证企业博客

码龄4年

264: 原创

23万+: 周排名

10万+: 总排名

26万+: 访问

: 等级

3213: 积分

312: 粉丝

240: 获赞

90: 评论

1619: 收藏

私信

关注

热门文章

分类专栏

最新评论

深度学习神经网络入门案例详细解析-鸢尾花案例
m0_63295628: 有可能是你缩进不正确，计算loss和添加loss进列表的代码也应该在外层循环里面，之后只有绘图代码在for循环外
深度学习神经网络入门案例详细解析-鸢尾花案例
m0_64003122: 因为作者忘了一件事，就是在结束循环的时候重置loss_all，导致500次epoch产生的loss值不停地加进loss_all里面，这能不越来越大吗，只需要在"for epoch in range(epoch):"这一句后面加上"loss_all = 0", 就解决了，不是代码出问题了，而是可视化部分没写好
深度学习神经网络入门案例详细解析-鸢尾花案例
m0_64003122: 因为原作者漏写了append函数，只需要在“print("Epoch {}, loss: {}".format(epoch, loss_all/4))”这一行代码的后面追加上"train_loss_results.append(loss_all)"这一句就好了。
Golang 语言学习 01 包含如何快速学习一门新语言
白话机器学习: 写的非常详细，是一篇优质博客，干货满满，让我有了全新的认识，感谢博主分享，让我学到了很多，支持支持。
环状替换 + 189 旋转数组
照胆202: 你没写错？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。