- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Hive知识梳理
Hive是建立在 Hadoop 上的数据仓库基础构架。可以将SQL查询转换为MapReduce的job在Hadoop集群上执行。
2022-11-18 14:46:37 4263
原创 大数据知识梳理
什么是大数据?多大量算大?说白了:当数据规模大到在获取、存储、管理、分析方面大大超出了单节点服务器能力范围。大数据具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据的初心是:用多台廉价的服务器并行处理,来替代昂贵的单台高性能服务器,以达到节约成本的目的。很多外行眼里:大数据,自带AI处理能力,能分析,能预测。实则不然,大数据,只是拥有了处理海量数据的能力,那数据从哪来?怎么治理规整?怎么用?基于大规模数据,咱是要落地数仓?还是用它来训练ai模型?这些都在于使用者。
2022-11-18 09:03:28 362
原创 单节点安装部署Cube Studio
简介cube是tme开源的一站式云原生机器学习平台,目前主要包含特征平台,支持在/离线特征;数据源管理,支持结构数据和媒体标注数据管理; 在线的vscode/jupyter代码开发;在线镜像调试,支持免dockerfile,增量构建; 任务流编排,在线拖拉拽;开放的模板市场,支持tf/pytorch/mxnet/spark/ray/horovod/kaldi/volcano等分布式计算/训练任务;task的单节点debug,分布式任务的批量优先级调度,聚合日志;任务运行资源监控,报警;定时调度,
2022-05-19 14:20:50 5311
mysql命令到底多长符合要求
2018-05-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人