大数据相关知识点收集

1.FASTCGI--动态网页技术
https://baike.baidu.com/item/fastcgi/10880685
2.uwsgi--Nginx中HttpUwsgiModule的作用是与uWSGI服务器进行交换。WSGI是一种Web服务器网关接口。
https://baike.baidu.com/item/uwsgi/673705?fr=aladdin
3.harpc--HARPC(High Availability RPC)是基于Thrift的跨语言、高可用的RPC框架。
https://blog.csdn.net/hrn1216/article/details/51383544
4.presto--Presto是一个分布式SQL查询引擎,用于查询分布在一个或多个不同数据源中的大数据集。
http://prestodb-china.com/docs/current/index.html
5.kudu--Kudu是Cloudera开源的新型列式存储系统,是Apache Hadoop生态圈的新成员之一(incubating),专门为了对快速变化的数据进行快速的分析,填补了以往Hadoop存储层的空缺
https://www.cnblogs.com/wuxian11/p/6478581.html
6.Parquet--Parquet是Hadoop上的一种支持列式存储文件格式。把嵌套结构存储成扁平格式。
https://blog.csdn.net/zero__007/article/details/79673561
7.Ambari--Ambari是Hortonworks开源的Hadoop平台的管理软件,具备Hadoop组件的安装、管理、运维等基本功能,提供Web UI进行可视化的集群管理,简化了大数据平台的安装、使用难度。
https://blog.csdn.net/u012331758/article/details/78106714
8.tez--Apache Tez是一个针对Hadoop数据处理应用程序的新分布式执行框架。Tez是Apache最新的支持DAG作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。
https://blog.csdn.net/yamaxifeng_132/article/details/78828038
9.pig--Pig是一种数据流语言(data flow programming langage)。
https://blog.csdn.net/bingduanlbd/article/details/52049683
10.Falcon--Falcon是一个面向Hadoop的、数据处理和管理平台。
https://blog.csdn.net/it_dx/article/details/57564628
11.ZeroMQ--ZeroMQ是一种基于消息队列的多线程网络库,其对套接字类型、连接处理、帧、甚至路由的底层细节进行抽象,提供跨越多种传输协议的套接字。
https://blog.csdn.net/w174504744/article/details/73187697
12.Flume--实时日志收集系统
https://www.cnblogs.com/zhangyinhua/p/7803486.html
13.velocity--velocity与freemaker、jstl并称为java web开发三大标签技术
https://blog.csdn.net/sunny243788557/article/details/52796734
14.zookeeper--ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。
https://www.cnblogs.com/felixzh/p/5869212.html
15.jdk linux安装
https://www.cnblogs.com/Dylansuns/p/6974272.html
16.Logstash一个数据分析软件,主要目的是分析log日志
https://www.cnblogs.com/yincheng/p/logstash.html
17.Kibana一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据。
https://www.cnblogs.com/zhangs1986/p/7325504.html
18.Filebeat一个日志文件托运工具,服务器上安装客户端后,会监控日志目录或者指定的日志文件,追踪读取这些文件(追踪文件的变化,不停的读),并且转发这些信息到elasticsearch或者logstarsh中存放。
https://www.cnblogs.com/kerwinC/p/6227768.html
19.mariaDB-MariaDB数据库管理系统是MySQL的一个分支,主要由开源社区在维护,采用GPL授权许可 MariaDB的目的是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。
https://www.w3cschool.cn/mariadb/
20.sqoop 是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
https://blog.csdn.net/jiangsanfeng1111/article/details/53332635
21.HDFS、MR、Kafka、Storm、Spark、Hbase、Redis原理图
https://blog.csdn.net/qq_41455420/article/details/79787093
22.kylin主要是对hive中的数据进行预计算,利用hadoop的mapreduce框架实现
https://www.cnblogs.com/honey01/p/8351145.html
23.Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。
https://www.cnblogs.com/shenh062326/p/6195064.html
24.TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库
http://www.tensorfly.cn/
25.Caffe是一个深度学习框架
http://hao.jobbole.com/caffe/?utm_source=blog.jobbole.com&utm_medium=sidebar-resources
26.PyTorch

https://www.leiphone.com/news/201708/Npflmddi8OGbnJHi.html

27.GlusterFS是Scale-Out存储解决方案Gluster的核心,它是一个开源的分布式文件系统
https://blog.csdn.net/zonelan/article/details/8468383
28.主流流计算框架
http://developer.51cto.com/art/201603/507444.htm

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值