GitHub 标星 6(1)

这份清单总共有两部分,前半部分介绍的是码农常用的开发工具,包括核心技术、基础设施、服务、开发运维等;后半部分则面向非技术人员。

核心技术工具

大数据处理工具

Google 内部工具:MapReduce;

替代品:Apache Hadoop、Spark

想要在上千台机器组成的大集群上、并行处理上 TB 级别的海量数据集,就要用到这类大规模数据处理工具了。

MapReduce,就是这类工具的先驱。Jeff Dean 等人 2004 年提出了这个分布式计算架构,最早在 Google 内部用来处理大规模数据的并行计算。Jeff Dean 还亲自为它撰写过使用指南。

而 Apache Hadoop 这个开源替代品,也是根据 Jeff Dean 当年的论文自行实现而成,能提供与 MapReduce 文件系统类似的功能。

如果想要更快的数据处理速度,还有 Apache Spark 供你选择。相对于 Hadoop 的 MapReduce 会在运行完工作后将中介数据存放到磁盘中,Spark 使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。

序列化工具

Google 内部:Protocol Buffer;

外部替代品:Protobuf、Thrift、Avro

这一组工具用于结构化数据序列化,上面这些,都是 xml 替代品,比它更小、更快、也更简单。

Protocol Buffer 和 Protobuf 都是 Google 开发的序列化格式(Serialization Format),github 上可以找到这个项目的源代码。

比起 XML 和 JSON,Protobuf 更小、更快,也更简洁,很适合做数据存储或 RPC 数据交换格式。只需要定义一次数据结构,就可以利用各种不同语言或者从各种不同数据流中对结构化数据进行轻松读写。

完全撇开 Google,也不是就没有别的选择了。其他厂商也有类似的序列化方案。

比如 Facebook 开发的 Thrift ,它与 Protobuf 基本一样。

Avro 同样也有 schema(也就是程序中结构化数据的定义),但是实现方式跟 Protobuf 和 Thrift 有很大区别。

由于数据不需要额外的标注,Avro 在序列化大量相同的数据时会比 Protobuf 和 Thrift 更有效率。不过在编码大量变化的数据时,因为 schema 会随数据一同存储,Avro 的效率会退化到 JSON 和 MessagePack 的级别。

看来在核心技术工具上,重回人间的前 Google 人还是有许多不错的选择的。

基础设施

大型集群管理系统

Google 内部:Borg;外部替代品:Kubernetes、Apache Mesos、HashiCorp Nomad

大型集群管理系统用于管理云平台中多个主机上的容器化的应用。

Borg 是 Google 内部的大型集群管理系统,现如今应用最广泛的服务编配系统 Kubernetes 就脱胎于 Borg。

Borg 让开发者能够不必操心资源管理的问题,做到跨多个数据中心的资源利用率最大化。

没有 Borg 十五年的经验,也就不会有 Kubernetes。虽然作者把它放在开源 / 真实世界这一栏里,但事实上 Kubernetes 也是由 Google 设计并参与开发的。

Kubernetes 使用 Go 语言编写, 是一个大而全的解决方案,服务调度、网络、存储、安全通通一手抓,而且本身的架构也非常好,在上面做二次开发非常容易。

HashiCorp Nomad 同样是一个比较常见的开源调度程序,架构简单,能将资源管理器和调度程序的功能集成到一个系统中。Nomad 也是分布式的,高可用且易操作。但显然 Kubernetes 的功能会更丰富。

至于 Mesos,它仅仅是一个调度系统,无法直接使用,要配合各种 Mesos framework 来实现各类功能。

存储

当然,Google 内部工具也不是所有的都能找到完美的替代品。

至少在存储这件事情上,就有网友不赞同原作者观点。他认为这份清单在一定程度上具有误导性,某些替代品根本达不到 Google 内部工具的水平。

比如将 Colossus 和 HDFS 对比是在开玩笑,相比之下,HDFS 就像是一个玩具。要说对比,它智能和十年前已经退役的 GFS 相当。

但 HDFS 恐怕是开源软件中 Colossus 最好的替代品,对于 “通用,大型,分布式文件系统” 的使用情况,很难找到有比 HDFS 更好的了。

其他开发工具

列表中还有服务、开发运维、安全等工具的替代品清单,由于篇幅限制,我们不再一一介绍,有需求的同学可以自取。全部工具的下载链接请参阅文末的 GitHub 地址。

除此之外,你还用过哪些比较实用的开发者工具呢?

最后

如果你看到了这里,觉得文章写得不错就给个赞呗?如果你觉得那里值得改进的,请给我留言。一定会认真查询,修正不足。谢谢。

最后针对Android程序员,我这边给大家整理了一些资料,包括不限于高级UI、性能优化、移动架构师、NDK、混合式开发(ReactNative+Weex)微信小程序、Flutter等全方面的Android进阶实践技术;希望能帮助到大家,也节省大家在网上搜索资料的时间来学习,也可以分享动态给身边好友一起学习!
《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》点击传送门,即可获取!
习!
《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》点击传送门,即可获取!

  • 14
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: GitHub标星 115k 是指某个项目在 GitHub 上收到了 11.5 万个星标(Star)。星标是 GitHub 上用户对项目的一种点赞行为,表示对项目的认可和喜爱。 当一个项目被很多用户标星的时候,通常表示这个项目具有一定的影响力,受到了广泛的关注和认可。标星的数量可以作为评估一个项目受欢迎程度的指标之一。 标星数量的增加主要有以下几个原因: 1. 项目本身优秀:如果一个项目具有很高的代码质量、功能完善、易于使用等优点,就会吸引更多的开发者关注并标星。 2. 开发者社区推广:开发者社区对于一个项目的推广非常重要,如果一个项目在社区中得到了推荐和宣传,就会吸引更多的用户关注和标星。 3. 开发者贡献:开源项目常常接受开发者的贡献,如果一个项目有很多活跃的开发者,意味着项目会持续发展和更新,这也会吸引更多的用户关注和标星。 4. 开发者口碑和用户反馈:如果一个项目具有良好的口碑和用户反馈,证明这个项目对用户来说是有价值的,也会吸引更多的用户关注和标星GitHub标星 115k 表明这个项目受到了极高的关注和认可。这种关注既可以是因为项目本身的优秀,也可能是因为开发者社区的推广和用户口碑的效应。不过,标星数量并不是唯一的评判标准,我们还需要进一步了解项目的质量、活跃度和用户评价等方面的信息,才能全面评估一个项目的价值。 ### 回答2: GitHub 是全球最大的开源代码托管平台之一,用户可以在平台上发布开源项目,并且其他用户可以对其进行关注(Star)。标星(Star)是 GitHub 上一项重要的功能,用于表示用户对某个项目的喜爱程度或兴趣程度。 在你提到的这个情况中,一个项目在 GitHub标星达到 115k 的数量是非常惊人的。这意味着该项目受到了非常广泛的关注和认可,吸引了大量的用户关注和参与。 标星数量的增长通常表明该项目具有出色的代码质量、创新的想法、丰富的功能或对开发者社区有重要的影响。标星数量还能够作为用户评估一个项目质量和受欢迎程度的参考指标。越多的标星数量通常意味着该项目受到更多人的信任和广泛的使用。 标星 115k 的项目往往是在技术方面具有重要意义的项目,也可能是在开发工具、库或框架上具有重要创新的项目。当项目受到如此高的关注时,它不仅会吸引更多的开发者参与贡献代码,也会吸引更多的用户试用和提供反馈。 通过标星数量,我们可以得知这个项目在社区的影响力和认可度。这使得其他开发者能够了解或了解到一些有趣或有价值的项目。同时,对于该项目的维护者来说,标星数量也是对他们工作的认可和鞭策,鼓励他们继续努力改进和维护该项目。 综上所述,GitHub 上一个标星数量达到 115k 的项目无疑是一个备受关注和认可的项目,代表着该项目的质量和影响力。这个数量反映了开发者社区对该项目的认可和信赖程度,证明了该项目在技术领域的重要地位。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值