@SmartSi-CSDN博客

原创数据湖学习笔记

基于 Lakehouse 架构实现湖内建仓实践经验 Lakehouse架构指南腾讯数据湖知识体系解析一个理想的数据湖应具备哪些功能？ HDFS廉颇老矣？基于对象存储的数据湖构建新思路你一定爱读的极简数据平台史，从数据仓库、数据湖到湖仓一体网易严选数据湖建设实践爱奇艺数据湖实战字节跳动基于数据湖技术的近实时场景实践数据湖在快手的生产实践 Apache Hudi 典型应用场景知多少？ Apache Hudi 在腾讯的落地与应用基于 Apache Hudi 构建数据

2023-08-28 08:02:12 101

转载基于 Lakehouse 架构实现湖内建仓实践经验

第一个阶段是数据库不管是从业务的角度还是从技术栈角度，大家对数据库都是最熟的。第二阶段是数据仓库当数据库的整体能力达不到我们的存储要求之后，就出现了数据仓库。数据仓库定位也是偏OLAP。它把数据的存储的能力通过分布式的方式去加大，计算能力也相应增加了上去。在有些特性和用法上是非常相似的。第三阶段是数据湖数据湖在存储规模和计算能力上进一步加大，整个集群规模可以上万台，整体的能力会有更大的提升，同时扩容更加平滑。另外它增加了很多数据库和数仓不具备的能力，比如实时计算、机器学习。

2023-08-27 12:59:43 101

原创 2023年08数据月报

2023年08月数据月报，为您准备了阿里、字节、百度等大厂80多篇实践案例。

2023-08-27 07:59:23 211

转载一文彻底弄懂Apache Hudi不同表类型

在深入研究 COW 和 MOR 之前，让我们先了解一下 Hudi 中使用的一些术语，以便更好地理解以下部分。

2023-08-25 08:17:28 254

转载基于 Apache Hudi 构建数据湖的典型应用场景介绍

传统大数据由于不支持事务等痛点问题，造成T+1时延，虽然能够基于Flink流式计算实现少量数据在简单场景的秒级数据处理能力，但依然缺乏海量复杂场景的实时更新、事务支持能力。现在基于华为云FusionInsight MRS的Hudi可以构建分钟级数据处理方案，实现较大数据量的复杂计算实时处理能力，大大提升数据时效性，让数据价值近在眼前。

2023-08-25 07:25:30 389

转载 Apache Hudi 在腾讯的落地与应用

如上图所示，以最简单的覆盖逻辑为例，当读到 BaseFile 中的主键是 key1 的 Record 时，发现 key1 在 Map 中已经存在并且对应的 Record 有 BCD 三列的值，则更新 BaseFile 中的 BCD 列，得到新的 Record(key1，b0_new，c0_new，d0_new，e0)，注意 E 列没有被更新，所以保持原来的值 e0。同时，这套方案的扩展性也更加好。在传统的Hive数仓中想保证实时是非常困难的，尤其是文件更新，湖表实时写入更新，基本不可能实现。

2023-08-23 08:32:22 257

转载 Apache Hudi 典型应用场景知多少？

此外，Hudi 没有外部依赖项（例如专用于实时分析的专用HBase群集），因此可以在不增加运营成本的情况下，对更实时的数据进行更快的分析。在这种情况下，保证正确性的唯一方法是每小时重复处理最后几个小时的数据，这会严重损害整个生态系统的效率。Hudi可以很好的解决上述问题，其通过记录粒度（而非文件夹或分区）来消费上游Hudi表 HU中的新数据，下游的Hudi表 HD应用处理逻辑并更新/协调延迟数据，这里 HU和 HD可以以更频繁的时间（例如15分钟）连续进行调度，并在 HD上提供30分钟的端到端延迟。

2023-08-23 07:36:06 136

原创 Hadoop 2.10.1 安装与启动

可以直接从官网上下载 https://archive.apache.org/dist/hadoop/common/ 你需要的版本，在这我们使用的是 2.10.1 版本 hadoop-2.10.1.tar.gz。Hadoop 早期版本采用一个配置文件hadoop-site.xml来配置Common，HDFS和MapReduce组件。从0.20.0版本开始该文件以分为三，各对应一个组件。如果在 mapred-site.xml 中设置数据处理框架为 yarn，同时也需要配置 yarn-site.xml 文件。

2023-08-22 08:18:58 282

原创 Hadoop Initialization failed for Block pool ＜registering＞

两者的 clusterID 不一致导致最终 datanode 没有启动。这个问题一般是由于两次或两次以上的格式化 NameNode 造成的。目录，查看 VERSION 文件，可以发现 datanode 的 clusterID 为。从上面异常中可以发现 namenode 的 clusterID 为。从上面可以看到我们的 dataNode 已经跑起来了。，而 datanode 的 clusterID 为。重启 Hadoop 即可。

2023-08-22 08:16:18 100

转载 Hudi 基本概念

Apache Hudi(发音为“Hudi”)在DFS的数据集上提供以下流原语在本节中，我们将讨论重要的概念和术语，这些概念和术语有助于理解并有效使用这些原语。

2023-08-20 16:59:52 90

转载 Apache Hudi：新一代流式数据湖平台

早在 2016 年，我们就提出了一个大胆的新愿景 [1]，通过一个新的“增量”数据处理技术栈（结合现有的批处理和流式处理堆栈）重新构想批处理。虽然流处理管道进行面向行的处理，提供秒级处理延迟，但增量管道将对数据湖中的列数据应用相同的原则，高效的数据处理，及相对批处理数量级的改进，同时存储 / 计算可高度扩展。这个新的技术栈将能够毫不费力地支持批量再加工 / 回填的常规处理。Apache Hudi 是作为这一愿景的体现而建立的，它植根于 Uber 面临的真实、困难的问题 [2]，后来在开源社区中独树一帜。总之

2023-08-20 08:29:16 250

转载 Lakehouse架构指南

数据湖是一种存储系统，具有底层数据湖文件格式[6]及其不同的数据湖表格式[7]，可存储大量非结构化和半结构化数据，并按原样存储，但没有特定用途。广泛的技术和非技术数据消费者可以访问该数据以进行分析用例和机器学习模型，包括商业智能和报告。数据湖还消除了通过传统 BI 工具转换数据需要使用专有格式的需要。将数据加载到数据湖中，数据团队花费时间构建和维护复杂 ETL 管道的旧瓶颈消失了，并且跳过了等待数周的数据访问请求。

2023-08-18 08:40:30 94

转载腾讯数据湖知识体系解析

数据湖是一种存储系统，底层包括不同的文件格式及湖表格式，可存储大量非结构化和半结构化的原始数据。数据消费者可以访问该数据进行数据分析，包括 BI、报表和机器学习模型训练。有了数据湖，数据变得越来越可用。

2023-08-18 07:54:18 137

转载一个理想的数据湖应具备哪些功能？

从数据库到数据仓库，最后到数据湖[1]，随着数据量和数据源的增加，数据格局正在迅速变化。数据湖市场预计增长近 30%[2]，将从 2020 年的 37.4 亿美元增长到 2026 年的 176 亿美元。此外从 2022 年数据和人工智能峰会[3]来看，数据湖架构[4]显然是数据管理和治理的未来。由于 Databricks[5] 发布了 Delta 2.0，该趋势可能会增长，该平台的所有 API 都将是开源的。此外Snowflakes[6] 在其峰会上宣布了一些改变游戏规则的功能，使数据湖成为该行业的支柱。

2023-08-17 07:46:53 123

转载字节跳动基于数据湖技术的近实时场景实践

本讲嘉宾是来自抖音电商实时数仓团队的大数据工程师马汶园，分享主题为基于数据湖技术的近实时场景实践。

2023-08-16 21:47:31 156

转载网易实时数据仓库的发展、架构和趋势

数据处理现状：当前基于Hive的离线数据仓库已经非常成熟，数据中台体系也基本上是围绕离线数仓进行建设。但是随着实时计算引擎的不断发展以及业务对于实时报表的产出需求不断膨胀，业界最近几年就一直聚焦并探索于两个相关的热点问题：实时数仓建设和大数据架构的批流一体建设。

2023-08-16 15:43:36 183

转载 HDFS廉颇老矣？基于对象存储的数据湖构建新思路

我们经常会被问到一个企业大数据架构的问题：随着企业收集 / 产生的数据越来越多，如何设计一套高效廉价的大数据架构，在尽可能多保留所有原始数据内容的同时还可以支持“无缝接入”的新的分析算法。本文所要介绍的数据湖解决方案可能是解决这个难题的一种新思路。

2023-08-15 07:27:01 319

转载你一定爱读的极简数据平台史，从数据仓库、数据湖到湖仓一体

我们身处一个大数据时代，企业的数据量爆炸式增长。如何应对海量数据存储和处理的挑战，建设好数据平台，对一个企业来说是很关键的问题。从数据仓库、数据湖，到现在的湖仓一体，业界建设数据平台的新方法和新技术层出不穷。理解这些方法和技术背后隐藏的演进脉路、关键问题、核心技术原理，可以帮助企业更好地建设数据平台。这也是百度智能云推出数据湖系列内容的初衷。本系列文章将包含几个部分：本篇将作为数据湖整个系列的开篇，为大家介绍数据平台技术的历史和发展过程中遇到的一些关键技术问题。

2023-08-11 08:19:15 325

原创 Spring 数据库操作 JdbcTemplate

大家先回顾一下我们是如何操作数据库的

2023-08-11 07:08:09 147

转载 Apache Iceberg：Netflix 数据仓库的基石

Iceberg 主要设计思想：记录表在所有时间的所有文件，和 Delta Lake 或 Apache Hudi 一样，支持 snapshot，其是表在某个时刻的完整文件列表。带来的问题是如果一张表有很多分区，我们需要使用 HMS（Hive MetaStore）来记录这些分区，同时底层的文件系统（比如 HDFS）仍然需要在每个分区里面记录这些分区数据。在 Netflix，他们希望有更智能的处理引擎，比如有 CBO 优化，更好的 Join 实现，缓存结果集以及物化视图等功能。原生支持云对象存储，支持多并发写。

2023-08-01 08:48:19 103

原创 2023年07数据月报

2023年07月数据月报，为您准备了阿里、字节、百度等大厂90多篇实践案例

2023-08-01 07:16:05 208

转载 Apache Hive 通过 JDBC Storage Handler 联邦查询

如今，很多公司可能会在内部使用多种数据存储和处理系统。这些不同的系统解决了对应的使用案例。除了传统的 RDBMS （比如 Oracle DB，Teradata或PostgreSQL）之外，我们还会使用 Apache Kafka 来获取流和事件数据。使用 Apache Druid 处理实时系列数据（real-time series data），使用 Apache Phoenix 进行快速索引查找。此外，我们还可能使用云存储服务或 HDFS 批量存储数据。

2023-07-31 09:22:41 166

转载网易严选数据湖建设实践

过去几年，数据仓库和数据湖方案在快速演进和弥补自身缺陷的同时，二者之间的边界也逐渐淡化。云原生的新一代数据架构不再遵循数据湖或数据仓库的单一经典架构，而是在一定程度上结合二者的优势重新构建。在云厂商和开源技术方案的共同推动之下，2021 年我们将会看到更多“湖仓一体”的实际落地案例。InfoQ 希望通过选题的方式对数据湖和数仓融合架构在不同企业的落地情况、实践过程、改进优化方案等内容进行呈现。本文将分享网易严选的数据湖建设过程和思考。

2023-07-31 08:07:24 610

转载为什么我选择 Apache Iceberg

Delta Lake 将其定义为：Delta Lake is an open-source storage layer that brings ACID transactions to Apache Spark and big data workloads。而 Apache Iceberg 将其定义为：Apache Iceberg is an open table format for huge analytic datasets。首先，这类技术它的定位是在计算引擎之下，又在存储之上。

2023-07-30 15:37:21 128

原创 Apache FreeMarker 常见使用指令

使用 assign 指令可以创建一个新的变量，或者替换一个已经存在的变量。需要注意的是仅仅可以被创建/替换顶级变量 (也就是说你不能创建/替换 some_hash.subvar)。这个用法用于指定一个名为 name 的变量，变量值为 value。此外，FreeMarker 允许在使用 assign 指令里增加 in 子句，用来将创建的 name 变量放入 namespacehash 命名空间中。宏是和某个变量关联的模板片断，以便在模板中通过用户定义的指令使用该变量，而该变量表示模板片段。

2023-07-30 13:45:54 250

原创 Apache FreeMaker 命名空间

当运行 FTL 模板时，就会使用 assign 和 macro 等指令来创建变量的集合(可能是空的)。像这样的变量集合被称为命名空间。通常情况，FreeMarker 只使用一个命名空间，即为主命名空间。因为通常只使用该命名空间，所以很多人都没有意识到命名空间的存在。但如果想创建可以重复使用的宏，函数和其他变量的集合，就必须使用多命名空间(通常用术语来说就是引用库)。但要确保库中没有宏（或其他变量）名和数据模型中变量同名，而且也不能和模板中引用其他库中的变量同名是不可能的。

2023-07-30 13:11:17 97

转载爱奇艺数据湖实战

数据湖概念于2010年首次提出，经过多年的演变，目前演化出两种不同的定义——公有云数据湖、非公有云数据湖。规模大，成本低：能支持PB级别数据规模支持更新：包括历史分区新增数据、行级更新等增量拉取：将表的变更转成流数据用于构建下游表时效性：近实时（5分钟）查询快：交互级查询速度表格式是 Iceberg 设计的核心概念，因而需要首先明确表格式的定义。从用户的角度，表格式用于回答“表里面有哪些数据”，表格式的关键目标是“让用户和工具能高效地处理表下的数据”。

2023-07-28 08:05:33 91

转载数据湖在快手的生产实践

本文整理自快手数据架构研发专家张静在WOT2023大会上的主题分享。今天的分享分为四个部分：首先介绍传统离线链路，它存在哪些痛点；第二部分引入数据湖的特性；第三部分是通过快手数据湖几个典型的业务场景来说明如何基于数据湖技术重塑离线链路的生产；最后一部分介绍近期工作和长远规划。希望通过本次分享能够让大家了解数据湖技术在重塑离线生产方式中的关键作用。

2023-07-26 08:27:05 158

原创 MyBatis Generator 插件使用指南

MyBatis-Generator (mybatis-generator-maven-plugin) 是 MyBatis 提供的快速生成代码的插件。可以帮我们快速生成表对应的持久化对象(POJO)、操作数据库的接口(dao) 以及映射文件 Mapper。基于 mybatis-generator-core-x.x.x.jar 和其 XML 配置文件，通过命令行运行。通过 Ant 的 Task 结合其 XML 配置文件运行。通过 Maven 插件运行。

2023-07-26 07:44:44 891

原创 Spring 依赖注入之 XML 自动装配

我们把 Spring 在 Bean 与 Bean 之间建立依赖关系的行为称为’装配’。Spring 的 IOC 容器虽然功能强大，但它本身不过只是一个空壳而已，它自己并不能独自完成装配工作。需要我们主动将 Bean 放进去，并告诉它 Bean 和 Bean 之间的依赖关系，它才能按照我们的要求完成装配工作。在前面的学习中，我们都是在 XML 配置中通过和<property>中的 ref 属性，手动维护 Bean 与 Bean 之间的依赖关系的，具体可以查阅Spring 依赖注入之构造器注入和。

2023-07-15 18:45:41 264

原创 Spring 依赖注入之setter注入

通常，JavaBean 的属性是私有的，同时拥有一组存取器方法，以setXXX()和getXXX()形式存在。Spring 可以借助属性的 set 方法来配置属性的值，以实现 setter 方式的注入。上一篇文章讲解了实现注入，这篇文章主要讲解如何通过 setter 方法实现注入。

2023-07-14 08:02:10 286

原创 Spring 依赖注入之构造器注入

基于构造器的注入通过调用带参数的构造器来实现，每个参数代表着一个协作者。

2023-07-13 08:27:36 385 1

原创 2023年06数据月报

2023年06月数据月报，为您准备了阿里、字节、百度等大厂90多篇实践案例

2023-07-11 07:32:40 715

原创 Spring MVC 引入 Jackson 触发 ClassFormatException: Invalid byte tag in constant pool: 19 异常

在 pom.xml 文件导入 jackson-databind 依赖时 scope 指定 provided，让 jackson-databind 依赖只在编译时有效。根本原因是 Tomcat 插件的版本过低，jackson-databind 版本过高，导致 tomcat 和 jackson-databind 发生冲突。通过上面的代码很容易发现是 Tomcat 和 Jackson 不兼容导致的。你也可以尝试使用 tomcat8-maven-plugin 插件。

2023-06-29 08:40:00 621

原创 Apahce Tomcat 安装与启动

安装的 Tomcat 遇到了 ClassNotFoundException: org.apache.catalina.startup.Catalina 异常。如果提示 Permission denied 那是因为没有文件的权限。可以跟上面类似使用 chmod 命令开放所有权限。在这我们 Tomcat 8 为例(8.5.90)。如果提示 Permission denied 那是因为没有。

2023-06-24 23:35:23 271

转载 Spring Boot 3.0 升级小指南

Spring Boot 3.0 现已正式发布，它包含了 12 个月以来 151 个开发者的 5700 多次代码提交。这是自 4.5 年前发布 2.0 以来，Spring Boot 的第一次重大修订。它也是第一个支持 Spring Framework 6.0 和 GraalVM 的 Spring Boot GA 版本，同时也是第一个基于Java 17的Spring Boot版本，以Jakarta EE 9为基准并支持Jakarta EE 10。同时借助于GraalVM支持了AOT和Native Image

2023-06-24 08:51:45 2815

转载 Flink Kafka Connector 实现机制简析

说完了 preCommit 和 commit，在两次 Checkpoint 发生的间隔当中，会持续的执行 invoke 方法将数据的写到 Kafka，直到 snapshotState 方法被调用，旧的数据被进行预提交，同时生成新的事务，数据继续写入，直到所有任务Checkpoint完成，收到通知，对完成的checkpointId把事务进行正式的提交。通常，二阶段提交也被称为是一种协议(Protocol))。在分布式系统中，每个节点虽然可以知晓自己的操作时成功或者失败，却无法知道其他节点的操作的成功或失败。

2023-06-19 08:17:46 725

转载 Flink SQL 执行流程简单介绍

这篇文章从 org.apache.flink.table.examples.java.StreamSQLExample 这个简单的例子分析 Flink SQL 的一个简单的执行流程，也算 Flink SQL 执行流程初步的入门，我们先从整体的执行框架了解一个整体流程，方便之后我们有机会对 Flink SQL 进行修改先有一个简单认识

2023-06-15 08:44:06 885

原创 Apahce FreeMarker 第一个程序 HelloWorld

它们可以被视作为 “有效的不可改变的” 对象，也可以继续使用安全发布技术 (参考 JSR 133 和相关的文献)来保证实例对其它线程也可用。比如，通过 final 或 volatile 字段来声明实例，或者通过线程安全的IoC容器，但不能作为普通字段。才会产出输出，我们有了一个数据模型 (root) 和一个模板 (template)，为了得到输出就需要合并它们。Template 实例以解析后的形式存储模板，而不是以源文件的文本形式。有了模板之后，我们就可以创建数据模型对模板中的变量动态装填。

2023-06-08 08:34:37 96

转载开源OLAP引擎（ClickHouse、Doris、Presto、ByConity）性能对比分析

TPC-DS（Transaction Processing Performance Council Decision Support Benchmark）是一个面向决策支持系统（Decision Support System，简称DSS）的基准测试，该工具是由TPC组织开发，它模拟了多维分析和决策支持场景，并提供了99个查询语句，用于评估数据库系统在复杂的多维分析场景下的性能。每个查询都设计用于模拟复杂的决策支持场景，包括跨多个表的连接、聚合和分组、子查询等高级SQL技术。

2023-05-29 22:44:41 1537 1

Java 1.7 中文帮助文档

Java 1.7 中文帮助文档.

2015-12-27

2015 搜狗校园招聘研发类笔试题

2015-12-22

Android应用开发揭秘

国内第一本基于Android 2.0的经典著作，5大专业社区联袂推荐，权威性毋庸置疑！本书内容全面，不仅详细讲解了Android框架、Android组件、用户界面开发、游戏开发、数据存储、多媒体开发和网络开发等基础知识，而且还深入阐述了传感器、语音识别、桌面组件开发、Android游戏引擎设计、Android应用优化、OpenGL等高级知识，最重要的是还全面介绍了如何利用原生的C/C++（NDK）和Python、Lua等脚本语言（Android Scripting Environment）来开发Android应用；本书实战性强，书中的每个知识点都有配精心设计的示例，尤为值得一提的是，它还以迭代的方式重现了各种常用的Android应用和经典Android游戏的开发全过程，既可以以它们为范例进行实战演练，又可以将它们直接应用到实际开发中去。

2015-12-17

Android开发秘籍

作为google 开发的全新开源手机平台，android 发展如火如荼。本书通过大量代码秘诀全面详尽地讲述了android 开发技术。从activity 和intent 基础知识开始，到线程、服务、broadcast receiver 以及alert 警告框，再到用户界面布局、界面事件、多媒体技术、硬件接口、网络通信、数据存储方法、基于位置的服务、android 高级开发技术和调试，书中贯穿了经android 设备或者模拟器测试的可用范例，将功能丰富、结构复杂的android 应用程序清晰完美地展现给开发人员。对于那些有志于android 应用开发的人员来说，本书是难得的参考读物。

2015-12-17

Android开发精要

如何才能写出贴近Android设计理念、能够更加高效和可靠运行的Android应用？通过Android的源代码去了解其底层实现细节是最重要的方法之一！然而，Android系统太过于庞大，源代码实现复杂，学习的技术门槛和时间成本都很高。有没有一种方法既能帮助开发者深入理解Android应用开发，又能不被底层大量的实现细节所羁绊，迅速掌握编写高质量Android应用所需的知识？本书针对这个问题给出了完美的答案！它从Android繁杂的源代码中抽取出了Android开发的“精华”和“要点”，剥离了大量琐碎的底层实现细节，进行了高度概括和总结，不仅能帮助开发者迅速地从宏观上理解整个Android系统的设计理念，而且能帮助开发者迅速地从微观上掌握核心知识点的原理，从而编写出高质量的Android应用。[1] 本书共13章，在逻辑上分为4个部分。第一部分（1～2章）：第1章系统介绍了Android的系统架构、核心模块和设计思想，旨在让读者真正理解它的设计理念；第2章讲解了Android源代码的获取、编译、阅读和编辑的方法。第二部分（3～6章）：第3章深入阐述了Android组件机制的设计理念和重要特征，并详细介绍了4大组件的方法和原理；第4章讲解了Intent对象和Android的意图机制，阐明了Android是如何将来自不同应用、不同进程的组件整合在一起的；第5章解析了Android中各个组件的生命周期，包括组件的进程模型和线程模型；第6章从开发的角度详细阐述了组件间数据传输的解决方案，以及它们的优缺点和适用场景。第三部分（7～8章）：第7章深入讲解了Android的控件框架，结合实际项目对重要控件的实现和使用逐一进行了分析，还包含Android 4.0界面开发的实践“精华”；第8章分析了Android的资源体系，剖析了Android底层对资源的处理。第四部分（9～13章）：第9章讲解了Android的数据存储结构，以及不同数据存储模式的使用要点；第10章分析了Android的各种网络连接方式，涵盖NFC和基于WiFi的P2P连接等内容；第11章讲解了Android的定位服务、地址服务和地图服务的框架实现；第12章仔细分析了Android各种多媒体功能的实现机制；第13章对Android中比较有特色的一些模块的实现细节进行了分析。

2015-12-17

Android技术内幕.系统卷

《Android技术内幕:系统卷》是国内首本系统对Android的源代码进行深入分析的著作。全书将Android系统从构架上依次分为应用层、应用框架层、系统运行库层、硬件抽象层和Linux内核层等5个层次，旨在通过对Android系统源代码的全面分析来帮助开发者加深对Android系统架构设计和实现原理的认识，从而帮助他们解决开发中遇到的更加复杂的问题。《Android技术内幕:系统卷》分为两卷，系统卷主要分析了Linux内核层、硬件抽象层和系统运行库层的各个模块的底层原理和实现细节；应用卷主要分析了应用层和应用框架层的各个模块的底层原理和实现细节。具体而言，系统卷第1章首先从宏观上介绍了Android系统的架构以及各个层次之间的关系，然后介绍了如何获取Android源代码并搭建Android源代码开发环境和阅读环境的方法；第2章有针对性地剖析了Android的内核机制和结构，以及Android对Linux内核的改动和增强；第3章分析了Binder的架构和工作机制，以及Binder驱动的实现原理；第4章分析了Android电源管理模块的机制与实现；第5章全面地剖析了Android硬件设备驱动（显示、视频、音频、MTD、Event、蓝牙、WLAN等）的工作原理和实现，掌握这部分内容即可修改和编写基于Android的设备驱动程序；第6章深刻阐述了Android原生库的原理及实现，涉及系统C库、功能库、扩展库和原生的Server等重要内容；第7章系统地讲解了硬件抽象层的原理与实现，掌握这部分内容即可编写适合特定硬件设备驱动的抽象层接口；第8章和第9章是对系统运行库层的分析，主要讲解了Dalvik虚拟机的架构、原理与实现，以及Android的核心库相关的知识，掌握这部分内容即可完成对Android运行库的移植和修改。

2015-12-17

Android高级编程

《Android高级编程》首先简要介绍Android软件栈，接着陈述为手机创建稳定可靠、赏心悦目的应用程序的基本原理。通过学习，您可以打下牢固的理论根基，了解使用当前Android 1．0 SDK编写定制移动程序所需的知识，还能灵活快捷地运用未来的增强功能构建最前沿的解决方案。 Android提供一个开放的开发环境，为针对移动设备编写创新应用程序带来了激动人心的新机遇。作为使用AndroidSDK构建这些应用程序的实用指南书籍，《Android高级编程》从始至终穿插了一系列示例项目，每个项目都引入Android的新功能和新技术，以助您达到最圆满的学习效果。书中介绍Android的所有基本功能，并通过简明扼要的示例引导您使用高级功能。

2015-12-17

2015 腾讯校园招聘技术类研发笔试题

2015-12-17

2015 小米校园招聘笔试题

2015-12-17

2015 新浪微博校园招聘笔试题

2015-12-17

2015 中体彩测试工程师笔试题

2015-12-17

2016 恒生电子校园招聘笔试题

2015-12-17

JavaEE企业应用实战-Struts2+Spring3+Hibernate整合开发

《轻量级Java EE企业应用实战：Struts 2+Spring 3+Hibernate整合开发》是2008年电子工业出版社出版的图书，作者是李刚。《轻量级JavaEE企业应用实战》一书于2008年由电子工业出版社出版发行，该书是《轻量级J2EE企业应用实战》的第二版，同时还融合了《整合Struts+Hibernate+Spring应用开发详解》理论部分。实际上，该书凝结了前两本书的精华部分。该书介绍了Java EE领域的三个开源框架：Struts 2、Spring和Hibernate。其中Struts 2升级到2.1.2，Spring升级到2.5.5，Hibernate升级到3.2.6。该书保留《轻量级J2EE企业应用实战》里关于Tomcat、 Jetty的介绍，新增了关于Ant、CVS的内容。

2015-12-17

Mahout算法解析与案例实战

本书是一本经典的Mahout著作，原理与实战并重。不仅全面分析了Mahout算法库中不同模块中的各个算法的原理及其Mahout实现流程，而且每个算法都辅之以实战案例。此外，还包括4个系统级案例，实战性非常强。全书共11章分为三个部分：第一部分为基础篇（第1~2章），首先介绍了Mahout的应用背景、Mahout算法库收录的算法、Mahout的应用实例，以及开发环境的搭建；第二部分为算法篇（第3~7章），分析了Mahout算法库中不同模块的各个算法的原理以及Mahout实现流程，同时在每章书末含有每个算法的实战，让读者可以自己运行程序，感受程序运行的各个流程；第三部分为实战篇（第8~11章），通过对4个不同系统案例的分析讲解，让读者了解一个完整的云平台系统的各个流程，从需求到系统框架到系统功能再到功能开发。

2015-12-16

LINUX内核设计与实现

《Linux内核设计与实现(原书第3版)》主要内容包括：进程管理、进程调度、时间管理和定时器、系统调用接口、内存寻址、内存管理和页缓存、VFS、内核同步以及调试技术等。同时《Linux内核设计与实现(原书第3版)》也涵盖了Linux 2.6内核中颇具特色的内容，包括CFS调度程序、抢占式内核、块I/O层以及I/O调度程序等。《Linux内核设计与实现(原书第3版)》采用理论与实践相结合的路线，能够带领读者快速走进Linux内核世界，真正开发内核代码。《Linux内核设计与实现(原书第3版)》适合作为高等院校操作系统课程的教材或参考书，也可供相关技术人员参考。

2015-12-14

重构-改善即有代码的设计

本书清晰揭示了重构的过程，解释了重构的原理和最佳实践方式，并给出了何时以及何地应该开始挖掘代码以求改善。书中给出了70多个可行的重构，每个重构都介绍了一种经过验证的代码变换手法的动机和技术。本书提出的重构准则将帮助你一次一小步地修改你的代码，从而减少了开发过程中的风险。

2015-12-14

算法艺术和信息学竞赛

本书即为信息学界著名的两本“黑书”之一（另一本为吴文虎、王建德编著的实用算法的分析与程序设计，这本书现在已经在市场是接近绝版，但是在网上能找到电子书·如果想找到替代品的话可以找另外一本由吴文虎教授以及王建德先生编著的黑书《新编实用算法的分析与程序设计》，由北京邮电出版社2008年出版，此书与原版表面内容相差较大，但实质没有太大差别）。

2015-12-14

Eclipse Maven插件

eclipse-maven插件。官网并不提供 maven 插件的离线安装包，在网上搜一下maven 的离线安装即可。

2015-11-30

apache-mahout-distribution-0.11.1-src

Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者 Grant Ingersoll 介绍了机器学习的基本概念，并演示了如何使用 Mahout 来实现文档集群、提出建议和组织内容。

2015-11-30

log4j-1.2.17

Apache log4j 1.2.17 is distributed under the Apache License, version 2.0. The link in the Mirrors column should display a list of available mirrors with a default selection based on your inferred location. If you do not see that page, try a different browser. The checksum and signature are links to the originals on the main distribution server.

2015-11-30

apache-maven-3.3.9-bin

Apache Maven 3.3.9 is the latest release and recommended version for all users. The currently selected download mirror is http://www.us.apache.org/dist/. If you encounter a problem with this mirror, please select another mirror. If all mirrors are failing, there are backup mirrors (at the end of the mirrors list) that should be available. You may also consult the complete list of mirrors.

2015-11-30

【5】2015 网易游戏校园招聘笔试题游戏插件研发岗

第一部分2015 【5】2015 网易游戏校园招聘笔试题游戏插件研发岗

2015-11-27

【4】2015 网易游戏校园招聘运维开发岗笔试题

第一部分2015 【4】2015 网易游戏校园招聘运维开发岗笔试题

2015-11-27

【1】2015 浙江大华校园招聘算法、软件类笔试题

第一部分2015 【1】2015 浙江大华校园招聘算法、软件类笔试题

2015-11-27

Better bitmap performance with Roaring bitmaps

2023-03-06

Encoded Bitmap Indexing for Data Warehouses

2023-03-04

数仓规范化-菜鸟数据模型管理实践

数仓规范化—菜鸟数据模型管理实践 PDF

2023-02-19

美团外卖离线数仓建设实践

美团外卖数据仓库主要是收集各种用户终端业务、行为数据，通过统一口径加工处理，通过多种数据服务支撑主题报表、数据分析等多种方式的应用。数据组作为数据基础部门，支持用户端、商家端、销售、广告、算法等各个团队的数据需求。本文主要介绍美团外卖离线数仓的历史发展历程，在发展过程中碰到的痛点问题，以及针对痛点做的一系列优化解决方案

2023-02-19

Redis　入门指南

《Redis入门指南》是2013年人民邮电出版社出版的图书，作者是李子骅。该书是一本Redis的入门指导书籍，以通俗易懂的方式介绍了Redis基础与实践方面的知识，包括历史与特性、在开发和生产环境中部署运行Redis、数据类型与命令、使用Redis实现队列、事务、复制、管道、持久化、优化Redis存储空间等内容，并采用任务驱动的方式介绍了PHP、Ruby、Python和Node.js这4种语言的Redis客户端库的使用方法。

2017-06-02

Apache Spark源码剖析

《Apache Spark源码剖析》以Spark 1.02版本源码为切入点，着力于探寻Spark所要解决的主要问题及其解决办法，通过一系列精心设计的小实验来分析每一步背后的处理逻辑。

2016-11-12

Shell脚本学习指南

《Shell脚本学习指南》将告诉你这些有关UNIX主流工具的知识。除此之外，《Shell脚本学习指南》还会帮助你解决UNIX命令与标准的差异。作者熟知UNIx程序使用的基本技巧与操作上细微的差异。他们不但会告诉你如何构建一个绝佳的脚本，还会教你如何避免落入让你功亏一篑的陷阱。有了《Shell脚本学习指南》，你可以节省很多力气。我们要学习的不只是如何写出有用的Shell脚本，你还得了解如何迅速、确实地定制Shell，让程序的可移植性达到最佳状态，脱离对特定系统的依赖。这些技巧对任何操作与维护UNIX及Linux系统的人而言都很重要。《Shell脚本学习指南》所提供的知识，将可以帮助你掌握基本的Shell脚本编写技巧。Shell脚本编程(scripting)的技巧永远不会过时：它们可以让UNIX充分发挥其真实的潜能。对uNIx的用户与系统管理者而言

2016-05-28

dubbo-admin-2.5.4

dubbo-admin

2016-04-26

AspectJ所需Jar包

AspectJ 1.8.8 版本更新时间 2016/02/12

2016-02-12

精通Spring

本书深入剖析了当前流行的轻量级开发框架Spring技术。本书总共分成3部分。第一部分，重点阐述Spring的架构。这部分内容循序渐进带领开发者进入Spring中。主要在于阐述Spring IoC和Spring AOP。第二部分，重点阐述Spring的使用。这部分内容从简化Java/J2EE的角度出发，从J2EE平台各个技术层面分析、并给出大量的研究实例，对Spring提供的API进行阐述。主要在于阐述Spring对J2EE API提供的服务抽象。第三部分，重点阐述Spring高级专题。这部分内容重点对视图技术进行了研究，因为对于开发Web应用而言，前端界面的开发往往工作量很大。因此，使用合理的视图技术开发Web应用对于项目的成功与否很关键。

2016-02-07

TA关注的人

Java 1.7 中文帮助文档

2015 搜狗校园招聘研发类笔试题

Android应用开发揭秘

Android开发秘籍

Android开发精要

Android技术内幕.系统卷

Android高级编程

2015 腾讯校园招聘技术类研发笔试题

2015 小米校园招聘笔试题

2015 新浪微博校园招聘笔试题

2015 中体彩测试工程师笔试题

2016 恒生电子校园招聘笔试题

JavaEE企业应用实战-Struts2+Spring3+Hibernate整合开发

Mahout算法解析与案例实战

LINUX内核设计与实现

重构-改善即有代码的设计

算法艺术和信息学竞赛

Eclipse Maven插件

apache-mahout-distribution-0.11.1-src

log4j-1.2.17

apache-maven-3.3.9-bin

【5】2015 网易游戏校园招聘笔试题游戏插件研发岗

【4】2015 网易游戏校园招聘运维开发岗笔试题

【1】2015 浙江大华校园招聘算法、软件类笔试题

Better bitmap performance with Roaring bitmaps

Encoded Bitmap Indexing for Data Warehouses

数仓规范化-菜鸟数据模型管理实践

美团外卖离线数仓建设实践

Redis 入门指南

Apache Spark源码剖析

Shell脚本学习指南

dubbo-admin-2.5.4

AspectJ所需Jar包

精通Spring

Spring-Jar-4.2.4

mysql-connector-java-5.1.38

log4j所需jar包

jdom-2.0.6.zip

Hadoop实战中文版

大型网站技术核心原理与案例分析

Hive Range Between 结果错误问题

Storm Trident 抛异常不重发

hive SERDEPROPERTIES 实现正则过滤

Flink 关于窗口Window的问题

Hive 运行SQL 重定向文件 输出WARN日志

Hadoop Distcp报错 队列问题

Hive Join 失败

Hive 查询问题

Hive LOAD DATA 错误

[ElasticSearch] 中文字符串精确搜索 term 搜不到结果

mysql group by 统计问题

大型分布式网站架构的演进

ubuntu IntelliJ Idea设置快捷方式问题

罗技键盘 k380 连接上 没有任何的反应？

Maven archetype:generate报错

Log4j问题

Java Stringbuilder调用append()方法报错

nosql开放性问题

Redis　入门指南

Hive 运行SQL　重定向文件　输出WARN日志

Hadoop Distcp报错队列问题

罗技键盘 k380 连接上没有任何的反应？