2018年09月_guoxiaojie_415

10月 09月 06月 05月 04月

原创 Spark系列3 - Spark SQL

1 从Shark到Spark SQLSpark SQL的前生是Shark，即Hive on Spark。Shark本质是通过Hive的HQL进行解析，将HiveQL翻译成Spark上对应的RDD操作，然后通过Hive的Metadata获取数据数据库里的元数据，并根据元数据从HDFS上读取文件，最后由Shark将获取的数据放到Spark上运算。Shark提供了类似Hive的功能，区别是Hive将...

2018-09-28 18:51:46 682

原创 Spark系列2 - Spark RDD编程

一、RDD 编程基础1 RDD 创建从文件系统创建RDD textFileval part = sc.textFile("file:///root/software/spark-2.2.0-bin-hadoop2.6/README.md")val part = sc.textFile("hdfs://master:8020/sougou/README.md") &lt;=&gt; (等

2018-09-28 18:50:48 570

原创 Spark系列1 - Spark生态和RDD

1 Spark的生态Spark Core中的基本概念DAG(Directed Acyclic Graph), 有向无环图。Spark Core提供了有向无环图的分布式计算框架，并提供内存机制来支持多次迭代计算或者数据共享，大大减少了迭代计算之间读取数据的开销。RDD(Resilient Distributed Dataset)，它是一个分布在一组节点中的只读对象集合，这些集合是弹性的，如...

2018-09-28 18:49:34 496

原创大数据技术栈

大数据技术栈全貌下面自底向上介绍各个层的主要项目。1 采集层和传输层Sqoop在hadoop和关系型数据库之间转换数据。FlumeFlume是一个分布式的高可用的数据收集、聚集和移动的工具。通常用于从其他系统搜集数据，如web服务器产生的日志，通过Flume将日志写入到Hadoop的HDFS中。Canal数据抽取是 ETL 流程的第一步。我们...

2018-09-02 17:36:28 15036 2

privoxy socket5代理到http代理的转换工具

privoxy，一款开源的socket5代理到http代理的转换工具

2018-04-17

Python实现 windows 下代理IP的自动切换

2017-01-04

Python windows服务程序实现计划任务

用Python脚本结合Linux的crontab、windows服务程序，实现了一个基于widows服务程序的定时任务管理器。

2017-01-04

机器学习如何经典数据推荐

An Introduction to Support Vector Machines and Other Kernel-based Learning Methods Kernel Methods and Machine Learning Pattern Recognition and Machine Learning Gaussian processes for machine learning 李航统计学习

2015-12-21

Linux下LVM的基本操作

LVM简介创建PV、VG、LV 扩展逻辑卷缩减逻辑卷快照卷

2015-09-06

使用mdadm创建软RAID

使用mdadm创建软RAID的具体操作步骤

2015-09-05

机器学习必看书籍

主要包括机器学习的基本数据以及Gaussian Process 1、Pattern Recognition and Machine Learning 2、Gaussian Processes for Machine Learning 3、李航统计学习

2015-07-21

Head First C

这本书是Head Fisrt系列书籍之一，本书以图文并茂的形式讲解C语言的基础知识，书中提供了清楚的内存分布图，易深入理解C！

2012-07-06

文件夹遍历与多线程复制文件

改小程序主要练习： 1、文件夹非递归遍历 2、文件操作，实现对文件的复制 3、多线程复制文件 4、线程互斥（临界区） 5、MFC非模态对话框的创建和销毁

2012-03-14

linux下C多线程编程

linux下C多线程编程，是了解多线程开发不可多得的好文章

2012-03-02

《UNIX环境高级编程》（第2版），史蒂文斯著

2011-04-21

linux程序员必看的几本书

《UNIX环境高级编程》（第2版），史蒂文斯著《深入理解 Linux 内核》（第三版），博韦等著《Linux 设备驱动程序》，科波特著《嵌入式 Linux 应用开发完全手册》，韦东山著《人月神话》（32周年中文纪念版），布鲁克斯著

2011-04-21

基于bluez的应用程序开发

Linux下Bluez的编程实现 1、蓝牙的各个协议栈的简介 2 1.1、蓝牙技术 2 1.1、蓝牙协议栈 2 1.2、蓝牙技术的特点 4 1.2.1、蓝牙协议栈体系结构 4 1.2.2、蓝牙协议栈低层模块 4 1.2.3、软件模块 5 1.3、蓝牙的一些Profile 6 2、Bluez和D-Bus 7 2.1、Bluez和D-Bus体系结构 7 2.2、D-Bus介绍 9 2.3、Bluez的安全接口 13 2.4、Bluez适配器接口 15 2.5、Bluez配对 16 2.6、Bluez绑定 17 3、Bluez编程实现 18 3.1、蓝牙开发关键技术剖析 18 3.1.1、连接机制分析 18 3.1.2、自动连接 18 3.1.3、时钟设计 19 3.1.4、配对列表管理 20 3.1.5、蓝牙文件传输模式 20 3.2、hci层介绍 20 3.2.1、hci层介绍 20 3.2.2、hci层编程 21 3.3、L2CAP层编程 25 3.3.1、L2CAP协议简介 25 3.3.2、L2CAP编程方法 26 3.4、SDP协议简介 27 4、Openobex 28 4.1、Openobex简介 28 4.2、Openobex与bluez编程实现 29 5、 Obexftp 32 5.1、obexftp简介 32 5.2、基于Obexftp的应用程序开发 32 6、参考资料 32

2010-09-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

GeorgeGuo

原创 Spark系列3 - Spark SQL

原创 Spark系列2 - Spark RDD编程

原创 Spark系列1 - Spark生态和RDD

原创大数据技术栈

privoxy socket5代理到http代理的转换工具

Python实现 windows 下代理IP的自动切换

Python windows服务程序实现计划任务

机器学习如何经典数据推荐

Linux下LVM的基本操作

使用mdadm创建软RAID

机器学习必看书籍

Head First C

文件夹遍历与多线程复制文件

linux下C多线程编程

《UNIX环境高级编程》（第2版），史蒂文斯著

linux程序员必看的几本书

基于bluez的应用程序开发

Head.First深入浅出设计模式

window程序设计(第五版)pdf

MFC制作选择题答题卡

MFC类库中文参考手册.pdf(pdf版)

php连接数据库和分页类

空空如也

原创 Spark系列3 - Spark SQL

原创 Spark系列2 - Spark RDD编程

原创 Spark系列1 - Spark生态和RDD

原创 大数据技术栈

privoxy socket5代理到http代理的转换工具

Python实现 windows 下代理IP的自动切换

Python windows服务程序实现计划任务

机器学习如何经典数据推荐

Linux下LVM的基本操作

使用mdadm创建软RAID

机器学习必看书籍

Head First C

文件夹遍历与多线程复制文件

linux下C多线程编程

《UNIX环境高级编程》（第2版），史蒂文斯著

linux程序员必看的几本书

基于bluez的应用程序开发

Head.First深入浅出设计模式

window程序设计(第五版)pdf

MFC制作选择题答题卡

MFC类库中文参考手册.pdf(pdf版)

php连接数据库和分页类

空空如也

原创大数据技术栈