2016年07月_Winterto1990

10月 09月 08月 07月 06月 05月 04月

转载 21款最优秀的开源数据库

摘要：几乎所有软件项目的开发都需要数据库的支持，目前，随着开源技术的迅速发展，越来越多的数据供应商选择开源数据库，为开源事业添砖加瓦。作为一名软件开发人员或DBA，其中一份必不可少的工作就是与数据库打交道，比如MS SQL服务器、MySQL、Oracle、PostgreSQL、MongoDB等等。众所周知，其中MySQL是目前使用最广泛最好的免费开源数据库，此外，还有一些你不知道或者没

2016-07-26 21:48:03 26481

转载 Redis高级实用命令详解--安全和主从复制

一、安全性为redis设置密码：设置客户端连接后进行任何其他指定前需要实用的密码。警告：因为redis速度非常快，所以在一台较好的服务器下，一个外部用户可以在一秒钟进行150k次的密码尝试，这意味着你需要指定非常非常强大的密码来防止暴力破解。修改密码的方法：只需要在redis的配置文件redis.conf中开启requirepass就可以了，比如我设置我的访问密码是

2016-07-25 21:35:09 1114

原创 Redis中基本数据结构

Redis简介源自Redis实战redis是一个远程内存数据库，它不仅性能强劲，而且还具有复制特性以及为解决问题而生的独一无二的数据模型。redis是一个非常快的非关系型数据库，它可以存储键(key)与5种不同类型的值(value)之间的映射(mapping)，可以将存储在内存的键值对数据持久化到硬盘，可以使用复制特性来扩展读性能，还可以使用客户端分片来扩展写性能，下面主要介绍一下re

2016-07-25 20:40:11 811

转载 Python Twisted介绍

原文链接：http://www.aosabook.org/en/twisted.html作者：Jessica McKellarTwisted是用Python实现的基于事件驱动的网络引擎框架。Twisted诞生于2000年初，在当时的网络游戏开发者看来，无论他们使用哪种语言，手中都鲜有可兼顾扩展性及跨平台的网络库。Twisted的作者试图在当时现有的环境下开发游戏，这一步走的非常

2016-07-23 11:24:26 1002

转载分布式爬虫：使用Scrapy抓取数据

Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。官方主页： http://www.scrapy.org/中文文档：Scrapy 0.22 文档GitHub项目主页：https://github.com/scrapy/scrapyScrapy 使用了 T

2016-07-23 10:57:32 2999

原创 php开发环境搭建 XAMPP

1.安装git并配置下载git并安装打开git-bash程序，添加git配置文件，执行命令 vim ~/.gitconfig，复制以下配置到文件中并保存[alias] co = checkout br = branch ci = commit st = sta

2016-07-23 10:18:00 1643

Java 基础核心总结.pdf

它是javac编译器的一个环境变量。它的作用与import、package关键字有关。当你写下improt java.util.*时，编译器面对import关键字时，就知道你要引入java.util这个package中的类

2020-10-13

《Java面试手册》.pdf

利用空余时间整理了一份《Java面试手册》，初衷也很简单，就是希望在面试的时候能够帮助到大家，减轻大家的负担和节省时间。

2020-10-13

sybase数据库jdbc驱动jar包

需要使用jdbc连接sybase数据库的同学们可以下载使用了

2018-11-16

scipy-0.18.1-cp27-27m-win_amd64.whl

python2.7.x 64位操作系统 python安装scipy包wheel文件由于文件较大存于百度云盘 http://pan.baidu.com/s/1jHNbtGi

2017-02-24

casperjs.pdf

casperjs官方开发文档，内容是英文版的但英文简单易懂，这是最新的版本。

2015-10-15

云计算

这是有关云计算的PDF文档，希望能够对想要学习云计算的同事有所帮助。

2015-09-22

bootstrap.min css js

压缩包中既有bootstrap.css,bootstrap.min.css,bootstrap-responsive.css, bootstrap-responsive.min.css又有bootstrap.min.js

2015-07-18

scripy爬虫 for python

这是有关python中scripy爬虫的简单的例子可以去尝试学习学习，学习python并行化爬虫的方便。

2015-07-06

httpcore-4.4.1.jar

httpcore-4.4.1.jar包含了httpcore各函数

2015-06-14

This book is concerned with the nuts and bolts of manipulating, processing, cleaning, and crunching data in Python. It is also a practical, modern introduction to scientific computing in Python, tailored for data-intensive applications. This is a book about the parts of the Python language and libraries you’ll need to effectively solve a broad set of data analysis problems. This book is not an exposition on analytical methods using Python as the implementation language.

2015-05-22

Hadoop实战中文版

《Hadoop实战》作为云计算所青睐的分布式架构，Hadoop是一个用Java语言实现的软件框架，在由大量计算机组成的集群中运行海量数据的分布式计算，是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分，深入浅出地介绍了Hadoop框架、编写和运行Hadoop数据处理程序所需的实践技能及Hadoop之外更大的生态系统。《Hadoop实战》适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考。书籍目录：第一部分 Hadoop——一种分布式编程框架　第1章 Hadoop简介　　1.1 为什么写《Hadoop 实战》　　1.2 什么是Hadoop 　　1.3 了解分布式系统和Hadoop 　　1.4 比较SQL 数据库和Hadoop 　　1.5 理解MapReduce 　　1.5.1 动手扩展一个简单程序　　1.5.2 相同程序在MapReduce中的扩展　　1.6 用Hadoop统计单词——运行第一个程序　　1.7 Hadoop历史　　1.8 小结　　1.9 资源　第2章初识Hadoop 　　2.1 Hadoop 的构造模块显示全部信息第一部分 Hadoop——一种分布式编程框架　第1章 Hadoop简介　　1.1 为什么写《Hadoop 实战》　　1.2 什么是Hadoop 　　1.3 了解分布式系统和Hadoop 　　1.4 比较SQL 数据库和Hadoop 　　1.5 理解MapReduce 　　1.5.1 动手扩展一个简单程序　　1.5.2 相同程序在MapReduce中的扩展　　1.6 用Hadoop统计单词——运行第一个程序　　1.7 Hadoop历史　　1.8 小结　　1.9 资源　第2章初识Hadoop 　　2.1 Hadoop 的构造模块　　2.1.1 NameNode 　　2.1.2 DataNode 　　2.1.3 Secondary NameNode 　　2.1.4 JobTracker 　　2.1.5 TaskTracker 　　2.2 为Hadoop 集群安装SSH 　　2.2.1 定义一个公共账号　　2.2.2 验证SSH安装　　2.2.3 生成SSH密钥对　　2.2.4 将公钥分布并登录验证　　2.3 运行Hadoop 　　2.3.1 本地（单机）模式　　2.3.2　伪分布模式　　2.3.3 全分布模式　　2.4 基于Web 的集群用户界面　　2.5 小结　第3章 Hadoop组件　　3.1 HDFS 文件操作　　3.1.1 基本文件命令　　3.1.2 编程读写HDFS 　　3.2 剖析MapReduce 程序　　3.2.1 Hadoop数据类型　　3.2.2 Mapper 　　3.2.3 Reducer 　　3.2.4 Partitioner：重定向Mapper输出　　3.2.5 Combiner：本地reduce 　　3.2.6 预定义mapper和Reducer类的单词计数　　3.3 读和写　　3.3.1 InputFormat 　　3.3.2 OutputFormat 　　3.4 小结第二部分实战　第4章编写MapReduce基础程序　　4.1 获得专利数据集　　4.1.1 专利引用数据　　4.1.2 专利描述数据　　4.2 构建MapReduce 程序的基础模板　　4.3 计数　　4.4 适应Hadoop API 的改变　　4.5 Hadoop 的Streaming 　　4.5.1 通过Unix命令使用Streaming 　　4.5.2 通过脚本使用Streaming 　　4.5.3 用Streaming处理键/值对　　4.5.4 通过Aggregate包使用Streaming 　　4.6 使用combiner 提升性能　　4.7 温故知新　　4.8 小结　　4.9 更多资源　第5章高阶MapReduce 　　5.1 链接MapReduce 作业　　5.1.1 顺序链接MapReduce作业　　5.1.2 具有复杂依赖的MapReduce链接　　5.1.3 预处理和后处理阶段的链接　　5.2 联结不同来源的数据　　5.2.1 Reduce侧的联结　　5.2.2 基于DistributedCache的复制联结　　5.2.3 半联结：map侧过滤后在reduce侧联结　　5.3 创建一个Bloom filter 　　5.3.1 Bloom filter做了什么　　5.3.2 实现一个Bloom filter 　　5.3.3 Hadoop 0.20 以上版本的Bloom filter 　　5.4 温故知新　　5.5 小结　　5.6 更多资源　第6章编程实践　　6.1 开发MapReduce 程序　　6.1.1 本地模式　　6.1.2 伪分布模式　　6.2 生产集群上的监视和调试　　6.2.1 计数器　　6.2.2 跳过坏记录　　6.2.3 用IsolationRunner重新运行出错的任务　　6.3 性能调优　　6.3.1 通过combiner来减少网络流量　　6.3.2 减少输入数据量　　6.3.3 使用压缩　　6.3.4 重用JVM 　　6.3.5 根据猜测执行来运行　　6.3.6 代码重构与算法重写　　6.4 小结　第7章细则手册　　7.1 向任务传递作业定制的参数　　7.2 探查任务特定信息　　7.3 划分为多个输出文件　　7.4 以数据库作为输入输出　　7.5 保持输出的顺序　　7.6 小结　第8章管理Hadoop 　　8.1 为实际应用设置特定参数值　　8.2 系统体检　　8.3 权限设置　　8.4 配额管理　　8.5 启用回收站　　8.6 删减DataNode 　　8.7 增加DataNode 　　8.8 管理NameNode 和SNN 　　8.9 恢复失效的NameNode 　　8.10 感知网络布局和机架的设计　　8.11 多用户作业的调度　　8.11.1 多个JobTracker 　　8.11.2 公平调度器　　8.12 小结第三部分 Hadoop也疯狂　第9章在云上运行Hadoop 　　9.1 Amazon Web Services 简介　　9.2 安装AWS 　　9.2.1 获得AWS身份认证凭据　　9.2.2 获得命令行工具　　9.2.3 准备SSH密钥对　　9.3 在EC2 上安装Hadoop 　　9.3.1 配置安全参数　　9.3.2 配置集群类型　　9.4 在EC2 上运行MapReduce 程序　　9.4.1 将代码转移到Hadoop集群上　　9.4.2 访问Hadoop集群上的数据　　9.5 清空和关闭EC2 实例　　9.6 Amazon Elastic MapReduce 和其他AWS 服务　　9.6.1 Amazon Elastic MapReduce 　　9.6.2 AWS导入/导出　　9.7 小结　第10章用Pig编程　　10.1 像Pig 一样思考　　10.1.1 数据流语言　　10.1.2 数据类型　　10.1.3 用户定义函数　　10.2 安装Pig 　　10.3 运行Pig 　　10.4 通过Grunt 学习Pig Latin 　　10.5 谈谈Pig Latin 　　10.5.1 数据类型和schema 　　10.5.2 表达式和函数　　10.5.3 关系型运算符　　10.5.4 执行优化　　10.6 用户定义函数　　10.6.1 使用UDF 　　10.6.2 编写UDF 　　10.7 脚本　　10.7.1 注释　　10.7.2 参数替换　　10.7.3 多查询执行　　10.8 Pig 实战——计算相似专利的例子　　10.9 小结　第11章 Hive及Hadoop群　　11.1 Hive 　　11.1.1 安装与配置Hive 　　11.1.2 查询的示例　　11.1.3 深入HiveQL 　　11.1.4 Hive小结　　11.2 其他Hadoop 相关的部分　　11.2.1 HBase 　　11.2.2 ZooKeeper 　　11.2.3 Cascading 　　11.2.4 Cloudera 　　11.2.5 Katta 　　11.2.6 CloudBase 　　11.2.7 Aster Data和Greenplum 　　11.2.8 Hama和Mahout 　　11.2.9 search-hadoop.com 　　11.3 小结　第12章案例研究　　12.1 转换《纽约时报》1100 万个库存图片文档　　12.2 挖掘中国移动的数据　　12.3 在StumbleUpon 推荐最佳网站　　12.3.1 分布式StumbleUpon 的开端　　12.3.2 HBase 和StumbleUpon 　　12.3.3 StumbleUpon 上的更多Hadoop 应用　　12.4 搭建面向企业查询的分析系统——IBM的ES2 项目　　12.4.1 ES2 系统结构　　12.4.2 ES2 爬虫　　12.4.3 ES2 分析　　12.4.4 小结　　12.4.5 参考文献附录A HDFS文件命令

2015-05-19

mysql,sqlserver.oracle.jar

包含mysql sqlserver oracle 三种数据库的开发包

2015-05-19

SQLite权威指南

全书首先从 SQLite 最初起源、特性、设计理念、实际应用讲解开始，逐步深入、全面地介绍了在各个平台如何使用SQLite。接着，介绍SQLite 的一般SQL 和高级功能的SQL，采取举例说明，使得本书内容生动有趣。然后，全面介绍了各种语言如何与SQLite 进行编程交互，重点介绍SQLite 原生语言C 语言中的API，使得使用者可以不管扩展SQLite 的功能。本书还介绍了目前火热的IOS 和Android 开发中如何使用SQLite，并给出实际例子。最后，介绍了SQLite 内部架构设计，使得读者可以深入理解SQLite，高级开发者可以进一步参与SQLite 开发或者开发自己的SQLite。

2015-05-19

机器学习和模式识别-PRML

PRML是模式识别和机器学习领域的经典著作，出版于2007年。该书作者 Christpher M. Bishop 是模式识别和机器学习领域的大家，其1995年所著的“Nerual Networks for Pattern Recognition”也是模式识别、人工神经网络领域的经典著作。 PRML深入浅出地介绍了模式识别与机器学习的基本理论和主要方法，同时还涵盖了模式识别与机器学习领域的一些最新进展，不仅适合初学者学习，而且对专业研究人员也有很大的参考价值。全书共738页，分为14章，循序渐进，前后呼应、表达清晰、理解深刻。每章都有相应的习题及答案，有助于学习和教学。

2015-05-14

精通Windows.API-函数、接口、编程实例

《精通Windows API-函数、接口、编程实例》是一系列函数、宏、数据类型、数据结构的集合，运行于windows系统的应用程序，可以使用操作系统提供的接口来实现需要的功能。《精通Windows API-函数、接口、编程实例》由浅入深、循序渐进地教授读者如何使用windows api进行windows应用程序开发。

2015-05-13

随机森林代码-matlab

随机森林的代码，matlab.m格式的代码，希望能帮到需要帮助的。

2015-05-12

机器学习实战.

对计算机学习的成功理解将开辟出许多全新的应用领域，并使其计算能力和可定制性上升到新的层次。同时，透彻理解机器学习的信息处理算法，也会有助于更好地理解人类的学习能力及缺陷。

2015-05-11

O'Reilly：社交网站的数据挖掘与分析

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据，但是怎样才能找出谁通过社交媒介正在进行联系？他们在讨论些什么？或者他们在哪儿？本书简洁而且具有可操作性，它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术，如何通过可视化帮助你找到你一直在社交世界中寻找的内容，以及你闻所未闻的有用信息。　　《社交网站的数据挖掘与分析》每章都介绍了在社交网络的不同领域挖掘数据的技术，这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

2015-05-11

[改变未来的九大算法

Google得出的搜索结果是如何产生的？百度为何会陷入“搜索门”，又是什么机制使然？身处在大数据时代的我们，究竟该如何应对变化莫测的世界？ …… 没有满篇的专业术语，第一次让我们通过简单明了的语言、生动的例证了解支撑计算机王国的灵魂支柱——9大算法，包括人工智能、数据压缩，以及Google著名的PageRank等。本书精彩地介绍了搜索引擎、PageRank、公开密钥加密、纠错码、模式识别、数据压缩、数据库、数字签名等内容。在解释这些算法的同时，作者也向我们展示了充满科学原创精神的计算机世界：因为每一种算法的提出不但延伸了虚拟世界的领域，同时也是人类智慧的彰显，可以被广泛运用于众多领域。在读完本书后，你不会成为一名更加熟练的计算机用户，但你会更珍视自己每天在所有计算设备上不停使用的思想的美。

2015-05-11

TA关注的人

Winterto1990的博客

转载 21款最优秀的开源数据库

转载 Redis高级实用命令详解--安全和主从复制

原创 Redis中基本数据结构

转载 Python Twisted介绍

转载分布式爬虫：使用Scrapy抓取数据

原创 php开发环境搭建 XAMPP

Java 基础核心总结.pdf

《Java面试手册》.pdf

sybase数据库jdbc驱动jar包

scipy-0.18.1-cp27-27m-win_amd64.whl

weka-3.6.11

weka-3-6-11

casperjs.pdf

SAS编程技术与金融数据处理

云计算

phantomjs-2.0.0

基于selenium2的自动化测试

贝叶斯思维：统计建模的Python学习法

phantomjs-1.9.1

bootstrap.min css js

scripy爬虫 for python

xml-apis.jar

httpcore-4.4.1.jar

dom4j-1.6.1.rar

Python For Data Analysis

Hadoop实战中文版

mysql,sqlserver.oracle.jar

SQLite权威指南

机器学习和模式识别-PRML

精通Windows.API-函数、接口、编程实例

随机森林代码-matlab

机器学习实战.

O'Reilly：社交网站的数据挖掘与分析

[改变未来的九大算法

mysql-connector-java-5.1.6-bin.jar

R语言实践.PDF

asp.net中ajax技术是否可以实现停止服务器端正在运行的按钮事件

转载 21款最优秀的开源数据库

转载 Redis高级实用命令详解--安全和主从复制

原创 Redis中基本数据结构

转载 Python Twisted介绍

转载 分布式爬虫：使用Scrapy抓取数据

原创 php开发环境搭建 XAMPP

Java 基础核心总结.pdf

《Java面试手册》.pdf

sybase数据库jdbc驱动jar包

scipy-0.18.1-cp27-27m-win_amd64.whl

weka-3.6.11

weka-3-6-11

casperjs.pdf

SAS编程技术与金融数据处理

云计算

phantomjs-2.0.0

基于selenium2的自动化测试

贝叶斯思维：统计建模的Python学习法

phantomjs-1.9.1

bootstrap.min css js

scripy爬虫 for python

xml-apis.jar

httpcore-4.4.1.jar

dom4j-1.6.1.rar

Python For Data Analysis

Hadoop实战中文版

mysql,sqlserver.oracle.jar

SQLite权威指南

机器学习和模式识别-PRML

精通Windows.API-函数、接口、编程实例

随机森林代码-matlab

机器学习实战.

O'Reilly：社交网站的数据挖掘与分析

[改变未来的九大算法

mysql-connector-java-5.1.6-bin.jar

R语言实践.PDF

asp.net中ajax技术是否可以实现停止服务器端正在运行的按钮事件

转载分布式爬虫：使用Scrapy抓取数据