自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

rickiyang的博客

欢迎关注个人博客:http://blog.rickiyang.cn

  • 博客(8)
  • 资源 (5)
  • 收藏
  • 关注

原创 hadoop学习(六)----HDFS的shell操作

HDFS所有命令:[uploaduser@rickiyang ~]$ hadoop fsUsage: hadoop fs [generic options] [-appendToFile <localsrc> ... <dst>] [-cat [-ignoreCrc] <src> ...] [-checksum <src> ...]

2017-11-30 16:40:24 289

原创 python3学习-requests使用

前面我们讲过了urllib模块,知道他是用于网络请求的,这一节讲的requests还是用于网络请求的,只不过urllib是官方模块,而requests是第三方的模块。用过的人都说他才是’人类使用的’,哈哈,我也没觉得urllib有多么尿性啊!下面我们试着回归人类的生活吧。这是第三方的模块,所以需要手动安装,安装过程在此不表,请度娘查之。1.首先我们导入模块:import requests2.请求u

2017-11-27 19:53:53 9519

原创 python3学习-Queue模块

python标准库中带有一个Queue模块,顾名思义,队列。该模块也衍生出一些基本队列不具有的功能。我们先看一下队列的方法: put 存数据 get 取数据 empty 判断队列是否为空 qsize 显示

2017-11-27 19:52:13 11199

原创 python3学习-pickle模块

pickle提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。基本接口:pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去。 protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII码表示;1:老式的二进制协议;2:2.3版本引入的新二进制协议,较以前的更高效。其中协议0和1兼容老版

2017-11-27 19:50:51 744

原创 python3学习-lxml模块

在爬虫的学习中,我们爬取网页信息之后就是对信息项匹配,这个时候一般是使用正则。但是在使用中发现正则写的不好的时候不能精确匹配(这其实是自己的问题!)所以就找啊找。想到了可以通过标签来进行精确匹配岂不是比正则要快。所以找到了lxml。因为lxml是对xml格式的解析,支持html格式,而对于xml格式的解析有一门专用的语言,XPath。XPath用于在xml文档中通过元素和属性进行导航。lxml库也是

2017-11-27 19:48:58 4070

原创 python3学习-logging模块

1.logging模块的使用非常简单,引入模块就可以使用。import logginglogging.debug('This is debug message')logging.info('This is info message')logging.warning('This is warning message')屏幕上打印:WARNING:root:This is warning mess

2017-11-27 19:45:44 3458

原创 hadoop学习(二)----HDFS简介及原理

前面简单介绍了hadoop生态圈,大致了解hadoop是什么、能做什么。带着这些目的我们深入的去学习他。今天一起看一下hadoop的基石—-文件存储。因为hadoop是运行与集群之上,处于分布式环境之中,所以他的文件存储也不同与普通的本地存储,而是分布式存储系统,HDFS(The Hadoop Distributed File System)。因为数据量越来越大,一台机器管理的磁盘数量是有限的,所有

2017-11-27 11:06:51 525

原创 hadoop学习(一)----概念和整体架构

程序员就得不停地学习啊,故步自封不能满足公司的业务发展啊!所以我们要有搞事情的精神。都说现在是大数据的时代,可以我们这些码农还在java的业务世界里面转悠呢。好不容易碰到一个可能会用到大数据技术的场景时可惜你又没这个技术把这一票接下来!书到用时方恨少。所以我们也要与时代同进步,搞搞大数据。分布式的基础架构现在有hadoop和spark。虽然spark目前比较火,但是国内大厂因为最开始学习大数据的先锋

2017-11-27 10:52:20 1049

windows下安装hadoop的依赖库

windows下安装hadoop的依赖库文件,将bin和etc文件夹里面的内容替换hadoop解压目录的文件即可!大家好好学习!

2017-12-02

数据挖掘实用机器学习工具与技术(原书第3版)((新西兰)Ian H.Witten)

数据挖掘与机器学习理论知识讲解,原书第三版,有需要的可以下载。资源失效请联系我。

2017-11-21

深入Java虚拟机

java虚拟机学习,扫描版,清晰带书签,大家好好学!!!!!!

2017-11-19

Netty权威指南 第2版

netty权威指南,不可多得的教程!!!带书签,完整版!!!

2017-11-17

高可用MySQL(第2版)

《高可用MySQL(第2版)》主要讲解真实环境下如何使用MySQL的复制、集群和监控特性,揭示MySQL可靠性和高可用性的方方面面。《高可用MySQL(第2版)》定位于解决MySQL数据库的常见应用瓶颈,在保持MySQL持续可用性的前提下,挖潜各种提高性能的解决方案。《高可用MySQL(第2版)》描述了很多MySQL工具的变化,涵盖了5.5, 版本的知识,以及若干5.6版本的功能。《高可用MySQL(第2版)》的作者正是书中介绍的很多工具的设计师,《高可用MySQL(第2版)》揭示了MySQL可靠性和高可用性的许多不为人知的方面。, 《高可用MySQL(第2版)》适用于MySQL数据库管理员及MySQL应用开发者。对于相关专业的师生,也有很高的参考价值。

2017-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除