自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ZCC的专栏

每天坚持看书和写作,相信每天的一小步,将会是人生的一大步! 形成、知化、流动、屏读、使用、共享、过滤、重混、互动、追踪、提问、开始!...

转载 大数据开源处理工具汇总

查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。Phoenix完全使用Java编写,代码位于GitHub上,并且提供了一个客户端可嵌入的JDBC驱动。 Phoenix查询引擎...

2017-09-30 13:09:28

阅读数 5038

评论数 0

原创 MapReduce计算模型

MapReduce(YARN)是Hadoop提供的一种处理海量数据的并行编程模型和计算框架,用于对大规模的数据进行并行计算。主要由resourcemanager和nodemanager两类节点构成。其中resourcemanager主要负责集群资源管理,nodemanager负责节点的资源管理。除...

2017-09-29 11:08:46

阅读数 256

评论数 0

翻译 大数据的学习规划

大数据方向的工作目前分为三个主要方向: 01.大数据工程师 02.数据分析师 03.大数据科学家 04.其他(数据挖掘本质算是机器学习,不过和数据相关,也可以理解为大数据的一个方向吧) 一、大数据工程师的技能要求 二、大数据学习路径 三、学习资源推荐(书籍、博客、网站) 一、大数据工程师的...

2017-09-26 22:24:45

阅读数 6106

评论数 0

转载 机器学习十大常用算法

十大算法如下: 决策树随机森林算法逻辑回归SVM朴素贝叶斯K最近邻算法K均值算法Adaboost 算法神经网络马尔可夫 1. 决策树 根据一些 feature 进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候...

2017-09-26 19:55:02

阅读数 296

评论数 0

转载 理解Java特性

1. String对象不可改变的特性 下图显示了如下代码运行的过程: [java] view plain copy String s = "abcd";   s = s.concat("ef");   中文参考:Java S...

2017-09-26 18:53:18

阅读数 219

评论数 0

翻译 初探Hadoop 2.x

Hadoop 2.x * common * HDFS 存储数据 NameNode * 存储文件系统的元数据,命名空间namespace DataNode * 存储数据 SecondaryNameNode * 辅助NAmeNode工作,合并两个文件(定时周期性) * YRAN Hadoop 操作系统...

2017-09-25 21:37:31

阅读数 235

评论数 0

转载 期待已久的 Java 9

历经曲折的 Java 9 正式版终于发布了! 你可以通过这里下载 Java 9 正式版。JDK9 提供超过 150 项新功能特性,包括备受期待的模块化系统、可交互的 REPL 工具 jshell,以及安全增强、扩展提升、性能管理改善等。同时发布的还有 Java EE 8 。 相关链接...

2017-09-24 09:55:04

阅读数 437

评论数 0

原创 python3.5 实现图片转文字

一、运行环境      (1) win10      (2) pycharm      (3) python 3.5      (4) pip3   install pillow             pip3  install pytesseract       (5)  识别...

2017-09-22 10:02:20

阅读数 8757

评论数 0

转载 百度、腾讯、阿里等总部大楼PK

阿里巴巴、百度、腾讯、网易、搜狐可谓是当今我国最大的几家互联网公司。据说这几家公司的办公楼个个美到不能呼吸,更是壕气冲天,没有最壕只有更壕! 一、搜狐媒体大厦位于北京中关村的融科资讯中心商务园区,搜狐以约1.1亿美元的价格购得该栋大楼,作为总部。蔚蓝天空,很想扶摇直上哇! 二、百度总部——百...

2017-09-21 11:11:05

阅读数 8836

评论数 0

转载 jvm数据区

1. 程序计数器   线程私有   当前线程所执行的字节码的行号指示器 2. 虚拟机栈   线程私有   存:Java方法(局部变量表(基本数据类型)、操作数栈、动态链栈、方法出口)   StackOverflowError 栈深度大于虚拟机所允许的深度...

2017-09-21 00:31:51

阅读数 211

评论数 0

翻译 论文阅读与书写

一、从零开始阅读论文 这里的从零开始,指的是我们要从零了解这篇文章做了什么事情、使用了什么方法、得到什么结果,这样的方法和结果对我有没有什么借鉴。而不是说,接触到一个全新的领域,从读论文开始入手。对于没有过接触的陌生领域。我的方法是,先看中文综述,中文博士论文,而后是英文综述。通过中文综述,可以...

2017-09-20 00:05:05

阅读数 241

评论数 0

转载 搜索电影神器

这里推荐一些搜索电影技巧: 1.google 搜索 电影名 site:pan.baidu.com 自从去年新浪网盘,360网盘关闭后,如今唯一好用的就是百度网盘了,上面有大量的电影资源。可惜百度屏蔽了这种搜法,google 又得翻墙,所以可以用 http://www.3bsou.com/ 或...

2017-09-18 11:13:06

阅读数 4166

评论数 0

转载 那些有趣 Python 库

转载出处 苏生不惑 图片处理 pip install pillow from PIL import Image import numpy as np a = np.array(Image.open('test.jpg')) b = [255,255,255...

2017-09-18 11:03:33

阅读数 1049

评论数 0

转载 Git 快速上手精华教程

Git介绍 分布式 : Git版本控制系统是一个分布式的系统, 是用来保存工程源代码历史状态的命令行工具; 保存点 : Git的保存点可以追踪源码中的文件, 并能得到某一个时间点上的整个工程项目额状态; 可以在该保存点将多人提交的源码合并, 也可以会退到某一个保存点上; Git离...

2017-09-17 21:57:15

阅读数 211

评论数 0

转载 学术期刊的影响力

背景知识: (1)什么是JCR? 期刊引用报告(Journal Citation Reports 简称JCR),是对世界权威期刊进行系统客观评价的有效工具,通过对来源于ISI的科学引文索引(SCI)和社会科学引文索引(SSCI)的数据进行分析,JCR Web版收录了世界上各学科最具影响的7,60...

2017-09-17 10:45:25

阅读数 2292

评论数 0

翻译 论文级别划分

一、full paper、short paper、poster、oral: CV界的会议一般分三级: oral,需要作者准备PPT上台进行presentation; poster,作者贴一张海报,如果有人感兴趣就会到该作者的墙报前面讨论; workshop,一般都是某些大牛觉得该领域有哪些方...

2017-09-17 10:37:45

阅读数 8324

评论数 0

翻译 java历史变迁

一、java变迁历史 版本 描述 1991年1月 Sun公司成立了Green项目小组,专攻智能家电的嵌入式控制系统 1991年2月 放弃C++,开发新语言,命名为“Oak” 1991年6月 JamesGosling开发了Oak的解释器 1992年1月 ...

2017-09-15 12:05:11

阅读数 533

评论数 0

转载 Python GUI 开发框架

Python 的 UI 开发工具包 Kivy Kivy是一个开源工具包能够让使用相同源代码创建的程序能跨平台运行。它主要关注创新型用户界面开发,如:多点触摸应用程序。Kivy还提供一个多点触摸鼠标模拟器。当前支持的平台包括:Linux、Windows、Mac OS X和Android。 Kiv...

2017-09-14 16:39:36

阅读数 537

评论数 0

转载 利用Scrapy爬取知乎用户详细信息并存至MongoDB

本节目标 本节要实现的内容有: 从一个大V用户开始,通过递归抓取粉丝列表和关注列表,实现知乎所有用户的详细信息的抓取。将抓取到的结果存储到MongoDB,并进行去重操作。 思路分析 我们都知道每个人都有关注列表和粉丝列表,尤其对于大V来说,粉丝和关注尤其更多。 如果我们从一个大V开始,首...

2017-09-13 11:29:43

阅读数 594

评论数 0

转载 PyCharm默认快捷键

1、编辑(Editing) Ctrl + Space 基本的代码完成(类、方法、属性) Ctrl + Alt + Space 快速导入任意类 Ctrl + Shift + Enter 语句完成 Ctrl + P 参数信息(在方法中调用参数) Ctrl + Q 快速查看文档 F1 外部文档 Shif...

2017-09-12 10:06:17

阅读数 269

评论数 0

转载 用pyinstaller把python脚本打包成exe

一、安装pyinstaller pip install pyinstaller 备注:用pip安装pyinstaller成功后,执行.exe打包任务时,可能会遇到一个错误“系统找不到指定文件,......readline.py”,这是因为pyreadline这个包安装不成功,可以在这 https...

2017-09-11 17:37:07

阅读数 1101

评论数 0

转载 爬取网易云音乐下面的热门评论

一、运行环境    (1) win10    (2) python 2.7    (3) pycharm    (4) 安装依赖   pip install  PyCrypto 等  二、运行源程序 # -*- coding: utf-8 -*- # @Time ''�...

2017-09-11 16:20:17

阅读数 838

评论数 0

原创 python爬去知乎和简书内容

一、爬取知乎热门内容 # -*- coding: utf-8-*- import urllib2 import re from BeautifulSoup import BeautifulSoup import sys reload(sys) sys.setdefaultencoding(�...

2017-09-10 21:42:28

阅读数 957

评论数 0

转载 如何正确的寻找电影资源

一、初级:  你已经有兴趣看电影了,区别于那些完全不看电影的人。你可以在各大视频网站在线观看,效果差、片源少、更新慢。  二、中级:  如果你不是特别热爱电影,只是闲暇之余看看热门的新片、美剧,也不特别要求画质与速度的话,下面这几个网站能满足你了:  电影FM :http://dianyi...

2017-09-10 20:58:08

阅读数 4444

评论数 0

转载 python爬虫爬出新高度

一、运行环境      (1)win7      (2)python 2.7      (3)pycharm 二、获取csdn发表的文章 # coding:utf-8 import urllib2, re, time, random, os, datetime import HTMLParser ...

2017-09-10 20:37:21

阅读数 772

评论数 0

原创 Selenium&&PhantomJS获取网站中的JS返回的数据

一、安装Selenium模块 pip install selenium       Selenium 是一套完整的Web应用程序测试系统,包含了测试的录制、编写及运行和测试的并行处理。 二、安装PhantomJS(官网下载:http://phantomjs.org/)        ...

2017-09-10 15:22:40

阅读数 2771

评论数 0

转载 git详细教程

一、版本控制概要 1.1、什么是版本控制 版本控制(Revision control)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。 实现跨区域多人协同开发追踪和记载一个或者多个文件的历史记录组织和保护你的...

2017-09-09 19:44:27

阅读数 311

评论数 0

翻译 爬去知乎下某个问题下所有的图片

主要用户你看到某个感兴趣的问题,需要回答者的图片,比如制作和收集表情包,还有其他用途你懂的! 一、运行环境       (1) win7      (2) python 2.7     (3)  pycharm 二、 主要代码 #-*- coding:utf-8 -*- import re i...

2017-09-08 21:23:43

阅读数 1978

评论数 0

转载 好用的 GitHub 插件和工具

GitHub Octotree推荐指数:★★★★★ insight.io推荐指数:★★★★★ OhMyStar2The best way to organise your GitHub Stars. AstralOrganize Your Github StarsWith Ease. GitHub...

2017-09-07 21:29:23

阅读数 1048

评论数 0

原创 bs4爬虫:获取双色球中奖信息

一、开发环境    (1)win10    (2)python 2.7    (3)pycharm 二、保存数据到excel的类 import xlwt class SavaBallDate(object): def __init__(self, items): s...

2017-09-06 11:32:18

阅读数 581

评论数 0

转载 13种主流机器学习的框架

1. Apache Spark MLlib Apache Spark 最为人所知的是它是Hadoop家族的一员,但是这个内存数据处理框架却是脱胎于Hadoop之外,也正在Hadoop生态系统以外为自己获得了名声。Hadoop 已经成为可供使用的机器学习工具,这得益于其不断增长的算法库,这些算...

2017-09-05 15:53:39

阅读数 30449

评论数 0

原创 bs4爬虫:获取百度贴吧的内容

一、 环境    (1) windws 10    (2)  python.27    (3)  pycharm 二、详细代码    (1)日志分析类  import logging import getpass import sys #### 定义MyLog类 class MyLog(o...

2017-09-05 11:06:46

阅读数 429

评论数 0

转载 计算机类中文核心期刊

1.《软件学报》 (月刊) EI、ISTIC收录 主办单位:中国计算机学会 中国科学院软件研究所 地址:北京8718信箱 北京海淀区中关村《软件学报》编辑委员会 邮编:100080 邮发代号:82-367 E-mail:jos@iscas.ac.cn http://www.jos.org.cn ...

2017-09-04 22:38:37

阅读数 981

评论数 0

转载 发表SCI或EI类英文文章的投稿经验

1. 首先一定要注意杂志的发表范围, 超出范围的千万别投,要不就是浪费时间;另外,每个杂志都有他们的具体格式要求,一定要按照他们的要求把论文写好,免得浪费时间,前些时候,我的一个同事向一个著名的英文杂志投稿,由于格式问题,人家过两个星期就退回来了,而且说了很多难听的话,说投稿前首先就应该看清楚他们...

2017-09-04 22:31:30

阅读数 924

评论数 0

原创 windows下python第三方扩展包

一、windows 下第三方扩展包:(有时 pip install **** 不存在)         下载链接:http://www.lfd.uci.edu/~gohlke/pythonlibs/

2017-09-03 23:38:33

阅读数 330

评论数 0

原创 Scrapy爬虫爬取天气数据存储为txt和json等多种格式

一、创建Scrrapy项目 scrapy startproject weather      二、 创建爬虫文件 scrapy genspider wuhanSpider wuhan.tianqi.com     三、SCrapy项目各个文件    (1) items.py impor...

2017-09-02 15:16:55

阅读数 4564

评论数 0

翻译 最佳的远程桌面连接工具

远程桌面是微软公司为了方便网络管理员管理维护服务器而推出的一项服务。从windows 2000 server版本开始引入,网络管理员使用远程桌面连接程序连接到网络任意一台开启了远程桌面控制功能的计算机上,就好比自己操作该计算机一样,运行程序,维护数据库等。 远程桌面采用的是一种类似TELNE...

2017-09-01 20:12:01

阅读数 26643

评论数 0

提示
确定要删除当前文章?
取消 删除