ZCC的专栏

每天坚持看书和写作，相信每天的一小步，将会是人生的一大步! 形成、知化、流动、屏读、使用、共享、过滤、重混、互动、追踪、提问、开始!

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

翻译使用Git在码云上上传项目

一、码云:中国版的github 最近两年开源中国的业务发生了很大的变化，依托于社区的基础，我们一共构建了四大业务：社区（oschina.net） --- 为开发者提供发现、学习和交流的平台；人才（job.oschina.net） --- 为开发者提供求职就业的平台；码云（git.oschina.net） --- 为开发者提供云端开发环境和工具；

2017-07-31 14:37:02 570

翻译 python爬取新浪新闻存储到excel

一、运行环境(1) BeautifulSoup的导入：pip install BeautifulSoup4(2) requests的导入：pip install requests(3) re的导入：pip install re(4) pandas的导入：pip install pandas二、完整代码 # 获取新闻的标题，内容，时间和评论数im

2017-07-30 11:06:02 2375 2

转载 Spring思维导图

spring mvc简介与运行原理Spring的模型-视图-控制器（MVC）框架是围绕一个DispatcherServlet来设计的，这个Servlet会把请求分发给各个处理器，并支持可配置的处理器映射、视图渲染、本地化、时区与主题渲染等，甚至还能支持文件上传。(1) Http请求：客户端请求提交到DispatcherServlet。(2) 寻找处理器：由DispatcherS

2017-07-30 09:40:13 1205

原创 windows下git 使用教程

安装好软件后，桌面右击点击Git Bash打开程序，是一个shell脚本命令，类似于linux的终端命令。一、使用git上传项目1.cd d:/github 进入一个D盘中github文件夹2. git --version查看版本号3.git config --global user.name zcc888 设置你的用户名 huan

2017-07-28 09:27:00 1201

原创 Scrapy框架利用CrawlSpider创建自动爬虫

一、适用条件可以对有规律或者无规律的网站进行自动爬取二、代码讲解 (1)创健scrapy项目E:myweb>scrapy startproject mycwpjtNew Scrapy project 'mycwpjt', using template directory 'd:\\python35\\lib\\site-packages\\s

2017-07-27 09:48:43 8876 3

原创编写自动爬取网页的爬虫

一、item的编写# -*- coding: utf-8 -*-# Define here the models for your scraped items## See documentation in:# http://doc.scrapy.org/en/latest/topics/items.htmlimport scrapyclass AutopjtItem(scr

2017-07-26 21:52:48 2843

转载 Nginx服务搭建负载均衡，反向代理，缓存加速，访问分布式文件系统高可用

一，Nginx Nginx (engine x) 是一个高性能的HTTP和反向代理服务器，也是一个IMAP/POP3/SMTP服务器。AS13000系统Nginx为1.9.2版本。Nginx具有很多非常优越的特性：在连接高并发的情况下，具有较好的性能，支持负载均衡，实现可扩展的浏量管理；使Web服务器更灵活，更高效，更安全；能够快速灵活且可靠的传送流视频和音频内容

2017-07-25 23:42:52 2611 5

转载 GitHub+Hexo 搭建个人网站详细教程

什么是Hexo ?Hexo是一款基于Node.js的静态博客框架，依赖少易于安装使用，可以方便的生成静态网页托管在GitHub和Heroku上，是搭建博客的首选框架。这里我们选用的是GitHub，你没看错，全球最大的同性恋交友网站（逃……）。Hexo同时也是GitHub上的开源项目，参见：hexojs/hexo 如果想要更加全面的了解Hexo，可以到其官网 Hexo 了解更

2017-07-24 17:04:04 1300

翻译获取斗鱼图片

一、总体思路从网页代码里获得你要图片。这里我们需要简单的分析一下该网页。当我们把鼠标移到地址上的时候就会出现该图片，这个就是我们要爬取的图片。这个图片是在 data-original 后面，我们就需要进行匹配，通过正则表达式很快就可以达到目的。网页代码片段1img data-original="https://rpic.do

2017-07-23 22:50:47 1309

转载 github使用

什么是Github说到什么事github，我们先看wikipedia的描述“GitHub是一个利用Git进行版本控制、专门用于存放软件代码与内容的共享虚拟主机服务。它由GitHub公司（曾称Logical Awesome）的开发者Chris Wanstrath、PJ Hyett和Tom Preston-Werner使用Ruby on Rails编写而成。”准备工作下

2017-07-23 22:29:04 3426

转载好用的Markdown编辑器总结

Markdown 是一种简单的、轻量级的标记语法。用户可以使用诸如 * # 等简单的标记符号以最小的输入代价生成极富表现力的文档。 Markdown具有很多优点：写作中添加简单符号即完成排版，所见即所得。让你专注于文字而不是排版。格式转换方便，Markdown 的文本你可以轻松转换为 html、pdf等。可以保存称纯文本　　支持Markdown的编辑器太多，功

2017-07-23 15:34:51 604

转载学习Scrapy框架

一、Scrapy介绍Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。所谓网络爬虫，就是一个在网上到处或定向抓取数据的程序，当然，这种说法不够专业，更专业的描述就是，抓取特定网站网页的HTML数据。抓取网页的一般方法是，定义一个入口页面，然后一般一个页面会有其他页面的URL，于是从当前页面获取到这些URL加

2017-07-22 21:12:21 647 1

翻译爬取今日头条上的图片

一、动态页面逆向分析爬取 (1)今日头条搜索界面如上: (2)页面分析获取Jason数据格式 http://www.toutiao.com/search_content/?offset=20&format=json&keyword=美女&autoload=true&count=20&cur_tab=1二、爬取完整代码块# coding=utf-8import jsonimport osimp

2017-07-22 17:09:29 1293

转载 Python 成最热门编程语言

最近，调查结果已公布：Java 被评为最流行的语言，JavaScript 是最常用的语言，而 Go 被认为是最有前途的语言。一、编程语言可以看到，JavaScript 是使用最多的语言，Python 是最多人想去尝试的语言，Java 则在流行度上独领风骚。注意，下图数值皆为百分比（%）。绿色：频繁使用橙色：即将采纳/迁移二、

2017-07-22 15:02:23 567

原创常见python爬虫框架

一、python爬虫框架一些爬虫项目的半成品二、常见python爬虫框架 (1)Scrapy:很强大的爬虫框架，可以满足简单的页面爬取（比如可以明确获知url pattern的情况）。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。但是对于稍微复杂一点的页面，如weibo的页面信息，这个框架就满足不了需求了。 (2)Crawle

2017-07-21 16:26:34 28703 2

原创爬虫的定向爬取

一、爬虫的定向爬取技术: 根据设置的主题，对要爬取的网址或者网页中的内容进行筛选。二、爬虫的信息筛选方法 (1) 通过正则表达式筛选 (2)通过XPath表达式筛选 (Scapy经常使用) (3)通过xslt 筛选三、定向爬虫实战爬取评论内容import urllib.re

2017-07-21 15:49:47 1892 4

原创爬虫的浏览器伪装

一、常见的反爬虫机制(1)通过分析用户请求的Headers信息构造用户请求的Headers，即设置好"User-Agent""Referer"字段信息(2)检测用户行为:判断同一个ip在短时间内是否频繁访问对应的网站使用代理服务器经常切换代理ip(3)通过动态页面增加爬虫爬取的难度用一些工具软件，如selenium+phantomJS

2017-07-20 09:03:59 599

转载前端知识体系总结

前端技术栈前端基础以上是前端的基本功，一些HTML5的新特性，新API还有CSS3的一些新特性，以及ES6的新语法也是比较热门的，都有涉及。框架或库这是前端常用到的库和框架，包括：jQuerybootstraprequireJsechartsvueangularJsionic一些工具目前用的最多的工具主要时

2017-07-19 22:57:18 665

原创手写python爬虫第二弹

一、微信爬虫import reimport urllib.requestimport timeimport urllib.error#代理服务器地址 http://yum.iqianyue.com/proxy#模拟成浏览器headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KH

2017-07-18 15:58:51 1227

转载 2017 年学习的编程语言、框架和工具

大趋势渐进式 Web Apps在 2016 年里，我们见证了 Progressive Web App 概念的蓬勃兴起。它意味着 Web 应用程序可以离线工作，并能提供原生移动应用的体验。它们可以添加到你的智能设备的主屏幕上，甚至可以给你发送推送通知，从而弥补与原生移动应用程序的差距。我们认为，在 2017 年，渐进式 Web Apps 将变得更加重要，也值得我们去探究。在这里查看相关概

2017-07-18 14:42:14 592

原创手写python爬虫

一、图片爬虫 (1)京东手机图片的抓取import reimport urllib.requestdef craw(url,page): html1=urllib.request.urlopen(url).read() html1=str(html1) pat1='' result1=re.compile(pat1).findall(html1)

2017-07-18 10:23:51 1247

转载机器学习框架对比

2.1 主流深度学习框架对比各个开源框架在Github上的数据统计数据统计截止于2017.07.15可以看到各大主流框架基本都支持Python，目前Python在科学计算和数据挖掘领域可以说是独领风骚。虽然有来自R、Julia等语言的竞争压力，但是Python的各种库实在是太完善了，Web开发、数据可视化、数据预处理、数据库连接，爬虫等无所不能，有一个完美的生态环境。仅

2017-07-18 09:19:16 2951 1

转载 Java常见面试问题

Java 面试中的重要话题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java 集合框架数组字符串GOF 设计模式SOLID （单一功能、开闭原则、里氏替换、接口隔离以及依赖反转）设计原则抽象类与接口Java 基础，如 equals 和 hashcode泛型与枚举Java IO 与 NIO常用网络协议Java 中的数据结构和算

2017-07-18 09:12:45 744

原创正则表达式与Cookie

一、我们在进行字符串的处理时，希望按照自定义的规则进行处理，这些规则称为模式。可以用正则表达式描述这些规则，所以正则表达式也称为模式表达式。在python 中使用re 模块来实现正则表达式的功能。二、正则表达式常见的原子 (1)普通字符:数字、大小写字母、下划线等 (2)非打印字符:格式控制符号，例如换行符 ----\n

2017-07-17 16:49:44 1772

转载设计模式简介

设计模式简介设计模式（Design pattern）代表了最佳的实践，通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了重用代码、让代码更容易被他人理解

2017-07-17 09:23:37 500

原创网络爬虫实现的原理

一、爬行策略深度优先爬行策略、广度优先爬行策略、大站优先策略、反链策略、OPIC策略、Pagerank策略。二、网页分析算法 (1)基于用户行为的网页分析算法: 根据用户对网页的访问行为及其评价 (2)基于网络拓扑的网页分析算法: 结构关系网页粒度的分析算法网页

2017-07-15 16:03:22 1132

原创程序性能分析

一、问题来源计算重力场中多个物体相互作用的经典"n 体问题" 二、性能优化方法三、性能系数对比

2017-07-15 11:26:17 386

原创爬虫基本概念

一、爬虫的基本概念二、聚焦网络爬虫架构三、搜索引擎工作原理四、网络爬虫的功能五、网络爬虫小结

2017-07-14 16:38:59 876

原创第四章编写正确的程序

编写正确的程序原理: 编写正确的二分查找程序:#include #include #include #define MAXN 1000000typedef int DataType;DataType x[MAXN];int n;/* Scaffolding */int i = -999999;#define assert(v) { if

2017-07-13 22:52:37 438

原创第三章数据决定程序结构

程序员在节省空间方面无计可施时，将自己从代码中解脱出来，退回起点并集中心力研究数据，常常能有奇效。数据的表示形式是程序设计的根本。回头思考数据需要思考的原则:

2017-07-12 11:45:01 411

转载人工智能各大分支技术

神经网络机器学习机器学习： Scikit-learn 算法此部分内容可以帮助你解决机器学习中最难的部分，即找到正确的估计器（Estimator）。下图可帮助快速查找文档与简介，更快了解问题并找到解决方法。Scikit-LearnScikit-learn(更正式的叫法为 scikits.learn)是 Python 的一个用于机

2017-07-12 09:28:42 4231

传统的HTTP协议是无状态的，每次请求（request）都要由客户端（如浏览器）主动发起，服务端进行处理后返回response结果，而服务端很难主动向客户端发送数据；这种客户端是主动方，服务端是被动方的传统Web模式对于信息变化不频繁的Web应用来说造成的麻烦较小，而对于涉及实时信息的Web应用却带来了很大的不便，如带有即时通信、实时数据、订阅推送等功能的应用。在WebSocket规范提出之前，开

2017-07-11 22:57:01 330

转载各种编程语言简介

C/C++一句话概括：大多数中国程序员的第一个语言C语言是面向过程语言在当代的鲁殿灵光，常用于编写操作系统。C++是C语言的一个超集，既有指针又有对象使它成为最复杂的语言。 C/C++的优势：几乎所有现代编程语言都脱胎于C/C++，因此了解了C/C++，就了解了关于编程语言的一切，非常有利于快速掌握其他各类编程语言。C/C++的不足：据说C/C++发明的时候

2017-07-11 21:03:30 1590

原创第二章啊哈!算法

一、围绕三个问题展开问题一：二分查找问题二: 翻手掌问题三: 三阶段 #include #include #include #define WORDMAX 100int charcomp(char *x, char *y){ return *x - *y;}int main(){ char word[W

2017-07-11 17:04:07 486

原创第一章开篇

问题:如何对磁盘文件进行排序？直观解法归并排序。实际(物理)问题:美国电话号码由7位数字组成，排序为查找相关信息。精确的问题陈述: 三种解决方案: (1)归并排序 (2)多通道排序(3)位图和位向量表示法例如我们可以把集合{1,2,3,5,8,13}存

2017-07-11 15:29:32 320

原创七个习惯付诸行动

一、若觉得快要失去理智了，怎么办？二、一个自我提升计划三、你自己的小避难所四、内心恢复更新的五个步骤五、简化生活的四个易行的方法六、开始七个习惯

2017-07-07 14:58:31 736

原创再论由内而外造就自己

刺激与回应之间存在一段距离，成长和幸福的关键就在于我们如何利用这段距离。一、代际传承:我们能赋予子孙的永久遗产只有两种------根和翅膀二、成为转型者如果一个人无法改变自己的思想构造，就永远无法改变现实，也永远不可能取得进步。在我们的不懈努力下，事情变得可以迎刃而解，这并不是因为任务的性质发生了变化，而是因为我们的能力增强

2017-07-06 22:16:36 2176

转载 Java进阶之路——从初级程序员到架构师

一：编程基础不管是C还是C++，不管是Java还是PHP，想成为一名合格的程序员，基本的数据结构和算法基础还是要有的。下面几篇文章从思想到实现，为你梳理出常用的数据结构和经典算法。1-1 常用数据结构数组、链表、堆、栈、队列、Hash表、二叉树等1-2 算法思想算法时间复杂度和空间复杂度的分析计算算法思想：递推、递归、穷举、贪心、分治、动态规划、迭代、分枝界限1-3

2017-07-06 00:24:15 1261

转载开源漏洞检测工具

1、Java自动化SQL注入测试工具 jSQLjSQL是一款轻量级安全测试工具，可以检测SQL注入漏洞。它跨平台（Windows, Linux, Mac OS X, Solaris）、开源且免费。2、漏洞评估系统 OpenVASOpenVAS是开放式漏洞评估系统，也可以说它是一个包含着相关工具的网络扫描器。其核心部件是一个服务器，包括一套网络漏洞测试程序，可以检测远程系统和应用

2017-07-04 22:42:40 2828

junit最新版

junit最新版jar包

2017-08-03

CSDN博客导出工具

2017-07-30

前端框架对比

2017-07-30

githubdesktop

github离线版

2017-07-24

微信搜索公众号

微信搜索公众号所有的文章

2017-07-23

微信python爬虫

微信python爬虫，爬取图片，昵称等信息

2017-07-23

python_Scrapy 附属模块

python_Scrapy

2017-07-21

Java编程思想

Java编程思想思维导图

2017-07-21

jdk1.7稳定版

jdk1.7

2017-07-16

metaseeker网络爬虫

metaseeker工具

2017-07-15

(编程珠玑第二版

编程珠玑第二版中英文

2017-07-14

编程珠玑详解

编程珠玑

2017-07-11

计算机核心期刊

计算机核心期刊汇总

2017-07-05

人月神话总结

2017-06-24

卷积神经网络

卷积神经网络详解

2017-06-06

linux就该这么学

2017-06-02

专利申请基本知识

2017-06-02

超人学院吴超老师hadoop资料文档和笔记

2017-05-31

google大数据三篇论文

2017-05-30

学术论文写作方法和技巧

该教程从论文发表流程包括确定方向、确定问题、确定思路、确定方法、实验验证、撰写论文的几个过程出发，详细阐述了撰写学术论文的注意事项和技巧。

2019-02-23

java集合框架

集合框架是一个用来代表和操纵集合的统一架构。所有的集合框架都包含如下内容：接口：是代表集合的抽象数据类型。接口允许集合独立操纵其代表的细节。在面向对象的语言，接口通常形成一个层次。实现（类）：是集合接口的具体实现。从本质上讲，它们是可重复使用的数据结构。算法：是实现集合接口的对象里的方法执行的一些有用的计算，例如：搜索和排序。这些算法被称为多态，那是因为相同的方法可以在相似的接口上有着不同的实现。

2018-01-31

深度学习算法

谷歌大脑的Geoffrey E. Hinton的胶囊(Capsule)论文在2017年10月26号发表后深度学习架构似乎又有个新的变革。

2017-12-26

scrapy爬虫项目

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。所谓网络爬虫，就是一个在网上到处或定向抓取数据的程序，当然，这种说法不够专业，更专业的描述就是，抓取特定网站网页的HTML数据。抓取网页的一般方法是，定义一个入口页面，然后一般一个页面会有其他页面的URL，于是从当前页面获取到这些URL加入到爬虫的抓取队列中，然后进入到新页面后再递归的进行上述的操作，其实说来就跟深度遍历或广度遍历一样。

2017-09-05