爬虫
leaderway
先埋头,后抬头
展开
-
Windows下Python安装lxml
1、下载easy_install的安装包,下载地址:https://pypi.python.org/pypi/setuptools我是Windows7,所以直接下载Windows(Simplify)下的ez_install.py,有时打开是源代码,可以再本地新建一个ez_install.py的文件,然后复制源代码即可。2、在cmd中找到ez_install.py所在的目录,输入python转载 2016-08-31 19:22:39 · 439 阅读 · 0 评论 -
Python pip源配置修改
由于某些不可抗因素,Python官方的包在国内有时无法访问或出现网络不稳定现象。为了解决这个问题就需要将Pip中自带的源地址修改为镜像地址。目前收集的比较好的镜像地址有:http://pypi.v2ex.com/simple/http://pypi.douban.com/simple/http://mirrors.aliyun.com/pypi/simple/直接修改配置的方法:转载 2016-08-31 19:23:39 · 9147 阅读 · 0 评论 -
CSS 选择器参考手册
CSS3 选择器在 CSS 中,选择器是一种模式,用于选择需要添加样式的元素。"CSS" 列指示该属性是在哪个 CSS 版本中定义的。(CSS1、CSS2 还是 CSS3。)选择器例子例子描述CSS.class.intro选择 class="intro" 的所有元素。1#id#firstname选择 id="first转载 2016-08-31 19:24:40 · 258 阅读 · 0 评论 -
Json概述以及python对json的相关操作
什么是json:JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的转载 2016-08-22 00:53:25 · 266 阅读 · 0 评论 -
Java爬虫到一些总结和心得
最近做了很多关于爬虫到项目,写点感想,以后查询1.请求http连接,并保存内容,catch不同到exception进行反爬处理int countUrl=0; public String getOneHtml(String htmlurl,String encoding,String cookie) throws IOException, Interrupted转载 2016-08-22 01:02:49 · 4746 阅读 · 1 评论