- 博客(5)
- 收藏
- 关注
转载 开源网络爬虫介绍及其比较
开源网络爬虫介绍及其比较Nutch开发语言:Javahttp://lucene.apache.org/nutch/简介:Apache的子项目之一,属于Lucene项目下的子项目。Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户
2014-02-22 18:47:31 2174
转载 开源python网络爬虫框架Scrapy
http://blog.chinaunix.net/uid-23500957-id-3787194.html开源python网络爬虫框架Scrapy介绍:所谓网络爬虫,就是一个在网上到处或定向抓取数据的程序,当然,这种说法不够专业,更专业的描述就是,抓取特定网站网页的HTML数据。不过由于一个网站的网页很多,而我们又不可能事先知道所有网页的URL地址
2014-02-22 18:40:50 1061
原创 C++学习笔记
const 的用法注意:1、const指针,指向常量的指针---------char const* ptr =“weiguang”;//不允许改变指针所指向的值,ptr[0]是错误的常量指针------------------char* cosnt ptr=“weiguang”;//不允许指针指向其他的常量,即ptr=&str,但ptr[0]是正确的指向常量的常量指针---
2014-02-19 21:24:20 540
原创 我的python学习2笔记
1、多行注释方法:三个双引号或三个单引号2、range()函数的用法先列几个range()函数的几个用法:函数原型:range(start, end, scan):参数含义:start:计数从start开始。默认是从0开始。例如range(5)等价于range(0, 5);end:技术到end结束,但不包括end.例如:range(0
2014-02-18 22:06:16 677
原创 python学习笔记1语句
解释器按行来判断语句的结束#但如果一行多个语句就需要分号a=1;b=2;print a;#结果1#赋值语句#前面是基本赋值,后面是元组赋值,tuple assignmenta,b='a','b'print aprint bprint a,b#这里输出的是 a b 而不是 a,b#列表赋值[a,b]=[1,2]p
2014-02-18 21:29:33 1034
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人