我的python学习笔记
文章平均质量分 74
Weiguang_123
这个作者很懒,什么都没留下…
展开
-
开源网络爬虫介绍及其比较
开源网络爬虫介绍及其比较Nutch开发语言:Javahttp://lucene.apache.org/nutch/简介:Apache的子项目之一,属于Lucene项目下的子项目。Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户转载 2014-02-22 18:47:31 · 2188 阅读 · 0 评论 -
开源python网络爬虫框架Scrapy
http://blog.chinaunix.net/uid-23500957-id-3787194.html开源python网络爬虫框架Scrapy介绍:所谓网络爬虫,就是一个在网上到处或定向抓取数据的程序,当然,这种说法不够专业,更专业的描述就是,抓取特定网站网页的HTML数据。不过由于一个网站的网页很多,而我们又不可能事先知道所有网页的URL地址转载 2014-02-22 18:40:50 · 1070 阅读 · 0 评论 -
python学习笔记1语句
解释器按行来判断语句的结束#但如果一行多个语句就需要分号a=1;b=2;print a;#结果1#赋值语句#前面是基本赋值,后面是元组赋值,tuple assignmenta,b='a','b'print aprint bprint a,b#这里输出的是 a b 而不是 a,b#列表赋值[a,b]=[1,2]p原创 2014-02-18 21:29:33 · 1046 阅读 · 0 评论 -
我的python学习2笔记
1、多行注释方法:三个双引号或三个单引号2、range()函数的用法先列几个range()函数的几个用法:函数原型:range(start, end, scan):参数含义:start:计数从start开始。默认是从0开始。例如range(5)等价于range(0, 5);end:技术到end结束,但不包括end.例如:range(0原创 2014-02-18 22:06:16 · 691 阅读 · 0 评论 -
python脚本
http://www.jb51.net/article/926.htm转载 2014-03-31 21:30:59 · 597 阅读 · 0 评论