python
文章平均质量分 77
hou_study
这个作者很懒,什么都没留下…
展开
-
python实现的一只从百度开始不断搜索的小爬虫
文中用到了BeautifulSoup这个库, 目的是处理html文档分析的, 因为我只是提取了title的关键字,所以可以用正则表达式代替, 还有一个库是jieba, 这个库是中文分词的作用, 再有一个库是 chardet, 用来判断字符的编码, 本想多线程的, 但是自认为被搞糊涂了,就放弃了复制代码 代码如下:#coding:utf-8import rei转载 2013-09-08 10:07:16 · 822 阅读 · 0 评论 -
python在多玩图片上下载妹子图的实现代码
# -*- coding:utf-8 -*-import httplibimport urllibimport stringimport redef getContent(): #从网站中获取所有内容 conn = httplib.HTTPConnection("tu.duowan.com") conn.request("GET", "/m/mei转载 2013-09-08 10:04:54 · 560 阅读 · 0 评论