爬虫
文章平均质量分 71
SVALBARDKSY
这个作者很懒,什么都没留下…
展开
-
爬虫: 基于Node.js的强大爬虫,能直接发布抓取的文章哦
原地址:https://github.com/atonasting/zhihuspider 作者: https://www.zhihu.com/people/aton网站「看知乎」后台爬虫的源码,使用node.js编写。环境配置 搞一台服务器,什么linux都行,我用的是CentOS 6.5; 装个mysql数据库,5.5或5.6均可,图省事可以直接用lnmp或lamp来装,回头还能直接在浏览器转载 2016-01-27 10:17:36 · 3113 阅读 · 0 评论 -
python笔记 爬虫经常出现的错误UnicodeEncodeError
UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\xa0’ in position 3621: illegal multibyte sequenceimport cookielib, urllib2,urllib,sys from bs4 import BeautifulSoup response = urllib2.urlope原创 2016-03-08 22:41:56 · 1785 阅读 · 0 评论