python爬虫
—Luz—
这个作者很懒,什么都没留下…
展开
-
Scrapy抓取的网页信息出现Unicode码的解决
先要吐槽一下网上这些回答。。。试了很多方法都不行 最后终于让我解决了#将得到的字典转换为Unicode并 将ensure_ascii设置为False str=json.dumps(dict(item),ensure_ascii=False)+"\n" 前提是 前面要提取的要 .extract()...原创 2018-04-30 15:09:35 · 1408 阅读 · 0 评论 -
豆瓣电影排行python爬虫实战(刚开始学习)
作为一名刚学了几天的新手 在这里只使用了request 和 re 库分析网页 https://movie.douban.com/top250?start=0&filter= 注意 start 每次下一页就会+25正则 :观察网页源代码得到 电影名 titlepat = 'class="">.*?<span class="title">(.*?)</span...原创 2018-04-21 22:35:14 · 517 阅读 · 0 评论