----爬虫
syrdbt
这个作者很懒,什么都没留下…
展开
-
获取一篇新浪文章信息的简单爬虫
具体代码如下,有详细的注释: # 本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用 # python3 # 主要采用的 requests库,BeautifulSoup库 import requests from bs4 import BeautifulSoup #将要爬取的新浪文章的网址 url = "http://news.sina.com.cn/c/xl/2018-07...原创 2018-07-26 10:22:25 · 658 阅读 · 0 评论 -
爬取安居客上住房信息的简单爬虫 ,并存储为表格文件
代码如下,有注释进行介绍: #本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用 #python3, Firefox浏览器 import requests from bs4 import BeautifulSoup import time import csv # 定制请求头,请求头在浏览器中查看,具体方法见附录一 headers = { 'User-Agent':...原创 2018-07-26 11:15:02 · 3636 阅读 · 6 评论 -
爬取博客信息的简单爬虫
调用 getOneBlogDetails( ) 函数可以获取目标网页的博主姓名, 个人主页网址,原创文章、粉丝、喜欢、评论数量, 等级、访问量、积分、排名。 #!/usr/lib/python3.6 #encoding = utf-8 #爬取一个博客的基本信息 #本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用 import requests from bs...原创 2018-08-05 22:05:07 · 1238 阅读 · 0 评论