python应用
钟shi杰
信息与计算科学专业
展开
-
Python 3 爬虫的自我探索(一)
0 体验一:用python抓取整个网页Step 1 : 实现python抓取网页的代码,并运行# encoding: UTF-8 import urllib.requesturl = "http://www.baidu.com" data = urllib.request.urlopen(url) show = data.read().decode('UTF-8') print(show)Step原创 2017-08-11 13:57:09 · 277 阅读 · 0 评论 -
Python 3 爬虫的自我探索(二)
1. Python网络爬虫——V 1.0Step 1 : 实现抓取Startup News,并运行import re import urllib.request import urllibfrom collections import deque# 定义队列和集合 queue = deque() visited = set()url = 'http://news.dbanotes.net' # 入原创 2017-08-11 13:59:27 · 419 阅读 · 0 评论 -
Python 3 爬虫的自我探索(三)
Step 1 : 获取HTML文件的内容# encoding: UTF-8 # 爬虫获取:南方电网招标采购信息 import requests# 定义主入口网址 main_url = "http://www.bidding.csg.cn/zbcg/index.jhtml"# 请求网址 r = requests.get(main_url)# 打印:返回结果的类型,状态码,编码方式,Cookies pr原创 2017-08-11 14:01:58 · 497 阅读 · 0 评论