Python
xuedingeca
这个作者很懒,什么都没留下…
展开
-
Python读取excel表格中的网址并批量打开网页
import webbrowserimport xlrdwb = xlrd.open_workbook("demo.xlsx")sht = wb.sheet_by_name("Sheet1")for x in range(sht.nrows): webbrowser.open(sht.cell(x, 1).value) # 用系统默认浏览器打开指定网页```![在这里插入图片描述](https://img-blog.csdnimg.cn/20200807104345256.jp原创 2020-08-07 10:44:21 · 2985 阅读 · 0 评论 -
Python获取网页所有超链接
import requestsfrom bs4 import BeautifulSoupdef getHTMLText(url): ''' 此函数用于获取网页的html文档 ''' try: #获取服务器的响应内容,并设置最大请求时间为6秒 res = requests.get(url, timeout = 6) #判断返回状态码是否为200 res.raise_for_status() #转载 2020-08-07 10:05:31 · 2369 阅读 · 1 评论 -
用python正则表达式提取网页的url超链接
用python正则表达式提取网页的urlimport reimport urlliburl="http://www.baidu.com"s=urllib.urlopen(url).read()ss=s.replace(" ","")urls=re.findall('<a.*?href=.*?<\/a>',ss,re.I) for i in urls: print ielse: print '显示完成'#urls=re.findall(']*?href=.*转载 2020-08-07 10:03:28 · 4571 阅读 · 0 评论