python打开网址获取html_利用python 获取网址中的href(基于python 3.6）

最新推荐文章于 2023-04-09 13:33:31 发布

Yufeng Bai

最新推荐文章于 2023-04-09 13:33:31 发布

阅读量578

点赞数 1

文章标签： python打开网址获取html

本文链接：https://blog.csdn.net/weixin_42489252/article/details/114430657

版权

import urllib.request

from bs4 import BeautifulSoup

def get_link(page): # 寻找链接的href

linkData = []

for page in page.find_all(‘td‘):

links = page.select("a")

for each in links:

# if str(each.get(‘href‘))[:1] == ‘/‘: 过滤if代码

data=each.get(‘href‘)

linkData.append(data)

return(linkData)

def findAll(): #主函数

url=‘http://www.nco.ncep.noaa.gov/pmb/codes/nwprod/nosofs.v3.0.4/‘

page = urllib.request.urlopen(url).read()

soup = BeautifulSoup(page,‘lxml‘) #利用BeautifulSoup取得网页代码

links=get_link(soup)

# print(links)

for childLink in links:

#print(childLink )

links2=url+childLink

print(links2 )

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注