windows 安装Beautiful Soup

3 篇文章 0 订阅

windows 安装Beautiful Soup

  1. 下载最新版本Beautiful Soup

  2. 解决下载的压缩包,并进入。例如我是在H盘解压的。

    H:\beautifulsoup4-4.6.0>

  3. 运行python setup.py build

    installbs1

  4. 运行python setup.py install

    installbs2

  5. 测试是否安装成功from bs4 import BeautifulSoup

    installbs3

好的,以下是使用PythonBeautiful Soup爬取豆瓣音乐排行榜的代码和过程解析: 1. 导入所需的库 ``` import requests from bs4 import BeautifulSoup ``` 2. 通过requests库向网站发送请求,获取网页内容 ``` url = 'https://music.douban.com/chart' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) html = response.text ``` 3. 使用Beautiful Soup解析网页内容 ``` soup = BeautifulSoup(html, 'html.parser') ``` 4. 定位需要爬取的信息 豆瓣音乐排行榜中包含歌曲的排名、歌曲名称、歌手和评分等信息,我们需要定位到这些信息所在的HTML标签和类名。 ``` songs = soup.find_all('tr', class_='item') ``` 5. 提取信息并进行存储 ``` for song in songs: rank = song.find('span', class_='ranking_num').get_text().strip() title = song.find('a', class_='nbg').get_text().strip() artist = song.find('p', class_='pl').get_text().strip() rating = song.find('span', class_='rating_nums').get_text().strip() print(rank, title, artist, rating) ``` 完整代码如下: ``` import requests from bs4 import BeautifulSoup url = 'https://music.douban.com/chart' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) html = response.text soup = BeautifulSoup(html, 'html.parser') songs = soup.find_all('tr', class_='item') for song in songs: rank = song.find('span', class_='ranking_num').get_text().strip() title = song.find('a', class_='nbg').get_text().strip() artist = song.find('p', class_='pl').get_text().strip() rating = song.find('span', class_='rating_nums').get_text().strip() print(rank, title, artist, rating) ``` 此代码可爬取豆瓣音乐排行榜前100首歌曲的信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值