python爬取指定内容_【求教】：如何用BeautifulSoup爬取指定标签下的内容

最新推荐文章于 2022-03-08 15:05:40 发布

weixin_39911056

最新推荐文章于 2022-03-08 15:05:40 发布

阅读量431

点赞数

文章标签： python爬取指定内容

先附上数据:

Apple iPhone 6 (A1589) 16GB 金色移动4G手机

用bs想要爬取title和href里面的内容,由于初学试了好几种办法,未果。先附上代码：

第一次尝试：

#!/usr/bin/python

2 #coding:utf-8

3 from bs4 import BeautifulSoup

4 import re

7 soup = BeautifulSoup(open('jd.html'),"lxml") #已经爬下的页面（上面代码为其中一段）

8 reg=u"(title=.*?\w+[\u4e00-\u9fa5]+)"

9 Res = re.compile(reg)

10 source = soup.find_all(class_ = 'p-name p-name-type-2'，text=Res)

11 for item,nu in enumerate(source):

12 print item,nu

第二次：

#!/usr/bin/python

...

7 soup = BeautifulSoup(open('jd.html'),"lxml")

8 source = soup.find_all(class_ = 'p-name p-name-type-2')

9 Res = source.body.contents[0].attrs

10 Title = Res['title']

11 Link = Res['href']

初学乍道有许多不理解，而且想用python做毕业设计所以还希望有高人能帮忙指点一下，感激不尽！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注