python爬取指定内容_【求教】:如何用BeautifulSoup爬取指定标签下的内容

先附上数据:

Apple iPhone 6 (A1589) 16GB 金色 移动4G手机

用bs想要爬取title和href里面的内容,由于初学试了好几种办法,未果。先附上代码:

第一次尝试:

#!/usr/bin/python

2 #coding:utf-8

3 from bs4 import BeautifulSoup

4 import re

5

6

7 soup = BeautifulSoup(open('jd.html'),"lxml") #已经爬下的页面(上面代码为其中一段)

8 reg=u"(title=.*?\w+[\u4e00-\u9fa5]+)"

9 Res = re.compile(reg)

10 source = soup.find_all(class_ = 'p-name p-name-type-2',text=Res)

11 for item,nu in enumerate(source):

12 print item,nu

第二次:

#!/usr/bin/python

...

7 soup = BeautifulSoup(open('jd.html'),"lxml")

8 source = soup.find_all(class_ = 'p-name p-name-type-2')

9 Res = source.body.contents[0].attrs

10 Title = Res['title']

11 Link = Res['href']

初学乍道有许多不理解,而且想用python做毕业设计所以还希望有高人能帮忙指点一下, 感激不尽!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值