python3 lxml解析html_使用python的lxml解析html

# coding=gb2312

from lxml import *

import lxml.html

import urllib2

import lxml.html as H

def getjarinfo(url):

c=urllib2.urlopen(url)

f=c.read()

doc = H.document_fromstring(f)

tables=doc.xpath("//table[@id='xiazai']")

pinpais=doc.xpath("//td[@id='pinpai']")

jixings=doc.xpath("//div[@id='jixing']")

jars = doc.xpath("//table[@id='xiazai']//tr[2]/td[1]/a[1]")

for j in range(len(pinpais)):

print jars[j].get('href')

print pinpais[j].text_content()

print jixings[j].text_content()

e=doc.xpath(u"//div[text()='%s']" % u"游戏介绍")

describe=e[0].getnext().text_content()

#r = doc.xpath("//table[@id='xiazai']//tr[2]/td[1]/a[1]")[0]

#jarurl=r.get('href')

if __name__ == '__main__':

url='http://game.3533.com/game/30862.htm'

getjarinfo(url)

分享到:

2009-02-04 15:53

浏览 9548

评论

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值