python读取网页中内容_从python中读取的网页中读取一些内容

我试图从web中读取

python模块中的一些数据.

我设法阅读,但在解析这些数据和获取所需信息方面遇到一些困难.

我的代码如下.任何帮助表示赞赏.

#!/usr/bin/python2.7 -tt

import urllib

import urllib2

def Connect2Web():

aResp = urllib2.urlopen("https://uniservices1.uobgroup.com/secure/online_rates/gold_and_silver_prices.jsp");

web_pg = aResp.read();

print web_pg

#Define a main() function that prints a litte greeting

def main():

Connect2Web()

# This is the standard boilerplate that calls the maun function.

if __name__ == '__main__':

main()

当我打印这个web page时,我打印了整个网页.

我想从中提取一些信息,(例如“SILVER PASSBOOK ACCOUNT”并从中获取费率),我在解析这个html文档时遇到了一些困难.

可以使用regexp来获取所需的数据:

import urllib

import urllib2

import re

def Connect2Web():

aResp = urllib2.urlopen("https://uniservices1.uobgroup.com/secure/online_rates/gold_and_silver_prices.jsp");

web_pg = aResp.read();

pattern = "

SILVER PASSBOOK ACCOUNT" + "(.*)" * 4

m = re.search(pattern, web_pg)

if m:

print "SILVER PASSBOOK ACCOUNT:"

print "\tCurrency:", m.group(1)

print "\tUnit:", m.group(2)

print "\tBank Sells:", m.group(3)

print "\tBank Buys:", m.group(4)

else:

print "Nothing found"

如果您在循环中进行匹配,请不要忘记重新编译模式.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值