我看了以前类似的问题,只是更加困惑.
在python 3.4中,我希望在给定url的情况下将html页面作为字符串读取.
在Perl中,我使用get()执行LWP :: Simple.
matplotlib 1.3.1示例说:import urllib; U1 = urllib.urlretrieve(URL).
python3找不到urlretrieve.
我尝试了u1 = urllib.request.urlopen(url),它似乎得到了一个HTTPResponse对象,但我无法打印它或获取它的长度或索引它.
u1.body不存在.我在python3中找不到HTTPResponse的描述.
HTTPResponse对象中是否有一个属性可以为我提供html页面的原始字节?
(来自其他问题的不相关的东西包括urllib2,我的python中不存在,csv解析器等)
编辑:
我在先前的问题中找到了一些部分(大部分)完成工作的东西:
u2 = urllib.request.urlopen('http://finance.yahoo.com/q?s=aapl&ql=1')
for lines in u2.readlines():
print (lines)
我说’部分’因为我不想读单独的行,而只是一个大字符串.
我可以将这些行连接起来,但是每行打印都有一个前缀为“b”的字符.
它来自哪里?
再一次,我想我可以在连接之前删除第一个字符,但这确实是一个kloodge.