python_从web抓取文档

最新推荐文章于 2023-09-20 15:38:22 发布

小驹

最新推荐文章于 2023-09-20 15:38:22 发布

阅读量1.1k

点赞数

分类专栏： python 文章标签： python web xhtml 文档 import html

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaocaiju/article/details/6992720

版权

python 专栏收录该内容

86 篇文章 0 订阅

订阅专栏

从Web 的一个URL中抓取文档

代码：

import urllib
doc = urllib.urlopen("http://www.python.org").read()
print doc　　　　直接打印出网页
def reporthook(*a):
    print a
#将http://www.renren.com网页保存到renre.html中，每读取一个块调用一字reporthook函数

urllib.urlretrieve("http://www.renren.com",'renren.html',reporthook)
#将http://www.renren.com网页保存到renre.html中

urllib.urlretrieve("http://www.renren.com",'renren.html')

结果：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

..........................网页内容

</body>
</html>

(0, 8192, -1)
(1, 8192, -1)
(2, 8192, -1)
(3, 8192, -1)
(4, 8192, -1)
(5, 8192, -1)

urllib.urlopen返回一个类文件对象..

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python_从web抓取文档

从Web 的一个URL中抓取文档代码：import urllibdoc = urllib.urlopen("http://www.python.org").read()print doc　　　　直接打印出网页def reporthook(*a): print a#将http://www.renren.com网页保存到renre.html中，每读取一个块调用一字repor
复制链接

扫一扫

专栏目录

小驹 CSDN认证博客专家 CSDN认证企业博客

码龄17年

182: 原创

9万+: 周排名

193万+: 总排名

87万+: 访问

: 等级

1万+: 积分

238: 粉丝

63: 获赞

50: 评论

86: 收藏

私信

关注

热门文章

分类专栏

最新评论

在putty中打开vi时复制文字到windows
键盘即钢琴: 这段文字描述了在 PuTTY 中使用 Vim 编辑器时,如何将文本复制到 Windows 系统剪贴板的方法。具体来说: 1. 当你在 PuTTY 中打开 Vim 编辑器时,如果直接使用鼠标选择文本并尝试复制,这个操作实际上是由 Vim 处理的。Vim 有自己的复制模式和缓冲区,所以这种方式复制的文本不会进入系统剪贴板。 2. 但是,如果你在选择文本时按住 Shift 键,然后再进行复制操作,这时复制操作将由 PuTTY 的终端模拟器(如 xterm)处理,而不是由 Vim 处理。这种方式复制的文本会直接进入系统剪贴板。 3. 作者在测试后发现,这种"按住 Shift 键复制"的方法确实有效,可以将 Vim 中选中的文本复制到 Windows 的系统剪贴板。 4. 后来,作者使用 VNC 连接到服务器,发现在 VNC 环境下的 Vim 中,这种复制方法也同样适用。这让作者感到很高兴,因为找到了一种在远程环境下从 Vim 复制文本到本地系统剪贴板的方便方法。这个技巧解决了一个常见的问题:在终端环境(如 PuTTY)中使用 Vim 时,如何将文本复制到系统剪贴板以便在其他应用程序中粘贴。通过按住 Shift 键进行复制,可以绕过 Vim 的内部复制机制,直接将文本发送到系统剪贴板。这种方法适用于各种终端环境,如 PuTTY, xterm,以及通过 VNC 访问的远程服务器。它提供了一种简单而有效的方式来在 Vim 和系统剪贴板之间共享文本内容。
内核中的_OBJECT_INFORMATION_CLASS 结构
__网瘾少年: 那怎么弄呢
hook zwQuerySysteminformation 隐藏进程
一休宗纯: unresolved external symbol __imp_KeServiceDescriptorTable
python_给框架增加窗口控件
Tisfy: 写得太好了！正如那：羌管悠悠霜满地，人不寐，将军白发征夫泪。
ColorSchemer Studio 2 破解
陳鲍: 在哪里登录破解密

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。