今天看漫画不爽，操起ruby...

最新推荐文章于 2022-10-15 10:12:30 发布

iteye_3062

最新推荐文章于 2022-10-15 10:12:30 发布

阅读量1.9k

点赞数

分类专栏： ruby 文章标签： Ruby rubygems Linux HTML

ruby 专栏收录该内容

140 篇文章 0 订阅

订阅专栏

ff下载图片实在是不行，而且一百多张图就呼呼喘了（cpu风扇），最不能忍受的是每张图都是一半的，于是还是自己动手。

先保存好网页，然后写一小段解析代码(请先安装hpricot)：

ruby 代码

require "rubygems"
require "open-uri"
require "hpricot"
DEFAULT_IMG_FILE=File.expand_path("img.html", File.dirname(__FILE__))
local_file=DEFAULT_IMG_FILE
list_file=File.expand_path("img.list", File.dirname(__FILE__))
if File.readable? local_file
doc=Hpricot(open(local_file))
list=File.new(list_file,"w+")
(doc/"img").each() do |img|
link=img.attributes["src"]
if link=~ /^http:\/\//
list.puts link
end
end
list.close
end

原来还准备多写些，后来一想算了，先这样凑和吧。生成了img.list文件后，直接交给wget就完事了。

ruby 代码

wget -i img.list -P imgs

然后就等着吧，wget会重试几次的，而且是单线程下载，很安全。不过要应付多页面还是不行，其实wget本身就可以实现循环下载，网站镜像，不过没去研究罢了。

linux下的工具每一个都不可小视啊。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
今天看漫画不爽，操起ruby...

ff下载图片实在是不行，而且一百多张图就呼呼喘了（cpu风扇），最不能忍受的是每张图都是一半的，于是还是自己动手。先保存好网页，然后写一小段解析代码(请先安装hpricot)：ruby 代码 require "rubygems" require "open-uri" require "hpricot" DEFAULT_IMG...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。