网站镜像工具

github地址

简介

将一个网站的镜像到本地,主要用于学习和提升,涉及到python,数据库,多线程,锁,字符编码,http规范等知识点。目前仅在linux平台测试运行过。

功能:

  1. 本程序目前支持断点下载,就是如果程序在运行中意外终止,重新运行就可以继续恢复到之前状态,不用重新再去运行程序。

  2. 支持多配置文件,通过在程序运行时指定不同的配置文件,就可以通过运行多个不同的任务并行下载.

  3. 通过自定义线程池,可达到在所有链接访问一遍之后,自动停止运行并推出。

  4. 编码自适应,通过解析response响应头的数据和网页中的meta信息来筛选出最符合当前网页的编码

  5. 不仅能够解析出html中的url,同时也支持解析css中的URL

  6. 可指定运行目录,如果指定运行目录,在数据和日志就会输出到指定目录下

环境配置

  1. 系统:Linux 或 Mac OS

  2. 数据库: mysql

  3. Python3, pip3, 开发环境是3.6.4

使用方式

  1. 首先需要初始化环境,通过运行 bin/init.sh脚本来初始化环境, 目的是创建mysql数据库和表,初始化python

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
  首先,打开Update Now!,在“动作”里面选择增加主机,软件会弹出一个对话框,要求输入用户名和密码,你就将你申请主页得来的名称以及密码输入,然后确定。Update Now!会让您输入本地初始地址,也就是那些网页资料在你 氐挠才躺厦娴哪柯剂耍绻愕耐辰峁估锩婧凶幽柯迹捅匦虢旅娴囊桓鲂】蛞惭∩希缓笤俳邢乱徊健pdate Now!会要求您输入主页提供商的名称,系统也提供了几个缺省的主页提供商,如果你的主页是建设在那几个地址上的,那么几乎就不需要进行什么设置了。Update Now!提供了“深圳热线963.net、衡阳电信、自贡169、保定热线”等四个站点。如果你的站点是其他的,就要选择下面的“手工设置”了。   接着再进行下一步,Update Now!会要求你输入主机的地址,主要不能输入“http://”或者“ftp://”等等前缀,输入地址之后就是FTP端口,一般选择缺省的“21”就足够了。然后就是输入主机的初始路径,譬如“碧海银沙”的主页一般是“/personal/用户名”,网页的一般是“public_html”,输入了之后再“下一步”,Update Now!就会将刚才你所输入的东西重新显示出来,让您对正一下,好了,一切OK,选择完成,主机添加完成。如果你的主页没有更改,那么无论你怎么按“开始”,Update Now!都不会有动作的,如果每次你对主页进行了文件更新之后,想看看Update Now!会对其作什么改动,又或者您想对站点的设置进行详细的修改,可以在已经添加的主机名称上面按鼠标右键,再选择“编辑”,就可以对一些细节进行调整。在里面你可以对新、旧文件进行更新碰上一些你不希望Update Now!帮你更新的文件,你可以在新文件的菜单里面删除它,同样如果你想重新上载一些没有经过改动的文件,同样可以添加到新文件菜单里面。不过我在这里要说Update Now!的一句坏话,因为如果你对主页的某些文件做了删除,Update Now!是不能帮你自动删除了,只能靠你自己登录上去了。   如果您想修改一些关于FTP参数的设置,您可以在选项的按钮上面按一下,进入菜单之后,您就可以去修改譬如:ACSII文件、对话框显示时间、代理服务器地址、文件上载顺序、自动拨号、网络超时等等项目了。总之,Update Now!的功能是非常强大而且详尽的,经常更新主页的您一定不能错过!   可以这么说,Update Now!出现大大方便了我们这些喜欢做主页的网虫!因为是国产的共享软件,我们更要支持!要注册(实在好用,笔者已经决意注册一个了!不贵,30元!)!到作者的主页http://newsoft.126.com里面就可以找到软件和注册方法了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值