blog » Linux » wget用法小结

wget用法小结

wget简介
wget是一个从网络上自动下载文件的自由工具。它支持HTTP,HTTPS和FTP协议,可以使用HTTP代理。

所谓的自动下载是指,wget可以在用户退出系统的之后在后台执行。这意味这你可以登录系统,启动一个wget下载任务,然后退出系统,wget将在后台执行直到任务完成,相对于其它大部分浏览器在下载大量数据时需要用户一直的参与,这省去了极大的麻烦。

wget 可以跟踪HTML页面上的链接依次下载来创建远程服务器的本地版本,完全重建原始站点的目录结构。这又常被称作”递归下载”。在递归下载的时候,wget 遵循Robot Exclusion标准(/robots.txt)。wget可以在下载的同时,将链接转换成指向本地文件,以方便离线浏览。

wget 非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性。如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕。如果是服务器打断下载过程,它会再次联到服务器上从停止的地方继续下载。这对从那些限定了链接时间的服务器上下载大文件非常有用。

wget的官方主页:http://www.gnu.org/software/wget/

wget的常见用法
wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:

wget [参数列表] “URL”

用””引起来可以避免因URL中有特殊字符造成的下载出错。

下面就结合具体的例子来说明一下wget的用法。

1、使用wget下载python安装包

wget https://www.python.org/ftp/python/3.6.5/python-3.6.5-macosx10.6.pkg

wget默认会以最后一个符合/的后面的字符来命名下载的文件,我们可以使用参数-O来指定一个新的文件名:

wget -O python.pkg https://www.python.org/ftp/python/3.6.5/python-3.6.5-macosx10.6.pkg

2、断点续传
当文件特别大或者网络特别慢的时候,往往一个文件还没有下载完,连接就已经被切断,此时就需要断点续传。wget的断点续传是自动的,只需要使用-c参数,例如:

wget -c https://www.python.org/ftp/python/3.6.5/python-3.6.5-macosx10.6.pkg

使用断点续传要求服务器支持断点续传。-t参数表示重试次数,例如需要重试100次,那么就写-t 100,如果设成-t 0,那么表示无穷次重试,直到连接成功。-T参数表示超时等待时间,例如-T 120,表示等待120秒连接不上就算超时。

3、批量下载
如果有多个文件需要下载,那么可以生成一个文件,把每个文件的URL写一行,例如生成文件download.txt,然后用命令:

wget -i download.txt

这样就会把download.txt里面列出的每个URL都下载下来。(如果列的是文件就下载文件,如果列的是网站,那么下载首页)

4、后台下载

wget -b https://www.python.org/ftp/python/3.6.5/python-3.6.5-macosx10.6.pkg

5、限速

wget --limit-rate=200k https://www.python.org/ftp/python/3.6.5/python-3.6.5-macosx10.6.pkg

This post has already been read 106 times!

Related posts

RSS 2.0 | leave a response | trackback

发表评论