php断点续传下载大文件
Web服务器(如Apache)会默认开启对断点续传的支持。因此,如果直接通过Web服务器来提供文件的下载,可以不必做特别的配置,即可享受到断点续传的好处。但是这些文件直接通过Web服务器来提供下载,后端脚本无法对这个下载过程进行控制。对于仅提供公开、静态文件的网站来说不是问题,但对于需要提供私有、动态文件的网站来说,直接通过Web服务器来提供下载就无法满足需求了。
原理
Http协议规定了如何传输某个资源的一部分,而不是全部。比如,有一个文件的大小是1000字节,浏览器可以只请求该文件的前300个字节,或者只请求第500到第1000个字节。通过这种方式,就可以不必在一次请求中传输某个资源的全部内容,而是发起多次请求,每次仅请求其中的一部分内容。等所有这些请求都返回之后,再把得到的内容一块一块的拼接起来得到完整的资源。
实现断点续传就是要利用http协议的上述特性。当用户暂停下载的时候,浏览器会记录已经下载到什么位置,当用户在未来某一时间恢复下载时,就可以从上次暂停的位置继续下载,而不必从头开始。
实现
由于部分传输不是强制的,服务器可以支持也可以不支持,所以,我们需要在程序中告诉浏览器,它请求的资源是否支持部分传输。这可以通过设置HTTP的 Accept-Ranges 响应头信息来实现。PHP代码如下:
header('Accept-Ranges: bytes');
Accept-Ranges: bytes 告诉浏览器,该资源支持以字节为单位的部分传输。这个响应头需要附加在支持部分传输的所有资源上。
当接受到一个请求时,我们需要从浏览器的请求中提取浏览器具体是在请求资源的哪一个部分。这个信息是通过 Range 请求头来传递的。在PHP中,它被存储在$_SERVER[‘HTTP_RANGE’]中。我们需要检查这个变量是否定义了,如果定义了,则使用该值,否则,就将range设为整个资源。
代码如下:
$range = "0-". ($content_length-1);
if(isset($_SERVER['HTTP_RANGE'])){
$range = $_SERVER['HTTP_RANGE'];
}
接下来,就需要分析 $range 的值,来决定返回资源的哪一部分内容。可能的取值示例:
代码如下:
100-200 // 第100到第200字节
500- // 第500字节到文件末尾
-1000 // 最后的1000个字节
这里需要注意,得到一个Range之后,你需要对它的取值进行检验,包括:
1.开始位置非负
2.结束位置需要大于开始位置
3.开始位置需要小于文件长度减一 (因为这里的位置索引是从0开始的)
4.若结束位置大于文件长度减一,则需要把它的值设置为文件长度减一
如果Range的取值不合法,则需要终止程序并告知浏览器,代码如下:
header('HTTP/1.1 416 Requested Range Not Satisfiable');
为了保持文章简洁,具体的校验代码这里就不提供了。下面假定你已经校验了Range的取值,并得到了 $start 和 $end 两个变量,分别表示开始位置和结束位置。
接下来要做的就是把文件的对应部分的内容发送给浏览器。不过要注意的是,这里涉及到需要发送多个HTTP响应头信息,代码如下:
header('HTTP/1.1 206 Partial Content');
header('Accept-Ranges: bytes');
header("Content-Range: bytes $start-$end/$filesize");
/* 输出文件的指定部分 */
$length = $end - $start + 1;
header("Content-Length: $length");
这里的$length需要注意一下,它的取值是本次传输的内容的长度,而不是整个文件的长度。另外需要注意的一点是,这里的HTTP状态码是206,不是200。
总结
文件下载的断点续传实际上是利用了HTTP协议中对传输部分文件的支持。而HTTP协议的这一特性不仅可以用于实现断点续传,客户端程序也可以利用它来实现多线程下载。
在实现断点续传的过程中,需要注意正确设置各种HTTP头信息。错误的头信息将导致用户下载到的文件损坏,无法使用。
php断点续传下载代码
<?php
$sourceFile = “1.tmp”; //要下载的临时文件名
$outFile = “用户订单.xls”; //下载保存到客户端的文件名
$file_extension = strtolower(substr(strrchr($sourceFile, “.”), 1)); //获取文件扩展名
//只能下载.tem / .txt / .rar / .pdf / .doc / .zip文件
if (!preg_match(“/[tmp|txt|rar|pdf|doc|zip]/”, $file_extension))exit (“非法资源下载”);
//检测文件是否存在
if (!is_file($sourceFile)) {
die(“<b>404 File not found!</b>”);
}
$len = filesize($sourceFile); //获取文件大小
$filename = basename($sourceFile); //获取文件名字
$outFile_extension = strtolower(substr(strchr($outFile, “.”), 1)); //获取文件扩展名
//根据扩展名 指出输出浏览器格式
switch ($outFile_extension) {
case “exe” :
$ctype = “application/octet-stream”;
break;
case “zip” :
$ctype = “application/zip”;
break;
case “mp3″ :
$ctype = “audio/mpeg”;
break;
case “mpg” :
$ctype = “video/mpeg”;
break;
case “avi” :
$ctype = “video/x-msvideo”;
break;
default :
$ctype = “application/force-download”;
}
//开始写Header
header(“Cache-Control: public”);
//设置输出浏览器格式
header(“Content-Type: $ctype”);
header(“Content-Disposition: attachment; filename=” . $outFile);
header(“Accept-Ranges: bytes”);
//设置文件大小
//header('Content-Length: ' . filesize($sourceFile));
$size = filesize($sourceFile);
//如果有$_SERVER['HTTP_RANGE']参数
if (isset ($_SERVER['HTTP_RANGE'])) {
/* Range头域 可以请求实体的一个或者多个子范围。
* 例如,
* 表示头500个字节:bytes=0-499
* 表示第二个500字节:bytes=500-999
* 表示最后500个字节:bytes=-500
* 表示500字节以后的范围:bytes=500-
* 第一个和最后一个字节:bytes=0-0,-1
* 同时指定几个范围:bytes=500-600,601-999
* 但是服务器以忽略此请求头,如果无条件GET包含Range请求头,响应会以状态码206(PartialContent)返回而不是以200 (OK)。
*/
// 断点后再次连接 $_SERVER['HTTP_RANGE'] 的值 bytes=4390912-
list ($a, $range) = explode(“=”, $_SERVER['HTTP_RANGE']);
//if yes, download missing part
str_replace($range, “-”, $range); //这句干什么的呢。。。。
$size2 = $size -1; //文件总字节数
$new_length = $size2 - $range; //获取下次下载的长度
header(“HTTP/1.1 206 Partial Content”);
header(“Content-Length: $new_length”); //输入总长
//Content-Range: bytes 4908618-4988927/4988928 95%的时候
header(“Content-Range: bytes $range$size2/$size”);
} else {
//第一次连接
$size2 = $size -1;
header(“Content-Range: bytes 0-$size2/$size”); //Content-Range: bytes 0-4988927/4988928
header(“Content-Length: ” . $size); //输出总长
}
//打开文件
$fp = fopen(“$sourceFile”, “rb”);
//设置文件读指针位置
fseek($fp, $range);
//虚幻输出
while (!feof($fp)) {
//设置文件最长执行时间
set_time_limit(0);
//输出文件
//print (fread($fp, 1024 * 8));
echo fread($fp,1024*8);
ob_flush(); //释放php缓冲区数据到web服务器
flush(); //刷新web服务器缓冲区到浏览器,即把不在缓冲中的或者说是被释放出来的数据发送到浏览器
}
fclose($fp);
exit ();
?>
HTML a标签链接直接下载文件
通常情况下,为文件添加链接后,用户可以通过点击链接,直接将文件下载到本地,如下载zip压缩文件等;
但是下载某些文件时,比如 txt, png, jpg等浏览器支持直接打开的文件,浏览器不会执行下载任务,而是会直接打开文件,这个时候就需要给a标签添加一个属性“download”;
代码如下:
<a href="1.zip" download="1.zip">click to download</a>
这里 download 也可以不写任何信息,会自动使用默认文件名。
资源整理自
http://www.thinkphp.cn/topic/45138.html
https://blog.csdn.net/ldl_xz/article/details/51804379
https://www.cnblogs.com/ryanzheng/p/11961784.html