文件存到aws的S3后, 调用getimagesize失败分析

一、问题

将图片在windows下用图片查看器修改后,上传到s3中,调用getimagesize获取图片信息总是返回false,其它图片正常;

 

代码如下:

$fileName = 's3://sdk1/20150317/174290_1_1428371.JPG';
$size = getimagesize($fileName);
var_dump($size);

 

以上代码总是输出false。

即部分图片调用成功,部分调用失败;

图片上传后,可以对上传的临时文件调用getimagesize获取图片信息;

PHP的版本为5.6.2

 

二、分析过程:

1、准备知识

先说下PHP中对流的封装,通过函数stream_wrapper_register,我们可以注册一个新的URL,像上面的s3开头的文件;

AWS封装了一套对这类文件的操作,包括读、写、定位、打开目录等函数,这方面资料可以看下PHP文档,AWS的封装代码可以看下AWS的PHP的SDK。

 

通过追代码,发现对S3文件的请求最终会转成一个HTTPS的请求,https://sdk1.s3.cn-north-1.amazonaws.com.cn/20150317/174290_1_1428371.JPG

 

2、代码追踪

看下getimagesize函数的实现,

 

这个是调用php_getimagesize_from_any来实现的,

重要函数为php_getimagesize_from_stream,看下这个函数:

会先读取文件的前三字节,获取文件类型,具体可以看下php_getimagetype函数;

 

如果是jpg类型的图片,会调用php_handle_jpeg函数,

其中函数php_next_marker会读取文件的二进制流当前字节,根据不同字节作不同的处理,

如果当前字节为宏M_APP0至M_APP15,即0xe0到0xef,表示是APP或变量;

 

出问题的图片当前是variable,看下php_skip_variables函数

如果当前是一个变量,则要跳过这个变量,读取下一块信息,这里调用php_stream_seek来进行seek操作,

 

看两块关键代码,上面一段表示seek的位置在已经读取的范围内;

下一块表示这个流不支持seek操作,返回失败;

在我们的例子里,上面表示正常情况,下面表示失败情况的;

 

我们再回到s3的seek操作的封装:

 return $this->cache[self::SEEKABLE] ? fseek($this->stream, $offset, $whence) === 0 : false;

 

即不支持seek,所以失败了;

 

明白了吗,原理就是getimagesize为从文件的二进制流中读取图片信息,而这个信息是文件的位置是不固定的,必须一块一块的解析,正常的图片的相关信息是在文件前8192个字节之内,而

出错的是8192之外的,如果在8192之外的,需要先将文件流定位到相应位置,再从该位置读取信息,而s3开头的路径不支持seek操作,导致PHP读不文件元信息。

 

三、改进方法

改写Stream::seek方法

public function seek($offset, $whence = SEEK_SET)

    {

        if ($whence == SEEK_SET)

        {

            $pos = $this->ftell();

            if ($pos < $offset)

            {

                $this->read($offset - $pos);

            }

        }

        return $this->cache[self::SEEKABLE] ? fseek($this->stream, $offset, $whence) === 0 : false;

转载于:https://www.cnblogs.com/szprg/p/4350985.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要将大文件上传到AWS S3,可以使用AWS提供的multipart上传方法。这个方法允许你将文件分成多个部分来上传,以便在网络不稳定的情况下保证上传的可靠性。以下是一个简单的Node.js示例代码: ```javascript const AWS = require('aws-sdk'); const fs = require('fs'); // AWS S3配置 const s3 = new AWS.S3({ accessKeyId: 'your_accessKeyId', secretAccessKey: 'your_secretAccessKey' }); // 文件上传配置 const uploadParams = { Bucket: 'your_bucket_name', Key: 'your_file_name', Body: '', ContentType: 'your_content_type' }; // 分块上传文件 const fileStream = fs.createReadStream('your_file_path'); fileStream.on('error', function(err) { console.log('Error:', err); }); uploadParams.Body = fileStream; const multipartUpload = new AWS.S3.ManagedUpload({ params: uploadParams, partSize: 5 * 1024 * 1024, // 分块大小,单位:字节 queueSize: 1 // 并发上传文件数量 }); multipartUpload.on('httpUploadProgress', function(progress) { console.log('Progress:', progress); }); multipartUpload.promise().then(function(data) { console.log('Success:', data); }).catch(function(err) { console.log('Error:', err); }); ``` 在上面的代码中,我们使用AWS SDK来创建S3对象,并设置了访问密钥等参数。接着,我们设置了文件上传的配置参数,包括Bucket、Key、Body、ContentType等。最后,我们使用ManagedUpload类实现将文件分块上传到S3的功能,分块大小和并发上传文件数量可以根据实际需求进行调整。在上传过程中,我们可以通过httpUploadProgress事件获取上传进度信息。最后,我们使用promise()方法来等待文件上传完成,并处理上传成功或失败的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值