thinkphp 文件上传 切片_字节跳面试官,我也实现了大文件上传和断点续传

前言

前几天看到一个文章,感触很深

字节跳动面试官:请你实现一个大文件上传和断点续传https://juejin.im/post/5dff8a26e51d4558105420ed 作者从0实现了大文件的切片上传,断点续传,秒传,暂停等功能,深入浅出的把这个面试题进行了全面的剖析

彩虹屁不多吹,我决定蹭蹭热点,录录视频,把作者完整写代码的过程加进去,并且接着这篇文章写,所以请看完上面的文章后再食用,我做了一些扩展如下

  1. 计算 hash耗时的问题,不仅可以通过 web-workder,还可以参考 React的 FFiber架构,通过 requestIdleCallback来利用浏览器的空闲时间计算,也不会卡死主线程

  2. 文件 hash的计算,是为了判断文件是否存在,进而实现秒传的功能,所以我们可以参考 布隆过滤器的理念, 牺牲一点点的识别率来换取时间,比如我们可以 抽样算hash

  3. 文中通过 web-workder让 hash计算不卡顿主线程,但是大文件由于切片过多,过多的 HTTP链接过去,也会把浏览器打挂 (我试了4个G的,直接卡死了), 我们可以通过控制异步请求的 并发数来解决,我记得这也是头条的一个面试题

  4. 每个切片的上传进度不需要用表格来显示,我们换成方块进度条更直观一些(如图)

  5. 并发上传中,报错如何重试,比如每个切片我们允许重试两次,三次再终止

  6. 由于文件大小不一,我们每个切片的大小设置成固定的也有点略显笨拙,我们可以参考 TCP协议的 慢启动策略, 设置一个初始大小,根据上传任务完成的时候,来动态调整下一个切片的大小, 确保文件切片的大小和当前网速匹配

  7. 小的体验优化,比如上传的时候

  8. 文件碎片清理

0cd7e19cbcfa6f82e3f816818f3412dd.gif

已经存在的秒传的切片就是绿的,正在上传的是蓝色的,并发量是4,废话不多说,我们一起代码开花

时间切片计算文件hash

其实就是 time-slice概念, ReactFiber架构的核心理念,利用浏览器的空闲时间,计算大的diff过程,中途有任何的高优先级任务,比如动画和输入,都会中断diff任务, 虽然整个计算量没有减小,但是大大提高了用户的交互体验

这可能是最通俗的 React Fiber(时间分片) 打开方式](https://juejin.im/post/5dadc6045188255a270a0f85)271748819650daa52e777a2114b75ae5.png

window.requestIdleCallback()方法将在浏览器的空闲时段内调用的函数排队。这使开发者能够在主事件循环上执行后台和低优先级工作 requestIdelCallback执行的方法,会传递一个 deadline参数,能够知道当前帧的剩余时间,用法如下

requestIdelCallback(myNonEssentialWork);

function myNonEssentialWork (deadline) {

// deadline.timeRemaining()可以获取到当前帧剩余时间

// 当前帧还有时间 并且任务队列不为空

while (deadline.timeRemaining() > 0 && tasks.length > 0) {

doWorkIfNeeded();

}

if (tasks.length > 0){

requestIdleCallback(myNonEssentialWork);

}

}

deadline的结构如下

interface Dealine {

didTimeout: boolean // 表示任务执行是否超过约定时间

timeRemaining(): DOMHighResTimeStamp // 任务可供执行的剩余时间

}

b5c01676062d6079f5f8112af14f5a16.png

该图中的两个帧,在每一帧内部, TASKredering只花费了一部分时间,并没有占据整个帧,那么这个时候,如图中 idle period的部分就是空闲时间,而每一帧中的空闲时间,根据该帧中处理事情的多少,复杂度等,消耗不等,所以空闲时间也不等。

而对于每一个 deadline.timeRemaining()的返回值,就是如图中, IdleCallback到所在帧结尾的时间(ms级)

我们接着之前文章的代码,改造一下 calculateHash

async calculateHashIdle(chunks) {

return new Promise(resolve => {

const spark = new SparkMD5.ArrayBuffer();

let count = 0;

// 根据文件内容追加计算

const appendToSpark = async file => {

return new Promise(resolve => {

const reader = new FileReader();

reader.readAsArrayBuffer(file);

reader.onload = e => {

spark.append(e.target.result);

resolve();

};

});

};

const workLoop = async deadline => {

// 有任务,并且当前帧还没结束

while (count < chunks.length && deadline.timeRemaining() > 1) {

await appendToSpark(chunks[count].file);

count++;

// 没有了 计算完毕

if (count < chunks.length) {

// 计算中

this.hashProgress = Number(

((100 * count) / chunks.length).toFixed(2)

);

// console.log(this.hashProgress)

} else {

// 计算完毕

this.hashProgress = 100;

resolve(spark.end());

}

}

window.requestIdleCallback(workLoop);

};

window.requestIdleCallback(workLoop);

});

},

计算过程中,页面放个输入框,输入无压力,时间切片的威力

0be06d9f18173341c925ea41f1020094.png上图是 React15和 Fiber架构的对比,可以看出下图任务量没变,但是变得零散了,不混卡顿主线程

抽样hash

计算文件 md5值的作用,无非就是为了判定

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值