python文本查重_GitHub - LiuYinCarl/check_homework: 文本查重工具

TODO

-[ ] 处理不同时区,时间格式不同的邮件,当前代码无法处理不同时间格式的邮件,

一旦出现格式与所检测格式不同的邮件,Celery就会崩溃

-[ ] 设计一个更好的查重算法

-[ ] 在一次下载邮件的过程中,如果已经下载了的话,在Celery未重启的情况下再次下载,会出现错误

-[ ] 在helper模块中将发件学生的Email和attachments用dict联系起来,保存到redis中

(一对多映射,还要解决attachment名称的更新问题 )

-[ ] 在在线批阅模式中以网页嵌入PDF的方式实现,预设的模式是页面左侧是pdf文件,右侧是评分模块和查重的一些信息

-[ ] 文件上上传的时候上传JPG就会为None,不知道为啥

DONE

-[x] 附件名符合规格,在限制时间之内的邮件的下载

-[x] word内容的提取

-[x] 查重结果的导出

开发过程中用到的资料

各大免费邮箱提供的POP3,SMTP,IMAP地址

编写收发邮件模块参考的资料

编写前端文件上传代码时参考的资料

学习过程中发现官网的Demo并不是可以直接拿来用的,需要做修改

这个Demo也存在问题,比如不能上传JPG文件,前端上传的过程中提取不到文件名,会是一个空值,猜测可能是组件内部屏蔽或者代码里未设置好

注意事项

邮箱列表中的第一个邮件的编号是1

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值