文本处理
文章平均质量分 62
hisrDT
这个作者很懒,什么都没留下…
展开
-
暴力强行复制网页内容,终极手法
1.按F12,缩放网页到最小全屏显示,复制正文部分的html源码。2.python处理文本。3.处理结果不理想的,要自己微调,手动加上。有时间再优化原创 2024-01-02 04:00:13 · 2218 阅读 · 0 评论 -
数据标注--文本行检测标注项目,结果文件 json 数据重组
先记录1条吧,稍后再修改文章文本行检测标注-6931.保存日志2.源码# -*- coding:utf-8 -*-import jsonimport sysimport osimport shutilfrom pip._vendor.distlib.compat import raw_inputdef mod_jsonVal(file,logFlag,logFile): with open(file,encoding="utf-8") as f: .原创 2021-12-06 18:05:43 · 535 阅读 · 0 评论