- 博客(5)
- 收藏
- 关注
原创 图像识别+网络爬虫
思路是当被IP被封禁时,使用selenium框架,去模拟点击显示二维码,二维码图片是以Base64的形式显示,接着暂存到1.png,最后通过预训练的OCR模型进行识别,然后输入,根据网页源代码的关键字,判断验证码是否识别成功。提高了表格录入效率,可节省大量人力。2、OCR能够自动分析文稿的版面布局,自动分栏、并判断出标题、横栏、图像、表格等相应属性,并判定识别顺序,能将识别结果还原成与扫描文稿的版面布局一致的新文本。旧套路,获取每篇文章的子链接,然后分析网页结构,清洗网页源代码,获取文章,然后保存到硬盘。
2023-05-06 16:43:19 904 2
原创 java获取其他线程中的返回值(app开发)
因为一些需求原因,作者这几天,去学习了一下安卓开发,因为没有java基础自己便恶补了一些Java的知识(条件,循环,变量的语法形式,不是很多),在编写安卓程序(前端就是java开发的app界面,后端是一个图像分类的模型)时,遇到了一些问题(自从Android3.0之后网络访问不能在主线程中进行),后来查了一下,大部分网友给出的解释是线程问题。以上就是今天要和大家分享的内容,可能算是独树一帜吧。哈哈,潦草结尾。
2022-08-20 16:39:37 768
原创 成功解决Transformers=4.3.3的管道方式实现模型调用时,AutoConfig不能识别的错误
本人在使用transfromers的管道方式实现情感分类时,调用自己本地预训练模型出现的bug报错如下:原因分析:例如:报错原因是pipelines的__init__.py中的AutoConfig不能被识别。原因猜测:可能transformer4.3.3版本太新,以致于代码不完善。具体原因也不太清楚。我首先没有直接去导入AutoConfig,而是去分析和它类似的类ModelCard,发现这个类在上面导入时导入了,然后我类比将AutoConfig从transformer中导入,并在这个库
2022-07-14 17:01:06 1391
原创 tensorflow.python.framework.errors_impl.InvalidArgumentError: assertion failed
成功解决tensorflow,使用sparse_categorical_crossentropy报错
2022-06-30 10:29:43 1039 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人