工具
杨建利
想不出来,简介是什么,,,
展开
-
tesseract box文件的制作
tesseract 是谷歌开源的一款主要识别印刷体的ocr软件,目前的了解,针对与纯色背景下的文字识别,其准确度可以达到商用级别,并且着重强调,4.x版本增加了LSTM技术,所以在处理文字的连续性,尤其是英文文字的分割来看,效果比3.x版本要好得多.对tesseract的学习主要分为两大部分,第一是识别,第二是训练新语言包因为tessercat本身接近于开箱即用的一种开源软件,它目前训...原创 2018-12-29 16:17:24 · 3443 阅读 · 0 评论 -
faiss 安装教程
参考:https://github.com/facebookresearch/faiss在工作中,尤其是在推荐系统中,我们经常需要处理一些向量关系比对的问题。比如说,在进行基于用户的协同过滤的时候,我们需要提取每个用户的向量,并且根据某个用户的向量来查询其临近的k个向量,然后我们可以根据这k个用户看过的内容,推荐给这个用户。这时候,随着用户数量的增加,获取临近的k个向量的工作会相当耗时。所以...原创 2019-04-29 17:16:22 · 3521 阅读 · 4 评论 -
服务器间文件传输方案[nc命令]
1)端口扫描nc -v -w 2 192.168.2.34 -z 21-24 nc: connect to 192.168.2.34 port 21 (tcp) failed: Connection refused Connection to 192.168.2.34 22 port [tcp/ssh] succeeded! ...原创 2019-05-24 18:17:40 · 687 阅读 · 0 评论