这款功能强大的 文本识别系统 开源了!

微信搜索逆锋起笔关注后回复编程pdf

领取编程大佬们所推荐的 23 种编程资料!

开源最前线(ID:OpenSourceTop)猿妹整编

正文

大家好,今天推荐一个文本识别系统。

这是我目前见过的最好的文本识别系统。功能完整,代码结构清晰。值得推荐。

说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。

目前,pyWhat已经在Github上标星3.9K,累计分支 127 个。

同搜索不同,pyWhat 会自动进行文本分断,例如 5f4dcc3b5aa765d61d8327deb882cf99 如果没有完全匹配的信息格式,pyWhat 会切断文本进行多个不同字符串长度的完全匹配

示例

比如当你遇到了一个名为 WantToCry的新恶意软件,你回想起 Wannacry 并记得它被停止是因为研究人员在代码中发现了一个终止开关。

当一个硬编码到 Wannacry 的域被注册时,病毒就会停止。你可以通过这个工具识别恶意软件中的所有域,并使用域注册器 API 来注册所有域。如果 Wannacry 再次发生,你就可以在几分钟内阻止它,而不是几周。

更快地分析 Pcap 文件

假设你有一个.pcap来自网络攻击的文件。What可以识别并快速找到以下内容:

  • 所有哈希

  • 信用卡号码

  • 加密货币地址

  • 联系方式等

简而言之,只要你想要在一个文件中找出所有有用的结构化数据,pywhat都适合你。

源码获取

扫码下方二维码,后台回复【文本识别】即可获取

版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

逆锋起笔是一个专注于程序员圈子的技术平台,你可以收获最新技术动态最新内测资格BAT等大厂大佬的经验增长自身学习资料职业路线赚钱思维,微信搜索逆锋起笔关注!

往日文章:

炸了,开源社区应该用中文吗?

免费开源的 CentOS 替代方案,附地址

微软又一开源力作!专门针对老旧照片

一个 Java 开源商城项目,值得好好研究一下!

上架 Steam 一周的付费游戏,在 GitHub 开源了!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值