java
萌萌哒二狗子
此人很勤劳,什么都没有写
展开
-
JAVA-使用前缀树(Tire树)实现敏感词过滤、词典搜索
简介有时候需要对用户输入的内容进行敏感词过滤,或者实现查找文本中出现的词典中的词,用遍历的方式进行替换或者查找效率非常低,这里提供一个基于Trie树的方式,进行关键词的查找与过滤,在词典比较大的情况下效率非常高。Trie树Trie树,又叫前缀树,多说无益,直接看图就明白了词典:[“猪狗”, “小狗”, “小猫”, “小猪”, “小屁孩”, “垃圾”, “狗东西”]Tire数据结构:余弦相似度private static double getSimilarity(String doc1, Str原创 2020-10-21 09:46:37 · 1548 阅读 · 0 评论 -
JAVA 别再问为什么CPU占用率100%
简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,身在nlp小组,自然要接触很多模型,我的任务就是tensoflow模型的工程部署,开发完成之后,发布到服务器上发现CPU占用一直是100%,糟了,多半是死循环的感觉。排查步骤1. 查看服务PIDjps服务kg_deep_tuple_extraction.jar是我们的服务,PID为316602. 使用top -p查看资...原创 2019-10-21 17:09:07 · 768 阅读 · 0 评论 -
JAVA-SpringBoot+JPA+Druid多数据源配置完全版+有坑提示
SpringBoot+JPA+Druid多数据源配置完全版+有坑提示简介多数据配置需要注意的点(坑)体会参考简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,手头上的项目(crud项目)本来是只连Mysql,现新增了功能需要连Postgre,于是哼哧哼哧开始了JPA的多数据源配置。经历一番轰轰烈烈的搜索,找了好几个多数据源的配置教程,就开始了我的模仿表演。没想到一步一个坑,经过几...原创 2019-07-25 11:15:40 · 4386 阅读 · 0 评论 -
JAVA-简单实现文本相似度计算-余弦相似度
简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发。手上是一个消息监控的项目,需要实时把爬虫组爬到的新闻经过处理入库。今天来了个需求,需要对新闻做一个去重的处理,减少类似新闻的出现。我理性分析一波,应该就是要计算一下文本的相似度嗯嗯。。。那该怎么做呢。。。计算文本相似度方法文本的相似度计算方法可以分为两大类:基于深度学习的方法和基于非深度学习的方法。虽然小的我在自然语言处理与交...原创 2019-07-25 15:51:42 · 6402 阅读 · 0 评论 -
tensorflow1.14-libtensorflow_framework.so.1 cannot open shared object file no such file or directory
简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,身在nlp小组,自然要接触很多模型,我的任务就是tensoflow模型的工程部署,前不久我们开始使用tensorflow1.14,Estimator真香。所以对应Java这边也需要使用tf1.14导入graph,这里就来说说官方jar包的问题。报错Windows下无异常,Linux下服务启动时报:libtensorflow_fr...原创 2019-09-25 16:42:43 · 6950 阅读 · 54 评论