Coding
文章平均质量分 67
写代码
Eva_Hua
机器学习,深度学习,图像处理
展开
-
单进程子进程超时处理方法
建立一个守护进程池。由守护进程新建一个执行任务的进程,并监控执行进程的返回值,如果返回超时,则杀掉执行进程。原创 2022-08-18 22:26:46 · 460 阅读 · 0 评论 -
jieba-analysis java内存占用高
最近项目用到了jieba分词和关键词提取,由于python版本性能较差转到了java版本。github地址:GitHub - huaban/jieba-analysis: 结巴分词(java版)测试关键词提取发现处理50万条数据内存居高不在有9个g,后来定位到了分词模块(关键词提取首先要对文本分词),循环50万次发现内存居高不下。用MAT工具分析了一番,发现占用最大的对象也只有72m, 离9g差的远。尝试执行jar包的时候限制内存解决:java -Xms512m -Xmx512m jieba-analysi原创 2022-06-22 20:58:57 · 449 阅读 · 0 评论 -
jieba中的正则表达式
jieba是一个十分常见的自然语言处理包,功能包括:分词,提取关键词等等,具体看他们的官方页面,下面以jieba中的正则表达式为例子,介绍一些常见的正则公式GitHub - fxsjy/jieba: 结巴中文分词https://github.com/fxsjy/jiebare_userdict = re.compile('^(.+?)([0-9]+)?([a-z]+)?$', re.U)该正则项是jieba加载自定义函数load_userdict过滤文本使用,下面看看效果结果:word = '新灌病毒原创 2022-06-14 17:22:38 · 851 阅读 · 0 评论 -
Python正则表达式——re模块基础功能
python正则表达式原创 2022-06-10 11:05:41 · 211 阅读 · 0 评论 -
hihocoder 练习 A+B
hihocoder 练习 A+B练习,分析cin.get();和cin >> 差别原创 2016-04-15 15:08:38 · 358 阅读 · 0 评论 -
hiho练习“Drinking Game"二分搜索
hiho讨论区有关于这个问题求解思路的非常详细的解释,我只记录下处理这类问题的自己的一点思路想法。一:题目求解思路1,题目求解:T最小多少的时候,Ho会赢,写成式子就是,求 min T 使得f(T)=score>N/2 (N是总比赛轮数),这个优化问题有以下两点要思考。1)f(T)=score,这个函数如何实现?int f(int T, vector D){int原创 2016-04-16 12:06:53 · 419 阅读 · 0 评论 -
hiho7:#1014 : Trie树
一:构造数据结构1,对于每一个节点,需要存放该节点字母char,该节点的26个孩子节点Trie *next[26],过该节点的字母数int;,2,数据结构构造如下:struct Trie{ char ch; int cnt; Trie *next[26]; Trie() { cnt = 0; //用来记住过该节点的单词个数,过一个单词加一; for (原创 2016-05-11 18:17:43 · 311 阅读 · 0 评论 -
hihocoder:1032 : 最长回文子串
一、问题描述现给定一个已知的字符串str[],现在想要在O(n)的时间复杂度之内求出一个最长的回文子字符串(正着和倒着顺序读一致)。Manacher最早发现了可以用O(n)的时间复杂度来解决该问题,所以这种方法称之为Manacher算法。二、符号说明P[]存放的是回文子串的半径三、Manacher算法主要思想Man原创 2016-06-04 10:39:52 · 287 阅读 · 0 评论