![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
常用工具toolikt
文章平均质量分 96
Macropodus
最后一次为理想而战。安知南山桂,绿叶垂芳根。何须浅碧深红色,自是花中第一流。
展开
-
常用算法实现(一)——TF-IDF
一.概述TF-IDF(英文名: term frequency-inverse document frequency),引用百度百科的说法: TF-IDF是一种用于信息检索与数据挖掘的常用加权技术。 TF意思是词频(Term Frequency),用在句子构成的语料中,就是字或者词在文本中出现的频率。 一般计算是: TF =...原创 2019-06-27 23:37:38 · 1068 阅读 · 0 评论 -
常用算法实现(三)——递归生成句子(模板匹配func_recursive)
一.概述(根据模板生成同义句)递归生成句子(模板匹配func_recursive),在计算机科学与技术中,函数Func调用函数本身(直接或者间接),称为递归函数。 实现和理解起递归函数有时会有点小困难,不过成功运行起来会很有意思呀。 python中递归函数使用栈存储,所以会有限制,一般来说,一次递归超过1000会报错; ...原创 2019-07-03 20:48:02 · 606 阅读 · 0 评论 -
常用算法实现(四)——python中文数字转阿拉伯数字
一.概述(汉语数字转阿拉伯数字) 在自然语言处理NLP任务中,汉语数字转阿拉伯数字是时常使用到的一个功能。 本文中的实现方式大同小异,不过支持小数。 主要思想还是根据万亿、亿、万等单位三划分,依次按照权位转化。 github地址:https://github.com/yongzhuo/Tookit-Sihui/bl...原创 2019-07-03 20:56:08 · 4202 阅读 · 3 评论 -
常用算法实现(五)——python阿拉伯数字转中文
一.概述(阿拉伯数字转汉语数字)在自然语言处理NLP任务中,阿拉伯数字转汉语数字是时常使用到的一个功能,但还是比较少的吧。主要思想还是根据千兆、千亿、千万、千等单位三划分,依次按照权位转化。 github地址:https://github.com/yongzhuo/Tookit-Sihui/blob/master/tookit_...原创 2019-07-03 21:02:25 · 6310 阅读 · 7 评论 -
常用python算法实现(二)——前缀树TrieTree(包含删除节点)
一.概述(多个关键词-实体检索-查询) TrieTree(前缀树),又被称为字典树、单词查找树,是一种比较常见的数据存储结构与算法。 顾名思义,前缀树便是公共的字符只保存一次的多路树。如你所见,它的基本思想是以时间换空间,时间复杂度为logN,效果还不错。不过,我觉得它应用广泛的另外一个原因是它保存了字符的顺序。 应用: 字符串检索、查询...原创 2019-06-28 21:55:28 · 1494 阅读 · 0 评论 -
TF-IDF计算比较compare(gensim、jieba、sklearn、手工的异同)
一.概述TF-IDF(英文名: term frequency-inverse document frequency),引用百度百科的说法: TF-IDF是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),用在句子构成的语料中,就是字或者词在文本中出现的频率。一般计算是: TF =...原创 2019-07-31 23:00:37 · 2666 阅读 · 0 评论 -
AI文本科学计算器(calculator-sihui-python)混合四则运算介绍
一.科学计算器与混合四则运算(calculator-sihui)概述 计算是一个十分重要的技能(Calculateand Compute),语音转文本后的混合四则运算(the four fundamental operations of arithmetic),或者是更加高级点的是十分必要的,尤其是在这个人工智能迅猛发展的今天。 语音转文本暂且不提,AI时代语音助...原创 2019-08-22 01:36:10 · 1209 阅读 · 0 评论