- 博客(4)
- 资源 (1)
- 收藏
- 关注
python re.compile()和findall() sub
https://blog.csdn.net/sjyttkl/article/details/84853000re.compile 函数compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。语法格式为:re.compile(pattern[ , flags])参数: pattern...
2019-12-23 22:21:35 765
原创 fasttext算法原理及使用
1. FastText原理fastText是一种简单高效的文本表征方法,性能与深度学习比肩。fastText的核心思想就是:将整篇文档的词及n-gram向量叠加平均得到文档向量,然后使用文档向量做softmax多分类。这中间涉及到两个技巧:字符级n-gram特征的引入以及分层Softmax分类。主要功能在于:文本分类:有监督学习 词向量表征:无监督学习1.1 模型框架(Model a...
2019-12-21 22:30:17 3732 1
原创 Python eval()函数
eval() 函数用来执行一个字符串表达式,并返回表达式的值。通常,将字符串的内容表示为表达式时,便需要使用eval() 函数,特别是批量表示变量名或者dataframe内容时。eval(expression[, globals[, locals]])参数expression -- 表达式。 globals -- 变量作用域,全局命名空间,如果被提供,则必须是一个字典对象。...
2019-12-10 20:27:14 239
原创 jieba 中文分词介绍及使用
目录基本介绍功能及使用1. 分词2. 添加自定义词典2.1 载入词典2.2 调整词典3. 关键词提取3.1 基于 TF-IDF 算法的关键词抽取3.2 基于 TextRank 算法的关键词抽取4. 词性标注5. 并行分词6. kenize:返回词语在原文的起止位置基本介绍支持 3 种分词模式 1)精确模式:将句子最精确的分开,适...
2019-12-09 21:13:09 3130 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人