- 博客(1)
- 资源 (8)
- 收藏
- 关注
原创 【python】用csv包读取tsv文件
python的csv包可以读取csv格式的文件,大家应该都知道~但最近自己有个需求,需要读取tsv文件,为此百度了下,发现网上并没有用python基础包直接读入tsv文件的方法,但是可以安装Pandas模块用来读取tsv格式文件。但是csv与tsv在本质上并没有区别,为嘛为了tsv要安装个Pandas包,强迫症受不了~ csv与tsv区别tsv和csv都是以纯文本文件存储的电子表格...
2018-12-22 15:34:13 10237 2
基于fastText的问答系统用户意图识别与关键词抽取研究_代令令.caj
基于fastText的问答系统用户意图识别与关键词抽取研究_代令令.caj,讲述如何用fastText来实现问答系统和用户的意图识别
2019-08-30
GENIA corpus3.02p生物医学实体识别语料库
GENIA语料库是为GENIA项目编写并标注的最初的生物医学文献集合。这个语料库是为了发展和评估分子生物学信息检索及文本挖掘系统而创建的。这个语料库包含1999条Medline的摘要,这些摘要是由PubMed按照human、blood cells以及transcription factors三个医学主题词(medical subject heading terms )为搜索条件搜索到的。这个语料库已经被按照不同级别的语言信息、语义信息进行标注。
2018-04-19
基于文本相似度的自动文摘评论
基于文本相似度的自动文摘评论
讨论了现有的自动文摘评价方法, 并具体分析了内部评价方法的缺陷, 由此提出了基于文本相似度的自动文摘评价方法。同时, 通过基于VSM( 支持向量机) 相似度和基于语义相似度两种相似度方法来比较评价
方法的性能。实验表明, 基于相似度的方法实现简单、效果良好, 是一种更接近自然模型的评价方法
2016-12-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人