NLP上游任务
Magneto_万磁王
活在当下,大胆去做。
展开
-
爬取中文新闻+正向、逆向最大匹配算法分词+算法优化+P、R、F值评估(完整详细过程+Python源码)
超详细的新闻文本爬取+正向、逆向最大匹配算法分词+P、R、F1值评估+对FMM、BMM的优化+实验所用词典、新闻文本数据集。超简单,能看懂字就能复现!原创 2023-06-04 23:36:28 · 2012 阅读 · 0 评论 -
Python在某种场景下进行重复项寻找
Python特定场景下进行重复项寻找,具体见问题场景原创 2023-04-05 16:21:29 · 100 阅读 · 0 评论 -
Python读取txt每行并写入excel中
Python读取txt每行并写入excel中原创 2023-03-31 15:16:57 · 1674 阅读 · 0 评论 -
Python删除txt文档中含有特定词语的行
Python删除txt文档中含有特定词语的行原创 2023-03-20 18:55:04 · 340 阅读 · 0 评论 -
在txt文本文档每行末尾一个制表符位置按序加入序号
在txt文本文档每行末尾一个制表符位置按序加入序号原创 2023-03-09 22:14:03 · 742 阅读 · 0 评论 -
从txt文本文档中随机读取指定行数不重复写入另一txt文本文档中
从txt文本文档中随机读取指定行数,不重复写入另一txt文本文档中原创 2023-03-09 22:04:24 · 241 阅读 · 0 评论 -
Python统计txt文档每行以指定字符结尾的个数
Python统计txt文档每行内容以指定字符结尾的个数原创 2023-03-02 21:56:06 · 136 阅读 · 0 评论 -
Python预处理丨问答对数据集预处理
问答对数据集有点乱,使用python进行数据预处理,使之变得规范易用原创 2023-03-02 20:58:33 · 408 阅读 · 0 评论 -
提高三元组实体和联系翻译速度的方法
在做三元组翻译的工作时,如果不能通篇翻译,而且数据量很大,可以通过建立翻译字典的方式,提高翻译效率。原创 2023-02-23 20:39:53 · 53 阅读 · 0 评论 -
AttributeError: ‘str‘ object has no attribute ‘leaves‘.python提取三元组报错
解决句法分析树中报错leaves()方法,需要先将字符串结构改成符合的树形结构原创 2023-02-18 20:41:16 · 178 阅读 · 0 评论 -
Python括号替换之“[“、“]“、“(“、“)“/字符串的替换
Python括号替换"["、"]"、"("、")"/字符串的替换原创 2023-02-18 20:23:41 · 1414 阅读 · 0 评论 -
Python实现txt文本文档每行按顺序排列
Python实现txt文本文档每行内容按首字母ASCII码值或者拼音排序原创 2023-02-14 18:07:11 · 2023 阅读 · 0 评论 -
Python中三元组分隔符的替换
Python实现分隔符自由更换,但要注意分隔符的设置不能太随意,以免内容中也有,导致分隔出错!原创 2023-02-14 17:57:49 · 561 阅读 · 0 评论 -
Python将实体1-联系-实体2合成三元组
将实体1、联系、实体2按顺序连接成三元组并保存到新文件中原创 2023-02-14 17:43:51 · 111 阅读 · 0 评论 -
Python三元组处理--根据分隔符拆开三元组
三元组处理过程中,因为涉及到翻译,需要将三元组拆开分别翻译,使用python据分隔符将三元组拆成三部分并分别保存。原创 2023-02-14 16:52:14 · 265 阅读 · 0 评论 -
Python爬取infobox内容并保存为三元组
爬虫爬取百度百科关键词的infobox,并将其保存为三元组的形式原创 2023-02-14 15:31:37 · 691 阅读 · 0 评论 -
Python使用集合将txt文件重复行去除
将文件重复行去除原创 2023-02-14 14:41:00 · 806 阅读 · 2 评论