![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 87
远行人_Xu
nlp工程师
展开
-
【无标题】
首发地址: https://zhuanlan.zhihu.com/p/451144980读了复旦大学发的文章《Template-free Prompt Tuning for Few-shot NER》,是用小样本思路prompt做ner的新方法,就是没开源代码很遗憾,导致有的小问题就是不明白,通过给作者发邮件弄明白了。目录:1、原有的prompt做ner的方式,及弊端;2、该文章的思路;3、该文章的思路的主要问题的解决思路;4、我对该文章的思考。1、原有的prompt做ner的方式,及弊端:原创 2021-12-29 16:02:18 · 913 阅读 · 0 评论 -
py2neo基本操作(v4版本,亲测有效)
知乎写的,懒得搬运了:https://zhuanlan.zhihu.com/p/83032004原创 2020-11-13 18:17:01 · 1187 阅读 · 0 评论 -
python操作图数据库neo4j的两种方式
在知乎写的,懒得搬运了。https://zhuanlan.zhihu.com/p/82958776原创 2020-11-13 18:15:54 · 291 阅读 · 0 评论 -
【笔记】2020语言与智能技术竞赛冠军团队分享
回访地址: https://blog.csdn.net/weixin_38100489/article/details/109625897未完待续感觉请用请点赞,谢谢原创 2020-11-12 18:33:13 · 300 阅读 · 0 评论 -
EDA 文本增强(和我的思考)
EDA: Easy Data Augmentation文章结构:原理、设置参数、代码。一、原理文章来源:https://arxiv.org/abs/1901.11196通过对文本中部分词的改变,达到重写文本,让样本数量增多的目的,并增强对应训练模型的泛化能力。具体有四种方式:1、同义词替换:在句子中的词中随即选择n个非停用词。将每个词换成一个随即的同义词。2、随机插入:在句子中的词中随即选择一个非停用词的一个随即同义词,将其插入句中的随机位置。做n次。3、随机交换:在句子中随机选两个词做交换原创 2020-08-27 14:26:27 · 944 阅读 · 3 评论 -
社区问答(Q-Q匹配问答)文本相似度计算的四类方法
本文是我自己的思考。如果有纰漏,欢迎大佬们在评论区怼我,帮助我进步~~智能问答的其中一类 社区问答(也就是Q-Q匹配问答)的第一个环节是计算问题的文本语义向量表示;第二个环节就是通过向量的匹配得到最佳的问题候选。下面是我知道的做第二个环节的4类方式。(不是四种,而是四类。)第0种、直接两两做bert最慢的方式。复杂度是O(n)。每次两两匹配的耗时都要做一次bert(可以转tensorflow的estimator做成实时的)。也是耗时最长的方式。如果匹配的q-q对较少,是可以直接用bert类的模型直接原创 2020-07-02 16:48:10 · 1264 阅读 · 0 评论 -
[对应示例]λ-算子、λ-DCS、SPARQL、Cypher
举例:people who had children born in Seattle 对应的λ-算子:λx.∃y.Chilren( x , y ) ∧ PlaceOfBirth( y , Seattle ) λ-DCS:Chilren.PlaceOfBirth.SeattleSPARQL:prefix ns: <神马神马>select ?s1where { ?s1 ns: Chilren ?s2, ?s2 ns: PlaceOfBirth原创 2020-06-03 10:06:20 · 267 阅读 · 0 评论 -
知识图谱问答的思路 -- 笔记2
首发地址:https://zhuanlan.zhihu.com/p/144311555本文是段楠《智能问答》一书第五章“知识图谱问答”的笔记。(其中有略的部分。同时夹私货。)本文和姊妹篇《知识图谱问答的思路 – 笔记1》是两本书的笔记,不是前后两部分。二者思路有同有异,可搭配食用。)本文(确切的说是这本书的这一章)的信息量很大,一定要先把握大逻辑之后,再细扣具体的实现方式。本人水平有限(。。真的。。)导致书中好几处不懂的,大佬读到我下文说没看懂的地方,还请告知的评论区,真的谢谢了!1、知识图谱和语义原创 2020-06-01 11:34:53 · 940 阅读 · 0 评论 -
【知识图谱应用】实体链接的思路
首发:https://zhuanlan.zhihu.com/p/144183030本文是段楠《智能问答》一书第三章“实体链接”的笔记。(其中有略的部分。同时夹私货。)有不对的地方请评论告诉我哈,谢谢。实体链接(entity linking)是指将文本中出现的实体提及(entity mention)关联到对应在知识图谱中的相关实体的任务。具体步骤为,先生成候选实体,然后给候选实体排序,然后取权重查过阈值的排名第一的候选实体作为实体链接的结果。另外还有知识图谱中对应不上的情况,称为无链接指代预测。1原创 2020-05-28 15:37:04 · 1099 阅读 · 4 评论 -
知识图谱问答的思路 -- 笔记1
收发地址:https://zhuanlan.zhihu.com/p/143722983本文是赵军《知识图谱》一书第十章“知识问答与对话”的笔记。(我觉得用处小的略。同时夹私货。)有不对的地方请评论告诉我哈,谢谢。一、知识图谱问答(KGQA)1、基于语义解析的方法(Semantic Parsing)将自然语言转化成结构化查询语言,如SPARQL、CQL ( cypher )等。(私货1:另外关键词可以是Seq2Sql、Text2Sql等。当然这输出是SQL,但思路完全可以用到KGQA。)首届中文原创 2020-05-26 19:51:00 · 621 阅读 · 0 评论 -
NLP基本任务
转载自:http://www.zhuzongkui.top/nlp_base_task/1、词法分析(Lexical Analysis):对自然语言进行词汇层面的分析,是NLP基础性工作分词(Word Segmentation/Tokenization):对没有明显边界的文本进行切分,得到词序列新词发现(New Words Identification):找出文本中具有新形势、新意义或是新用法的词 形态分析(Morphological Analysis):分析单词的形态组成,包括词干(转载 2020-05-26 13:58:08 · 316 阅读 · 0 评论 -
【智能问答】社区问答(CQA)的思路
详详细细的记载了我做CQA时的思考:https://zhuanlan.zhihu.com/p/84694993原创 2020-05-20 17:24:42 · 442 阅读 · 0 评论 -
【NLP碎碎念】关于口语文本的一点想法
(很久没在csdn写文章了,一直在知乎,现在慢慢搬过来,原创在https://blog.csdn.net/weixin_38100489哈)看了https://zhuanlan.zhihu.com/p/142168215有一点思考。之前做对话系统时,看实际的对话记录,发现口语文本有如下特点:一是大量的口语词汇;二是打错字;三是语序错乱。1、处理错字很自然有两种思路:一是把错字纠正;二是就把训练集也刻意弄出错字。1.1、错字纠正1.1.1、针对应用场景和实际历史记录,做常见错字的规则。(实际上没原创 2020-05-20 17:13:30 · 916 阅读 · 0 评论