2020/07
秦小茗同学
这个作者很懒,什么都没留下…
展开
-
医疗知识图谱项目笔记(四)
for _ in range(9, 15) _你可以当它是一个变量,但一般习惯不用这个变量。这个循环的作用是循环6次(9,10,11,12,13,14) 语言模型:是计算一个字符串是句子的概率的模型。 1.基于专家系统的语言模型 缺点:没有一种固定的规则可以归纳所有语言。如“真笑skr人”“雨女无瓜”就不能期待用专家系统来解决。 2.统计语言模型 P(s) = P(w1,w2,......,wn) = P(w1)P(w2|w1)P(w3|w1,w2).........P(...原创 2020-07-06 21:19:19 · 629 阅读 · 1 评论 -
医疗知识图谱笔记(三)
lesson03 1.RNN的特点(优点缺点) 信息越来越堆积最后最多,只有单向有影响而且影响递减(需深入了解,面试100%)/*/ 2.GRU 一篇经典博客,(面试可能会让画出论文图示和讲解原理)/*/ 3.NER LSTM+softmax LSTM+CRF CRF比softmax复杂,为什么要用softmax?(面试)/*/ 1.CRF可以为最后预测的标签添加一些约束来保证预测的标签是合法的。在训练数据训练时,这些约束可...原创 2020-07-06 21:19:28 · 422 阅读 · 0 评论 -
医疗知识图谱笔记(二)
1.re库 import re # 从字符串中匹配是否有该模板 print(re.search(pattern = 'w{2}', string = 'www.runoob.com')) # 从字符串中替换掉该模板 print(re.sub(pattern = '#.*$', repl = "", string = "2004-959-559 # 这是一个国外电话号码")) # 从字符串中找到所有匹配的子串 print(re.findall(pattern='\d+', string='runoob.原创 2020-07-01 15:18:54 · 375 阅读 · 0 评论