NLP
艺术人生666
这个作者很懒,什么都没留下…
展开
-
中文分词工具
说明此项目需要的数据:综合类中文词库.xlsx: 包含了中文词,当做词典来用以变量的方式提供了部分unigram概率 word_prob举个例子: 给定词典=[我们 学习 人工 智能 人工智能 未来 是], 另外我们给定unigram概率:p(我们)=0.25, p(学习)=0.15, p(人工)=0.05, p(智能)=0.1, p(人工智能)=0.2, p(未来)=0.1, p(是...原创 2019-06-08 20:08:55 · 1249 阅读 · 0 评论 -
简单的问答系统
1. 读取文件,并把内容分别写到两个list里(一个list对应问题集,另一个list对应答案集)import jsonimport time# 分数(5)def read_corpus(file_path): """ 读取给定的语料库,并把问题列表和答案列表分别写入到 qlist, alist 里面。 在此过程中,不用对字符换做任何的处理(这部分需要在 Part 2.3...原创 2019-06-08 20:55:56 · 371 阅读 · 0 评论 -
情感分析项目
1. 模型理论与应用以下几个问题都是比较经典的问题,会对模型的深入理解会有很大的帮助。 特别是对于逻辑回归的二次导数的求解过程可以用来证明一个函数是否凸函数。1.1 逻辑回归相关假设我们有训练数据D={(x1,y1),...,(xn,yn)}D=\{(\mathbf{x}_1,y_1),...,(\mathbf{x}_n,y_n)\}D={(x1,y1),...,(xn,yn)}, ...原创 2019-06-08 21:39:15 · 882 阅读 · 3 评论