【学习笔记】贪心NLP训练营02

最新推荐文章于 2021-11-03 20:27:44 发布

Fly-U

最新推荐文章于 2021-11-03 20:27:44 发布

阅读量215

点赞数

分类专栏： NLP 文章标签： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42324313/article/details/117442176

版权

NLP 专栏收录该内容

13 篇文章 6 订阅

订阅专栏

第二课搭建智能客服系统

0x00 简介

在这里插入图片描述

0x01 基于问答对和基于知识图谱的区别

在这里插入图片描述

0x02 Review_一只狗和两只猫的故事，心理学和DL/RL（选读）

2.1 巴甫洛夫观察到狗看到食物时会流口水，想要知道狗看到别的事物会不会流口水

在这里插入图片描述

当不持续刺激时，狗习得的技巧会慢慢消退——深度学习不断学习
泛化——过拟合——一朝被蛇咬，十年怕井绳
分化：辨别，音叉频率不同，反应不同

2.2 强化学习

在这里插入图片描述

0x03 文本处理流程

在这里插入图片描述

3.1 分词

工具
在这里插入图片描述

3.1.1 方法1：最大匹配（贪心）

前向最大匹配
后向最大匹配
存在问题
- 细分（可能更好）
- 局部最优
- 效率（取决于max_len)
- 存在歧义（不能考虑语义）

3.1.2 考虑语义

在这里插入图片描述

如何提升效率？

3.2 拼写错误纠正

在这里插入图片描述

3.3 文本表示

3.3.1 one-hot

在这里插入图片描述

3.3.2 Boolean和Count

在这里插入图片描述

3.3.3 相似度计算

在这里插入图片描述

3.3.4 TF-IDF

在这里插入图片描述

在这里插入图片描述

3.4 词向量

3.4.1 引入

由于单词的表示：One-hot不能表示语义相似度
存在向量稀疏的问题

3.4.2 分布式表示

在这里插入图片描述

分布式表示方法是一个大的范畴，词向量表示是分布式表示的一种

0x04 倒排表

输入一个问题，系统到问答库进行查询，并计算相似度，这样的话，复杂度就是O(n)*O(相似度计算)，对于一个比较大的问答库来说，这种效率是极低的

所以引入层次过滤思想
在这里插入图片描述

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Fly-U CSDN认证博客专家 CSDN认证企业博客

码龄6年

187: 原创

5万+: 周排名

196万+: 总排名

17万+: 访问

: 等级

2769: 积分

56: 粉丝

109: 获赞

48: 评论

487: 收藏

私信

关注

热门文章

分类专栏

Java 1篇
其他 2篇
面经 2篇
踩坑记录 5篇
MySQL 1篇
Golang 5篇
NLP 13篇
论文 20篇
数据处理与分析 1篇
机器学习 4篇
前端 1篇
爬虫 4篇
Metasploit 3篇
Python 37篇
密码学 7篇
PyQt5 1篇
算法题 74篇
HACK 9篇

最新评论

pytorch to_device遇到数据迁移不成功的问题
前世后载: 解决了，谢谢，值得注意的是Module可以不用，但是tensor迁移到cuda必须要用
CCF-CSP认证试题——工资计算
m0_74100598: 嗷嗷，懂了，非常感谢
CCF-CSP认证试题——工资计算
Fly-U: 对超过起征点后的部分进行扣税，比如3501，是对超出的1元进行征税，至少会保证到手的钱大于3500，所以如果税后收入不大于3500，那么税前收入必定也不大于3500
CCF-CSP认证试题——工资计算
m0_74100598: 博主你好，当税后工资小于等于3500时，为什么一定能保证税前工资也是小于等于3500呢，就是你主函数的那句if（T小于等于3500）则s🟰y
Go语言十大排序算法
leijianx: 桶排序少写一个函数

大家在看

游泳馆押金管理+手牌管理+刷手牌开通方法 1652

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。