对语言处理预训练的总结2-26

语言模型

比如一句话 I want to study,那么用概率表示这句话的概率就是
P(I)P(want|I)P(to|I want)P(study|I want to)
如果希望这个概率最大,就可以训练了

word2vec

有两种方法CBOW和Skip-gram
CBOW类似完形填空从一句话中扣掉一个单词
其中有个窗口值window ,被扣掉的词叫中心词,中心词为中心,范围为window的所有词是背景词
跳字模型和他相反 保留中心词
区别就是P(I want study|to)和P(to|I want study)
因为相互独立
前者可以拆成3个P
那么如何训练呢
参数是中心词和背景词的 向量
最大化似然函数概率
等价于最小化损失函数为 − ∑ t = 1 T ∑ − m ≤ j ≤ m ,   j ≠ 0 log , P ( w ( t + j ) ∣ w ( t ) ) . - \sum_{t=1}^{T} \sum_{-m \leq j \leq m,\ j \neq 0} \text{log}, P(w^{(t+j)} \mid w^{(t)}). t=1Tmjm, j=0log,P(w(t+j)w(t)).
log ⁡ P ( w o ∣ w c ) = u o ⊤ v c − log ⁡ ( ∑ i ∈ V exp ( u i ⊤ v c ) ) \log P(w_o \mid w_c) = \boldsymbol{u}_o^\top \boldsymbol{v}c - \log\left(\sum{i \in \mathcal{V}} \text{exp}(\boldsymbol{u}_i^\top \boldsymbol{v}_c)\right) logP(wowc)=uovclog(iVexp(uivc))
如果用梯度下降法
那么梯度
∂ log , P ( w o ∣ w c ) ∂ v c = u o − ∑ j ∈ V P ( w j ∣ w c ) u j . \frac{\partial \text{log}, P(w_o \mid w_c)}{\partial \boldsymbol{v}_c} = \boldsymbol{u}o - \sum{j \in \mathcal{V}} P(w_j \mid w_c) \boldsymbol{u}_j. vclog,P(wowc)=uojVP(wjwc)uj.
其中为了加入噪声采取了一些办法
有两个向量mask和label用来区分中心词,背景词,和噪声词

本项目是一个基于SSM(Spring+SpringMVC+MyBatis)框架和Vue.js前端技术的家教平台系统。该系统旨在为家教和学生提供一个便捷、高效的在线交流和预约平台,涵盖了从用户注册登录、个人信息管理、课程发布与搜索、预约与取消预约、评价反馈等一系列功能。 在后台管理方面,系统提供了管理员对用户信息、课程信息、预约记录等进行管理的功能,确保平台的正常运行和数据的准确性。通过Spring框架的依赖注入和AOP特性,实现了业务逻辑的清晰分离和高效处理;SpringMVC则负责处理前端请求和响应,提供友好的用户界面;MyBatis作为ORM框架,简化了数据库操作,提高了数据访问的效率和安全性。 前端部分采用Vue.js框架,结合Vue Router进行页面路由管理,Axios进行HTTP请求,实现了前后端分离的开发模式。Vue.js的组件化开发和响应式数据绑定特性,使得前端页面更加动态和交互性强,提升了用户体验。 数据库设计采用了MySQL,存储了用户信息、课程信息、预约记录等核心数据。通过合理的数据库表结构和索引设计,保证了系统的高效运行和数据的一致性。 该项目不仅适合计算机相关专业的毕设学生参考和学习,也适合Java学习者进行项目实战练习。通过对该项目的深入理解和二次开发,可以实现更多个性化功能,进一步提升技术水平和实践能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值