搜推广
文章平均质量分 70
zhao_crystal
这个作者很懒,什么都没留下…
展开
-
06 逻辑回归
逻辑回归原创 2022-10-30 22:45:19 · 262 阅读 · 0 评论 -
推荐 系统
推荐系统原创 2022-09-19 22:09:46 · 234 阅读 · 0 评论 -
04 朴素贝叶斯(Naive Bayes)
目录1. 朴素贝叶斯概率模型2. 高斯朴素贝叶斯3. 多项式分布朴素贝叶斯朴素贝叶斯分类器(Naive Bayes classifier),在机器学习中是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器。朴素贝叶斯的假设:一个特征出现的概率,与其它特征(条件)独立(特征独立性)(也可以认为是:对于给定分类的条件下,特征独立) 每个特征同等重要(特征均衡性)。1. 朴素贝叶斯概率模型理论上,概率模型分类器是一个条件概率模型。独立的类别变量C有若干原创 2021-11-13 16:17:06 · 1607 阅读 · 0 评论 -
Out-Of-Vocabulary(OOV)的理解
OOV 问题是NLP中常见的一个问题,其全称是Out-Of-Vocabulary,下面简要的说了一下OOV:怎么解决?下面说一下Bert中是怎么解决OOV问题,如果一个单词不在词表中,则按照subword的方式逐个拆分token,如果连逐个token都找不到,则直接分配为[unknown]...转载 2022-05-20 23:07:14 · 1871 阅读 · 1 评论 -
module ‘torchtext.data‘ has no attribute ‘Field‘
原因是新版本的 torchtext 已经没有Field这个函数了。参考下面的博客来进行修补吧?【进阶篇】全流程学习《20天掌握Pytorch实战》纪实 | Day03 | 文本数据建模流程范例_府学路18号车神的博客-CSDN博客https://blog.csdn.net/weixin_44333889/article/details/124186466遗留问题:是否可以用将代码转换到最新版本呢?待续啦...转载 2022-05-09 22:58:14 · 3701 阅读 · 0 评论 -
03中文分词
1. 为什么要分词1.1 中文分词的目的让机器更好的“理解”文章。1.2 英文天然分词,比中文更适合做相似度比对?No,英文中每个单词包含很多不同的意思。1.3 分词是越细越好吗?视情况而定搜索——>越细越好——>因为其比较注重召回推荐——>粗一点好——>因为其更注重精准度(精准推荐),粒度粗有利于“保留语义”2. 怎么分词里面涉及的一些算法:容易切分的:用字典匹配,动态规划,vterbi算法不容易切分的:隐马尔可夫模型2.原创 2022-04-11 23:59:06 · 989 阅读 · 0 评论 -
02关键信息提取
1. Count Vector1.1什么是count vector计数向量/频数向量,一句话中的单词用其频数来表示,组成一个数字向量。比如:“He is a boy.,She is a girl, good girl.”语料库:[He, is, a, boy, She, girl, good]Count vector: [1, 1, 1, 1, 0, 0, 0] [0, 1, 1, 0, 1, 2, 1]1.2为什么要用count ve.........原创 2022-04-06 22:57:26 · 2937 阅读 · 0 评论