自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 基于ZhiPuAI的文本匹配3(新闻推荐)

如果是新用户,那么在打开app的时候官方大多数都会让你选择你感兴趣的频道,那么这些就会曾为你的标签,那么官方向你发送时就会加大这部分的权重。我们以新闻为例,我们将标题和导语作为匹配的文本(实践现实中会根据复杂),与你曾经浏览的文章作为对比相似度,与你浏览文章相似度高的新闻就会推送给你。百度网盘链接: https://pan.baidu.com/s/1oLZdBrI6Us-nxjZIotRm4Q?得到推荐的内容,我们只需要将data传进class里面,然后选取用户就可以得到,这个用户会获得的推荐新闻。

2024-08-06 16:29:10 98

原创 基于ZhiPuAi的文本匹配2(Q&A)

那么我们的问题和以及答案都存储进去了,我们可以问一个问题,基于第4条来问,what are two alternatives to Kaggle,其实是任意的问题,只是会答非所问,因为没有足够的数据支撑,我们的只有10数据所以不能随便问问题,只能对着答案问问题。这就完成了Q&A最基本的流程,剩下的就是基于现实的优化,例如我们上面创建的字典应该把所有的维度的加上,还有就是数据的储存,因为当我们数据量大了,用本地运行会很慢。可以看到数据的大小是(1166, 4),以及数据大概的样子,以及每一个维度的含义。

2024-08-05 22:16:14 292

原创 基于ZhiPuAi的文本匹配1(基础)

可以看到emb1和emb3的相似对更高,但是文本之间的差距比emb1、emb2之间的文本差距大(指的是所用的字的差距大,并非文意),但是为什么1、3相似度会比1、2的相似的高呢,是因为embedding是联系上下文的,所以虽然文本没有什么差距,但是内涵是不一样的,所以相似度就没有内涵一样的高。所以我们在远古时期用的检索问题答案的方式就是,将你的问的问题(文本)embedding化,然后在官方的embedding库中检索,对比,将相似对最高的问题作为你的问的问题,然后将这个问题的答案放回给你。

2024-08-05 21:09:32 224

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除