木木被学习-CSDN博客

原创基于ZhiPuAI的文本匹配3（新闻推荐）

如果是新用户，那么在打开app的时候官方大多数都会让你选择你感兴趣的频道，那么这些就会曾为你的标签，那么官方向你发送时就会加大这部分的权重。我们以新闻为例，我们将标题和导语作为匹配的文本（实践现实中会根据复杂），与你曾经浏览的文章作为对比相似度，与你浏览文章相似度高的新闻就会推送给你。百度网盘链接: https://pan.baidu.com/s/1oLZdBrI6Us-nxjZIotRm4Q?得到推荐的内容，我们只需要将data传进class里面，然后选取用户就可以得到，这个用户会获得的推荐新闻。

2024-08-06 16:29:10 98

原创基于ZhiPuAi的文本匹配2（Q&A）

那么我们的问题和以及答案都存储进去了，我们可以问一个问题，基于第4条来问，what are two alternatives to Kaggle，其实是任意的问题，只是会答非所问，因为没有足够的数据支撑，我们的只有10数据所以不能随便问问题，只能对着答案问问题。这就完成了Q&A最基本的流程，剩下的就是基于现实的优化，例如我们上面创建的字典应该把所有的维度的加上，还有就是数据的储存，因为当我们数据量大了，用本地运行会很慢。可以看到数据的大小是(1166, 4)，以及数据大概的样子，以及每一个维度的含义。

2024-08-05 22:16:14 292

原创基于ZhiPuAi的文本匹配1（基础）

可以看到emb1和emb3的相似对更高，但是文本之间的差距比emb1、emb2之间的文本差距大（指的是所用的字的差距大，并非文意），但是为什么1、3相似度会比1、2的相似的高呢，是因为embedding是联系上下文的，所以虽然文本没有什么差距，但是内涵是不一样的，所以相似度就没有内涵一样的高。所以我们在远古时期用的检索问题答案的方式就是，将你的问的问题（文本）embedding化，然后在官方的embedding库中检索，对比，将相似对最高的问题作为你的问的问题，然后将这个问题的答案放回给你。

2024-08-05 21:09:32 224

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 基于ZhiPuAI的文本匹配3（新闻推荐）

原创 基于ZhiPuAi的文本匹配2（Q&A）

原创 基于ZhiPuAi的文本匹配1（基础）

空空如也

空空如也

原创基于ZhiPuAI的文本匹配3（新闻推荐）

原创基于ZhiPuAi的文本匹配2（Q&A）

原创基于ZhiPuAi的文本匹配1（基础）