- 博客(3)
- 收藏
- 关注
原创 基于ZhiPuAI的文本匹配3(新闻推荐)
如果是新用户,那么在打开app的时候官方大多数都会让你选择你感兴趣的频道,那么这些就会曾为你的标签,那么官方向你发送时就会加大这部分的权重。我们以新闻为例,我们将标题和导语作为匹配的文本(实践现实中会根据复杂),与你曾经浏览的文章作为对比相似度,与你浏览文章相似度高的新闻就会推送给你。百度网盘链接: https://pan.baidu.com/s/1oLZdBrI6Us-nxjZIotRm4Q?得到推荐的内容,我们只需要将data传进class里面,然后选取用户就可以得到,这个用户会获得的推荐新闻。
2024-08-06 16:29:10 98
原创 基于ZhiPuAi的文本匹配2(Q&A)
那么我们的问题和以及答案都存储进去了,我们可以问一个问题,基于第4条来问,what are two alternatives to Kaggle,其实是任意的问题,只是会答非所问,因为没有足够的数据支撑,我们的只有10数据所以不能随便问问题,只能对着答案问问题。这就完成了Q&A最基本的流程,剩下的就是基于现实的优化,例如我们上面创建的字典应该把所有的维度的加上,还有就是数据的储存,因为当我们数据量大了,用本地运行会很慢。可以看到数据的大小是(1166, 4),以及数据大概的样子,以及每一个维度的含义。
2024-08-05 22:16:14 292
原创 基于ZhiPuAi的文本匹配1(基础)
可以看到emb1和emb3的相似对更高,但是文本之间的差距比emb1、emb2之间的文本差距大(指的是所用的字的差距大,并非文意),但是为什么1、3相似度会比1、2的相似的高呢,是因为embedding是联系上下文的,所以虽然文本没有什么差距,但是内涵是不一样的,所以相似度就没有内涵一样的高。所以我们在远古时期用的检索问题答案的方式就是,将你的问的问题(文本)embedding化,然后在官方的embedding库中检索,对比,将相似对最高的问题作为你的问的问题,然后将这个问题的答案放回给你。
2024-08-05 21:09:32 224
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人