传统推荐过时了？试试用大模型读懂用户每一次点击-CSDN博客

网罗开发 （小红书、快手、视频号同名）

大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者：《ESP32-C3 物联网工程开发实战》
图书作者：《SwiftUI 入门，进阶与实战》
超级个体：COC上海社区主理人
特约讲师：大学讲师，谷歌亚马逊分享嘉宾
科技博主：华为HDE/HDG

我的博客内容涵盖广泛，主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告，同时也会提供产品优缺点分析、横向对比，并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。

展菲：您的前沿技术领航员
👋 大家好，我是展菲！
📱 全网搜索“展菲”，即可纵览我在各大平台的知识足迹。
📣 公众号“Swift社区”，每周定时推送干货满满的技术长文，从新兴框架的剖析到运维实战的复盘，助您技术进阶之路畅通无阻。
💬 微信端添加好友“fzhanfei”，与我直接交流，不管是项目瓶颈的求助，还是行业趋势的探讨，随时畅所欲言。
📅 最新动态：2025 年 3 月 17 日
快来加入技术社区，一起挖掘技术的无限潜能，携手迈向数字化新征程！

文章目录

摘要

传统的推荐系统，依赖于协同过滤、矩阵分解或轻量级的深度学习模型，但在面对用户行为日益复杂、信息形式多样的今天，这些方法逐渐显得“力不从心”。尤其是对于用户意图的理解，常常浮于表面。而大模型（如 GPT、BERT、CLIP）的崛起，为我们带来了从“行为推荐”走向“理解推荐”的新机会。

本文将围绕“大模型驱动的个性化推荐”这一核心，系统剖析用户意图建模、多模态信息融合和下游推荐算法的落地实践，配合 Demo 代码与配图，帮助你从 0 到 1 搭建一个智能、灵活的推荐系统。

大模型推荐系统的核心能力

用户意图识别：理解“人”比理解“行为”更重要

以往我们依赖点击、浏览、收藏等离散行为标签。现在可以直接将用户自然语言反馈（搜索词、评论、问答）喂给语言模型，提取用户偏好。

思路：
利用 OpenAI GPT 或 HuggingFace 上的 BERT 类模型，将用户行为日志转为语义嵌入，作为用户画像的一部分。

from transformers import AutoTokenizer, AutoModel
import torch

tokenizer = AutoTokenizer.from_pretrained("sentence-transformers/all-MiniLM-L6-v2")
model = AutoModel.from_pretrained("sentence-transformers/all-MiniLM-L6-v2")

def get_user_embedding(text):
    inputs = tokenizer(text, return_tensors="pt", truncation=True)
    with torch.no_grad():
        outputs = model(**inputs)
        embeddings = outputs.last_hidden_state.mean(dim=1)
    return embeddings

多模态融合：文本、图像、语音，统统理解

在内容推荐场景（如短视频、直播、电商图文），单一文本特征已经不足以准确刻画内容特征。我们需要图文音多模态一起处理。

解决方案：

文本：使用 BERT 系列模型。
图像：使用 CLIP、SAM、BLIP 等多模态预训练模型。
音频：使用 Whisper 或其他语音模型提取语义。

示意图：

[ 用户点击记录 ]
     ↓
[ 文本 | 图片 | 音频 ]
     ↓  多模态模型
[ 语义嵌入向量 ]
     ↓
[ 推荐引擎 ]

构建一个基于语义搜索的推荐器

以简化的文本向量推荐为例：

from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

corpus = [
    "轻薄笔记本推荐",
    "机械键盘推荐",
    "适合远程办公的显示器",
    "拍视频的相机设备"
]

corpus_vecs = [get_user_embedding(text).numpy()[0] for text in corpus]

def recommend(query, corpus, corpus_vecs, topk=2):
    query_vec = get_user_embedding(query).numpy()
    scores = cosine_similarity(query_vec, np.array(corpus_vecs)).flatten()
    top_indices = scores.argsort()[::-1][:topk]
    return [(corpus[i], scores[i]) for i in top_indices]

# 示例调用
print(recommend("办公用的电脑", corpus, corpus_vecs))