🌟 问题1:预测各博主在2024.7.21的新增关注数
🔍 分析思路:
-
特征工程(基于历史)
- 用户对博主的交互强度(点赞数、评论数)
- 最近活跃度(例如是否在过去1~2天有观看该博主)
- 用户曾关注的博主类型特征
- 用户使用平台的时间偏好(时段)
-
模型构建:预测“用户是否会在7.21关注某博主”
- 使用二分类模型(如LightGBM、XGBoost)
- 标签为:“在7.21是否产生关注行为”
- 输入特征为前7~10天的行为
-
输出:统计每个博主被多少用户新增关注,取前5名
✅ 代码实现(问题1)
import pandas as pd
import numpy as np
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.mod