建立数据挖掘的用户画像

最新推荐文章于 2024-02-10 19:49:25 发布

qq_32811823

最新推荐文章于 2024-02-10 19:49:25 发布

阅读量1.2k

点赞数 1

分类专栏：机器学习数据分析

本文链接：https://blog.csdn.net/qq_32811823/article/details/100619698

版权

基于用户的画像

前言

根据用户历史信息与用户的人口属性标签（包括性别、年龄、学历）通过机器学习、数据挖掘技术建立模型预测用户标签，制定用户的画像，便于前期调研，需求分析，后期营销等，故为用户制定相应的画像是一项非常有意义的工作

Image Name

导入先关库

import datetime
import pandas as pd
import numpy as np
import pyecharts
import seaborn as sns
import re
import gc
import matplotlib.pyplot as plt
import warnings
import jieba
import lightgbm as lgb
import xgboost as xgb
from pyecharts.charts import WordCloud
from jieba import analyse  # 从 jieba 中导入关键词分析模
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import MultinomialNB
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import cross_val_score
from sklearn.metrics import mean_absolute_error, roc_auc_score, precision_score

warnings.filterwarnings('always')
warnings.filterwarnings('ignore')
sns.set(style="darkgrid")
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示

%matplotlib inline

train_path = "user_tag_query.TRAIN.csv"

train = pd.read_csv(train_path)

数据探索

train.sample(2)

	Unnamed: 0	age	Gender	Education	QueryList
843	8852	5	1	0	湖水月色空前打一国家\t今天双色球开奖结果\t降魔伏妖\t伏妖降魔能制宜打一肖\t徐霞客属什...
499	99465	2	2	4	u盘\t沉香by红夜\t悲观主义者有哪些表现\t杨洋icon微博\t美术欣赏\t好看的小说推...

最低0.47元/天解锁文章

qq_32811823

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
建立数据挖掘的用户画像

基于用户的画像前言根据用户历史信息与用户的人口属性标签（包括性别、年龄、学历）通过机器学习、数据挖掘技术建立模型预测用户标签，制定用户的画像，便于前期调研，需求分析，后期营销等，故为用户制定相应的画像是一项非常有意义的工作导入先关库import datetimeimport pandas as pdimport numpy as npimport pyechartsimport ...
复制链接

扫一扫