电子商务网站用户行为分析及服务推荐

最新推荐文章于 2023-04-23 20:08:50 发布

ch1762

最新推荐文章于 2023-04-23 20:08:50 发布

阅读量1.8k

点赞数

分类专栏：大数据文章标签： python 数据分析数据挖掘

本文链接：https://blog.csdn.net/weixin_43150428/article/details/94152685

版权

本文介绍了一种使用Python进行电子商务网站用户行为分析的方法，包括访问数据库进行数据清洗、变换和网址分类，以及应用协调过滤算法实现个性化服务推荐。数据集链接可在提供的百度网盘获取。

摘要由CSDN通过智能技术生成

数据集链接: https://pan.baidu.com/s/1Au2SNDcYW_2brbQNB2Kvtw 提取码: vr9d
通过python访问数据库并进行分块统计

import pandas as pd
from sqlalchemy import create_engine

engine = create_engine('mysql+pymysql://root:123456@127.0.0.1:3306/test?charset=utf8')
sql = pd.read_sql('all_gzdata', engine, chunksize = 10000)
'''
用create_engine建立连接，连接地址的意思依次为“数据库格式（mysql）+程序名（pymysql）+账号密码@地址端口/数据库名（test）”，最后指定编码为utf8；
all_gzdata是表名，engine是连接数据的引擎，chunksize指定每次读取1万条记录。这时候sql是一个容器，未真正读取数据。
'''

counts = [ i['fullURLId'].value_counts() for i in sql] #逐块统计
counts = pd.concat(counts).groupby(level=0).sum() #合并统计结果，把相同的统计项合并（即按index分组并求和）
counts = counts.reset_index() #重新设置index，将原来的index作为counts的一列。
counts.columns =

最低0.47元/天解锁文章

ch1762

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
电子商务网站用户行为分析及服务推荐

数据集链接: https://pan.baidu.com/s/1Au2SNDcYW_2brbQNB2Kvtw 提取码: vr9d通过python访问数据库并进行分块统计import pandas as pdfrom sqlalchemy import create_engineengine = create_engine('mysql+pymysql://root:123456@127....
复制链接

扫一扫

专栏目录