- 博客(11)
- 收藏
- 关注
原创 Mysql实战记录——货之商品特征分析
第二种:点击量低购买量高,说明购买果断,商品可替代性小,或品牌垄断或商品差异性小。2.先分层,对点击量进行“显示筛选器”,移动点击量之后再进行二维矩阵分析。1.矩阵分析:在行、列分别添加一个平均值参考线,发现不行。第四种:点击量高购买量低,商品需求弹性大,购买存在随机性。Tableau目前没有系统学,只能先这样了。第一种:点击量和购买量高,商品可能为刚需。两种都少,商品存在大量替代品,跳跃式购买。矩阵分析、分层分析、相关分析。
2025-04-23 21:56:13
218
原创 Mysql实战记录——货之商品转化率分析
(1)转化率是根据独立用户数计算,因此需要用distinct(2)如果想修改insert into的语句,要把表删掉重新创一个,之后再插入。
2025-04-23 21:27:23
239
原创 Mysql实战记录——货之商品按热度分类
(2)热门商品(3)各类别最热门的商品** 这里有个之前没看到的rank窗格函数用窗口函数给个品类中的商品按照浏览量进行排序rankrank:作用:为数据分配排名(允许并列排名,且会跳过后续序号)。示例:如果前两条记录并列第1,下一条记录会直接跳到第3名。over子句:作用:定义窗口(数据子集)的范围,rank() 会在这个窗口内计算。partition by 分组依据。order by排序依据
2025-04-21 22:31:44
159
原创 Mysql实战记录——用户定位之RFM模型
frequency between 50 and 72 then 5,用i=case when来分层。(1)用户类型分层,有了数字之后进行量化,先定义两个用户变量。1.order by 2 desc,2表示第二列。结果看出来F值对结果分类效果更大,上下两类分。(2)根据最近购买时间对用户进行分层。(1)根据购买次数对用户进行分层。用于声明并初始化两个用户变量。,确保后续赋值前处于明确状态。(1)购买次数+最近购买时间。(2)统计各分区用户数。
2025-04-20 17:57:20
203
原创 Mysql实战记录——行为情况之行为路径分析
* 这里可能还会出现前面字符编码不匹配的报错,因此再运行一次,注意要修改表名。是由于字符编码不匹配导致的中文字符插入问题。** 这里会产生以下报错。
2025-04-19 22:49:16
481
原创 Mysql实战记录——行为情况之用户转化率分析
* 这里用到distinct去重 distinct 后面直接加字段。desc/asc 可以放在order by 后面。2.从行为角度分析:统计各类行为的数量。1.统计各类行为用户数。
2025-04-18 22:37:43
191
原创 Mysql实战记录——行为情况之时间序列分析+tableau可视化
选择驱动(如“MySQL ODBC 8.0 Unicode Driver”),点击“完成”。- 左列的hours字段拖到dates字段,形成一个组合字段,代替上一个的hours。-左下度量值仅保留另外三个参数,将度量名称拖入度量值选项卡中的“颜色”。1.统计日期-小时的行为-日期从前往后,时间从零点到十二点。最顶的行中右键“度量值”,选择双周。行为情况之时间序列分析:统计某个时间段的用户某行为的次数。在“用户DSN”或“系统DSN”选项卡,点击“添加”。-右键左列,增加计算字段。** 用户的周内行为。
2025-04-17 20:43:06
534
原创 Mysql实战记录——留存情况
- 错误表达:select user_id from temp_behavior where count(dates)=1。匹配的结果会基于唯一的 user_id 和 dates 组合进行连接。次日留存率的次日就是用选取的dates减去上面用group by得到的最小的dates。1.全选字段,group by是否使用,影响的是 相同的记录是否保存一条。-- 跳失率,用户只登录一次就没登的浏览量除以总用户浏览量。用了group by的两个字段相同的记录只会保存一条。这两个代码的区别就是group by。
2025-04-16 23:16:08
209
原创 Mysql实战记录——获客情况(按日)
最后结果要使得三个数据同时出现在一张表,我们可以先分开思考。原数据体量较大时,要先创建临时表,插入少量代码进行测试。综上,在临时表中测试完成。
2025-04-14 16:27:35
242
原创 Mysql实战记录——数据预处理
由于后三者要定义成时间类型,需要timestamp时间类型的字段,且之前的timestamps字段仅是int类型,因此add一个datetimes,并用from_unixtime()函数来定义一个timestamp数据类型的字段。(2)创建一个派生表t2,t2包含每种重复记录(user_id,item_id,timestamps这三个字段相同)中最小的id(auto_increment生成的)根据项目的给的数据,它的异常会出现在时间上,即时间不在所设定范围内,因为根据时间去异常。
2025-04-13 18:13:13
906
原创 Mysql实战记录——插入数据
--charset/collation改成utf-8这样---apply---创建表定义表头+数据类型---右键数据库点击'table data import wizard'---复制数据集路径---选择'use existing table '---next...]太慢了,和代码相比慢非常多。总结:花了一下午搞好在搞完了,唯一有个问题就是,导入1亿的数据,结果只成功导入了100万条,mysql条数和csv条数一致,csv点开有显示过数据太大,导致丢失。(1)BOM问题:BOM用于标识文件的编码方式。
2025-04-09 17:41:55
246
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人