KMeans聚类特征筛选与预处理规划

适合用于聚类的列筛选结果

根据数据特征和聚类需求,以下列适合用于KMeans聚类分析:

1. 数值型特征列

以下列已经是数值型或经过映射后的数值,适合直接用于聚类:

  • 来源:已映射为数值(如“微信”为1)。

  • Q1-Q27(单选题和矩阵量表题):所有选项已用数值表示,例如:

    • Q1(是否使用抖音APP):1=是2=否

    • Q2(性别):1=男2=女

    • Q3(年龄分段)、Q4(学历)、Q5(职业)等类似数值。

    • Q15-Q27(矩阵量表题):每个子问题(如Q15|R1、Q15|R2等)均为数值评分。

2. 需要删除的列

以下列不适合聚类,建议删除:

  1. 非数值型或无关列

    • 答题序号:与用户行为无关。

    • 开始时间提交时间答题时长:时间戳信息,与聚类目标无关。

    • IP省份IP城市IP地址:地理位置文本信息,需编码后才能使用(但通常与聚类目标无关)。

    • 浏览器操作系统:文本信息,需编码(但通常与聚类目标无关)。

  2. 高缺失率列

    • Q5|open:开放性问题,大部分为空值(如数据中的空值),缺失率高。

  3. 单一值列(需检查数据):

    • 如果某列所有值相同(如所有用户来源均为“微信”),则删除。

3. 保留的列列表

来源, Q1, Q2, Q3, Q4, Q5, Q6, Q7, Q8, Q9, Q10, Q11, Q12, Q13, Q14, 
Q15|R1, Q15|R2, Q15|R3, 
Q16|R1, Q16|R2, 
Q17|R1, Q17|R2, Q17|R3, 
Q18|R1, Q18|R2, Q18|R3, 
Q19|R1, Q19|R2, Q19|R3, 
Q20|R1, Q20|R2, Q20|R3, 
Q21|R1, Q21|R2, 
Q22|R1, Q22|R2, 
Q23|R1, Q23|R2, Q23|R3, 
Q24|R1, Q24|R2, Q24|R3, 
Q25|R1, Q25|R2, Q25|R3, 
Q26|R1, Q26|R2, Q26|R3, 
Q27|R1, Q27|R2

以下是数据集中 适合用于聚类的列 及其对应的具体问题解释:


1. 基础用户属性

列名对应问题选项编码(数值化后)
来源用户来源渠道1=微信(其他来源需扩展)
Q1是否使用过抖音APP1=是2=否
Q2性别1=男2=女
Q3年龄分段1=20岁以下2=21-30岁3=31-40岁4=41-50岁5=51岁以上
Q4学历1=初中以下2=高中/中职3=大学专科4=大学本科5=硕士6=博士及以上
Q5职业1=在校学生2=公务员3=企业管理者, ..., 13=其他职业人员
Q6月可支配收入1=1500元2=1500-2000元3=2000-3000元4=3000-5000元5=5000元以上
Q7月均网购次数1=0次2=1-2次3=3-5次4=6-9次5=10次及以上
Q8日均观看抖音时长1=15分钟以下2=15-30分钟3=30-60分钟4=60分钟以上

2. 种草者信任度与专业性

列名对应问题(矩阵量表题)评分规则
Q15|R1种草者具备扫地机器人领域相关知识数值评分(如1-5分)
Q15|R2种草者在扫地机器人领域受过专业教育数值评分
Q15|R3种草者对扫地机器人有丰富的购买和使用经验数值评分
Q16|R1种草者在短视频平台非常有影响力数值评分
Q16|R2种草者在社会上有一定名声和声望数值评分

3. 用户互动行为

列名对应问题(矩阵量表题)评分规则
Q17|R1我喜欢接受种草者的推荐并积极响应数值评分
Q17|R2我与种草者之间互相交流数值评分
Q17|R3我经常关注种草者的动态数值评分
Q18|R1种草者的个性与我相似数值评分
Q18|R2种草者的兴趣爱好与我相似数值评分
Q18|R3种草者的选择偏好与我相似数值评分

4. 信息价值感知

列名对应问题(矩阵量表题)评分规则
Q19|R1种草者推荐信息对我有参考价值数值评分
Q19|R2种草者全面介绍了扫地机器人信息数值评分
Q19|R3种草者对细节特点有详细说明数值评分
Q20|R1种草者使用图文结合方式推荐数值评分
Q20|R2种草者配有直观真实的视频讲解数值评分
Q20|R3种草者采取现场演示方式推荐数值评分

5. 促销敏感性

列名对应问题(矩阵量表题)评分规则
Q23|R1因直播期间特价而购买数值评分
Q23|R2因限量抢购或限量款而购买数值评分
Q23|R3因直播间优惠券/礼品而购买数值评分

6. 购买决策与情感反馈

列名对应问题(矩阵量表题)评分规则
Q21|R1种草者会推荐他人使用数值评分
Q21|R2种草者推荐能提升购买意愿数值评分
Q22|R1种草视频内容生动有趣数值评分
Q22|R2观看视频能让我放松数值评分
Q24|R1种草者推荐是亲身体验后的分享数值评分
Q24|R2种草者推荐基本没有偏见数值评分
Q24|R3种草者推荐的扫地机器人可靠数值评分
Q25|R1推荐的扫地机器人物有所值数值评分
Q25|R2可以在短视频中买到想要的数值评分
Q25|R3购买决策是正确的数值评分
Q26|R1观看时感到快乐数值评分
Q26|R2观看时感到期待数值评分
Q26|R3观看时感到满意数值评分
Q27|R1愿意在观看短视频时购买数值评分
Q27|R2愿意推荐他人观看短视频购买数值评分
处理之后:数据
Q2,Q3,Q4,Q5,Q6,Q7,Q8,Q9,Q10,Q11,Q12,Q13,Q14,Q15|R1,Q15|R2,Q15|R3,Q16|R1,Q16|R2,Q17|R1,Q17|R2,Q17|R3,Q18|R1,Q18|R2,Q18|R3,Q19|R1,Q19|R2,Q19|R3,Q20|R1,Q20|R2,Q20|R3,Q21|R1,Q21|R2,Q22|R1,Q22|R2,Q23|R1,Q23|R2,Q23|R3,Q24|R1,Q24|R2,Q24|R3,Q25|R1,Q25|R2,Q25|R3,Q26|R1,Q26|R2,Q26|R3,Q27|R1,Q27|R2
2.0,2.0,4.0,1.0,2.0,4.0,1.0,1.0,2.0,1.0,1.0,1.0,1.0,4.0,3.0,5.0,4.0,4.0,3.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,5.0,4.0,4.0,4.0,4.0,4.0,3.0,5.0,4.0,4.0,5.0,4.0,4.0,4.0,5.0,4.0,3.0,5.0,5.0
1.0,2.0,4.0,1.0,2.0,4.0,4.0,1.0,2.0,2.0,2.0,1.0,2.0,4.0,3.0,3.0,4.0,4.0,2.0,2.0,4.0,4.0,4.0,4.0,4.0,5.0,5.0,4.0,4.0,4.0,4.0,4.0,4.0,3.0,4.0,2.0,5.0,3.0,3.0,5.0,4.0,4.0,4.0,3.0,4.0,3.0,2.0,3.0
1.0,2.0,4.0,1.0,2.0,4.0,3.0,1.0,3.0,3.0,2.0,1.0,2.0,3.0,3.0,3.0,2.0,2.0,3.0,3.0,2.0,3.0,3.0,4.0,3.0,4.0,4.0,3.0,4.0,3.0,4.0,3.0,4.0,3.0,4.0,4.0,2.0,3.0,2.0,3.0,4.0,3.0,2.0,2.0,2.0,2.0,3.0,3.0
2.0,2.0,3.0,6.0,4.0,5.0,4.0,1.0,4.0,2.0,2.0,4.0,2.0,4.0,4.0,3.0,3.0,3.0,3.0,3.0,1.0,2.0,1.0,1.0,4.0,5.0,5.0,4.0,5.0,5.0,5.0,5.0,2.0,1.0,4.0,1.0,4.0,5.0,5.0,3.0,4.0,2.0,2.0,1.0,3.0,1.0,2.0,4.0
1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大大大大小小

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值