我悄咪咪告诉你:罩杯越小的妹子倾向买越贵的内衣~~Python爬取京东9000条内衣销售数据之数据关联度分析

使用Python的Apriori算法分析9000条内衣销售数据,研究罩杯尺寸与购买价格之间的关联。初步结果显示,罩杯越小的女性倾向于购买更昂贵的内衣。尽管数据量有限,但这一发现提出了一个有趣的假设,有待更多数据验证。
摘要由CSDN通过智能技术生成

将爬取的9000条内衣销售数据整理清洗后,基于Apriori关联算法,针对“罩杯和消费价格倾向这两个元素有无关系”这个问题进行分析

上一篇用数据库清洗数据,点这里
再上一篇爬取数据详情,点这里

首先要说明一下,这9000条数据不管是从数据量、数据真实性、有效性、代表性这几个方面来说都是远远不够的;本文主要是大胆地提出一个想法,在假定这个数据是理想的条件下,完成算法实现和结果分析;当然,可靠的论证还需要更多的数据(以后有空会跟进);
另外,本文主要是实习过程,代码不像前两篇有极为详细的解释

1.要分析两个东西有没有关系,最简单的就是画图,所以在利用算法分析前,我画出数据条形图简单地分析看看
(我的数据上篇已经保存在mysql数据库了,我直接提取出来用)

RAT=[] # 用于接收各罩杯的三个价格占比率
for size in ['A','B','C']:
    sql = 'SELECT COUNT(size) from bra where size=\'{}\''.format(size)
    cursor.execute(sql)
    nums=cursor.fetchone()
    nums=int(nums[0])
    rat_list=[]
    for price in ['low','mid','hight']:
        sql = 'SELECT COUNT(price) from bra where price=\'{}\' and size=\'{}\''.format(price,size)
        cursor.execute(sql)
        num = cursor.fetchone()
        num= int(num[0])
        rat=num/nums
        rat_list.append(rat)
        print(size,'罩中倾向买价格',price,'占比为',rat)
    RAT.append(rat_list)
low_rat=RAT[0]
mid_rat = RAT[1]
high_rat= RAT[2]
width = 0.05  #设置柱与柱之间的宽度
x = np.arange(3)
fig,ax = plt.subplots()
ax.bar(x,low_rat,width,alpha = 0.9,color='yellow')
ax.bar(x+width,mid_rat,width,alpha = 0.9,color= 'red')
ax.bar
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值