胸罩数据分析以及可视化

本文通过爬虫获取天猫和京东的胸罩销售数据,使用pandas进行数据分析,matplotlib进行可视化,揭示了中国女性胸罩尺寸的分布情况。75B、80B和75A是最常见的尺寸,占比约一半,A和B罩杯总计约占70%。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

胸罩数据分析以及可视化

上次用爬虫爬取了天猫还有京东的胸罩数据,不能让数据躺在硬盘里边睡大觉,不用来分析的数据和垃圾没有区别。所以今天就对采集到的数据进行分析,主要是胸罩种类分析,以及罩杯种类分析。

数据库中数据结构如下图:

分析数据以主要使用pandas,可视化使用matplotlib。基本用法就不提了,百度一大把。这里推荐《利用python》进行数据分析一书,某东某当都有卖的。下边主要提几个主要的函数以及用法。

  • Series.to_frame(): 将pandas的series对象转化为dataframe对象,参数name可以指定column的名称
  • pandas.index.tolist(): 可以将索引转化为列表,方便操作索引,对多重索引也试用。
  • pandas.concat(DataFrame1,DataFrame2): 可以连接两个DataFraem.

代码如下,内容有注释:

# -*- coding: utf-8 -*-
# @Author: Nessaj
# @Date:   2018-05-22 18:07:40
# @Last Modified by:   Nessaj
# @Last Modified time: 2018-05-22 20:24:04
# -*- coding: utf-8 -*-
# @Author: Nessaj
# @Date:   2018-03-18 22:47:47
# @Last Modified by:   Nessaj
# @Last Modified time: 2018-03-31 14:29:39
from matplotlib import pyplot as plt
from pandas import DataFrame
import pandas as pd
import sqlalchemy
import numpy 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值