数据分析
文章平均质量分 83
zongzi009
这个作者很懒,什么都没留下…
展开
-
Python 数据分析微专业课程--项目实战09 房价影响因素挖掘
1.项目说明分析上海房价和房租,计算租售比;分析上海市人口密度、路网密度、餐饮价格和房价的关系。2.项目具体要求1、数据清洗、整合 要求: ① 将“house_rent”、“house_sell”分别读取 ② 分别计算平方米建筑面积的月租金、每平方米建筑面积的房价 ③ 将数据按照小区名合并2、计算“房屋售租比”,并做初步判断 要求: ① 计算指标 ② 绘制直方图、...原创 2018-09-04 21:34:46 · 2354 阅读 · 14 评论 -
Python 数据分析微专业课程--项目07 电商打折套路解析
1.项目说明基于双十一淘宝美妆数据分析双十一期间各品牌化妆品的销售情况及打折情况,并分析个品牌化妆品的打折特点,分析其套路。2.项目具体要求1、从双十一淘宝美妆数据,分析出“各个品牌都有多少商品参加了双十一活动?” 要求: ① 计算得到:商品总数、品牌总数 ② 双十一当天在售的商品占比情况 ③ 真正参与双十一活动的品牌有哪些?其各个品牌参与双十一活动的商品数量分布是怎样的?...原创 2018-09-03 22:00:14 · 2059 阅读 · 15 评论 -
Python 数据分析微专业课程--项目06 城市餐饮店铺选址分析
1.项目说明通过对上海餐饮数据的分析,选择相对较好的餐饮类型和地段开店2.项目具体要求从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行比较,并筛选出可开店铺的餐饮类型选择一个餐饮类型,在qgis中做将上海划分成格网空间,结合python辅助做空间指标评价,得到餐饮选址位置3.实现思路:1.根据上海餐饮数据,有’口味’,’环境’,’服务’,’人均消费’这字段,...原创 2018-09-03 21:55:27 · 4191 阅读 · 23 评论 -
Python 数据分析微专业课程--项目05 多场景下的图表可视化表达
1.项目说明分析2016年奥运运动员数据,使用多种图表方式对多个指标进行可视化展示并进行分析2.项目具体要求1、分男女分别分析运动员的身高分布,并制作图表,数据为“奥运运动员数据.xlsx,sheet → 运动员信息” 要求: ① 制作分布密度图 ② 计算出男女平均身高,并绘制辅助线表示 2、综合指标判断运动员的身材,并找到TOP8的运动员,并制作图表,数据为“奥运运动员数...原创 2018-09-03 21:49:13 · 1090 阅读 · 2 评论 -
Python 数据分析微专业课程--项目04 多场景下的算法构建
1.项目说明对3个月的A,B两种产品的数据进行数据过程中,对分析过程:数据读取,清洗,处理,可视化。进行数学建模分析,采用函数式编程方式算法构建 2.项目具体要求批量读取数据,并输出以下信息 (1)数据量 (2)数据字段columns (3)输出每个文件分别有多少缺失值批量读取数据,用均值填充缺失值数据,并完成以下计算及图表制作 (1)读取数据并用均值填充缺失...原创 2018-09-02 21:35:43 · 721 阅读 · 1 评论 -
Python 数据分析微专业课程--项目03 视频网站数据清洗整理和结论研究
1.项目说明读取爱奇艺网站数据,对数据进行清洗和整理,分析不同导演电影的好评率,对2001-2016电影影评人数分析,筛选出当年热门电影2.项目具体要求数据清洗 - 去除空值;时间标签转化分析出不同导演电影的好评率,并筛选出TOP20 统计分析2001-2016年每年评影人数总量,分析每年人数变化规律,筛选查看异常值,看异常值是否是当年热门电影3.实现思路:...原创 2018-09-02 21:19:00 · 1406 阅读 · 3 评论 -
Python 数据分析微专业课程--项目实战14 泰坦尼克号获救问题
1.项目说明对泰坦尼克号乘客数据进行分析,挖掘获救乘客和遇难乘客的数据特点以及与其他因素的相关性2.项目具体要求1、整体来看,存活比例如何?要求:① 读取已知生存数据train.csv② 查看已知存活数据中,存活比例如何?2、结合性别和年龄数据,分析幸存下来的人是哪些人?要求:① 年龄数据的分布情况② 男性和女性存活情况③ 老人和小孩存活情况3、结合 Sib...原创 2018-09-04 21:49:23 · 2144 阅读 · 1 评论 -
Python 数据分析微专业课程--项目实战13 婚恋配对实验
1.项目说明创建模型模拟1万男性和1万女性的婚恋配对实验,男性和女性都有财富、内涵、外貌三个属性的得分,并根据不同的择偶策略选择对象。2.项目具体要求1、样本数据处理 ①样本要求: 按照一定规则生成了1万男性+1万女性样本: 在配对实验中,这2万个样本具有各自不同的个人属性(财富、内涵、外貌),每项属性都有一个得分 财富值符合指数分布,内涵和颜值符合正态分...原创 2018-09-04 21:46:52 · 1818 阅读 · 0 评论 -
Python 数据分析微专业课程--项目实战12 财富分配实验
1.项目说明 构建财富分配模型,模拟不允许借贷情况下的财富分配,允许借贷下的财富分配,努力型人生的财富分配2.项目具体要求1、财富分配模型模型假设:① 每个人初始基金100元② 从18岁到65岁,每天玩一次,简化运算按照一共玩17000轮③ 每天拿出一元钱,并且随机分配给另一个人④ 当某人的财富值降到0元时,他在该轮无需拿出1元钱给别人,但仍然有机会得到别人给出的钱要求:...原创 2018-09-04 21:43:44 · 1877 阅读 · 0 评论 -
Python 数据分析微专业课程--项目实战11 中国城市资本流动问题探索
1.项目说明通过全国2013-2016城市间投融资信息数据,分析资本在各城市间的流动情况.2.项目具体要求1.查看全国城际控股型投资关系要求:分别筛选出“同城投资”、“跨城投资”的TOP20,比较一下两类投资的数据分布2.2013-2016年全国跨城市资本流动情况要求:① 结合“中国城市代码对照表.xlsx”数据,给2013-2016年“跨城投资”的汇总数据添加城市的经纬...原创 2018-09-04 21:41:42 · 748 阅读 · 2 评论 -
Python 数据分析微专业课程--项目实战10 国产烂片深度揭秘
1.项目说明读取电影数据,筛选出烂片数据,从各个角度分析烂片特征2.项目具体要求1、读取数据,以“豆瓣评分”为标准,看看电影评分分布,及烂片情况要求:① 读取数据“moviedata.xlsx”② 查看“豆瓣评分”数据分布,绘制直方图、箱型图③ 判断“豆瓣评”数据是否符合正态分布④ 如果符合正态分布,这里以上四分位数(该样本中所有数值由小到大排列后第25%的数字)评分为...原创 2018-09-04 21:37:57 · 1754 阅读 · 8 评论 -
Python 数据分析微专业课程--项目08 中国姓氏排行研究
1.项目说明对姓氏户籍地和工作地数据进行清洗、整合,获得姓氏的户籍城市及其经纬度,工作地城市及其经纬度。然后对数据进行分析,分析姓氏TOP20,取其中某几个姓氏分析其在全国的分布,根据户籍地与工作地的经纬度分析其奔波指数。2.项目具体要求1、数据清洗、整合 要求: ① 将“data01”、“data02”分别读取,并且合并成一个数据 ② 结合“户籍地城市编号”及“中国城市代码对照...原创 2018-09-03 22:14:09 · 1943 阅读 · 22 评论