Python
Mr.DDG
学习数据分析的小白
展开
-
数据分析算法学习笔记---决策树
决策树来自极客时间用户:程序员小熊猫ID3:优点:算法简单,通俗易懂缺陷:1. 无法处理缺失值2. 只能处理离散值,无法处理连续值3. 用信息增益作为划分规则,存在偏向于选择取值较多的特征。因为特征取值越多,说明划分的越细,不确定性越低,信息增益则越高4. 容易出现过拟合C4.5:优点:1. 能够处理缺省值2. 能对连续值做离散处理3. 使用信息增益比,能够避免偏向于选择...原创 2020-03-15 20:31:29 · 292 阅读 · 0 评论 -
利用 Python 对某网上商城进行战略分析
这里写自定义目录标题战略分析1 研究目的:战略选择2 研究内容:环境分析2.1 宏观环境分析2.2 市场环境分析2.3 竞争环境分析3 分析方法3.1 定性分析:SWOT 分析3.2 定量分析:内外因素评价矩阵4 内外因素数据获取5 内外因素得分计算5.1 评分计算5.2 权重的计算6 制作战略选择矩阵图6.1 分析思路6.2 图表绘制本项目参考自《活用数据》战略分析为了确定企业的使命和目标...原创 2020-02-01 18:00:15 · 1119 阅读 · 0 评论 -
四字弟弟领衔主演的《长安十二时辰》数据可视化分析
《长安十二时辰》 6 月 27 日上映,豆瓣评分首日便达到了 8 分,热度并不低于当下热播的每一部剧。今天主要是对我用 Python 采集的豆瓣影评进行简单的可视化分析。主要从五个方面分析:全国观众地域分布观众地域排行榜短评词云图评论数量与日期的关系各评分占比观众情感分析各评分占比下面是分析的整个过程一、理解数据本数据集来源豆瓣,由于豆瓣在非登录状态下仅仅可以爬取200条...原创 2019-07-03 00:09:17 · 1149 阅读 · 0 评论 -
数据分析实战项目| 用户消费行为的分析报告
用户消费行为的分析报告数据来源 CDNow 网站的用户购买明细,通过各个指标对用户行为进行分析,可以更清楚了解用户行为习惯,为进一步制定营销策略提供依据。具体指标包括:- 用户消费趋势分析- 用户个体消费分析- 用户消费行为分析- 复购率和回购率分析- 留存率分析一、理解数据本数据集共有 6 万条左右数据,数据为 CDNow 网站 1997年1月至1998年6月的用户行为数据,共...原创 2019-06-30 00:22:47 · 6284 阅读 · 1 评论 -
Kaggle TMDB 票房预测挑战赛
Kagle 为我们提供了 7000 多部过去影片的数据,通过这些数据尝试预测全球票房总收入。提供的数据包括演员、制片组、情节关键字、预算、海报、上映日期、语言、制作公司和国家。1. loading relevant modulesimport numpy as np import pandas as pd import matplotlib.pyplot as pltimport s...原创 2019-07-11 20:49:50 · 2556 阅读 · 0 评论 -
数据分析实战 We Rate Dogs’: Twitter 数据分析
本偏可以工学习者有机会完成体验整个数据分析过程,从收集数据到清理和分析数据,最后从数据中可视化趋势。数据来自推特帐号 ‘We Rate Dogs’ 以诙谐幽默的方式对人们的宠物狗评分。这些评分通常以 10 作为分母。但是分子则一般大于 10:11/10、12/10、13/10 ,因此可以让大多数狗的评分高于10分1. Gathering Data我们有三个数据集文件twitter_arc...原创 2019-07-21 18:36:08 · 1399 阅读 · 0 评论