数据分析案例
文章平均质量分 68
冷淡的蛋黄酱
这个作者很懒,什么都没留下…
展开
-
统计学基础:基于python
统计学01 | 绪论1.基础概念① 统计总体、总体单位和样本② 总体参数与样本统计量③ 变量2.统计调查-抽样调查① 简单随机抽样② 分层抽样③ 系统抽样④ 整群抽样⑤ 多阶段抽样3.统计实验4.统计误差① 登记性误差② 代表性误差(抽取的样本代表性不够)---------------------------------------------------------------------------02 | 描述统计1.集中趋势统计① 平均值② 众数③ 中位数2.离散程度统计① 极差② 四分位差③ 平均原创 2021-06-28 17:50:48 · 742 阅读 · 1 评论 -
kaggle常用操作
kaggle01 | data load1.载入数据2.read_csv3.columns解释器01 | data load1.载入数据方法1:Add data - Search对应的数据名称方法2:upload上传数据,上传之前要先填写data名称,否则会卡住2.read_csvimport pandas as pddf = pd.read_csv(r'../input/tesla-stock-data-from-2010-to-2020/TSLA.csv')df[:10]3.c原创 2021-06-25 12:34:52 · 611 阅读 · 1 评论 -
数据分析-微信平台低质优化
import pandas as pdimport matplotlib.pyplot as pltimport seaborn as snspd.set_option('display.max_columns',1000)pd.set_option('display.width',1000)pd.set_option('display.max_colwidth',1000)plt.rcParams['font.sans-serif'] = ['SimHei...原创 2021-05-21 23:23:40 · 89 阅读 · 0 评论 -
pandas-数据清洗
目录01 | 数据清洗常用方法01 | 数据清洗常用方法原创 2021-05-10 12:23:43 · 815 阅读 · 0 评论 -
亚马逊sale ranking analysis
目录01 | 数据集02 | visual分析03 |代码04 | 可视化01 | 数据集kaggle:https://www.kaggle.com/sootersaalu/amazon-top-50-bestselling-books-2009-2019这是一份来自kaggle的数据集,内容是亚马逊2019年书籍的销售数据。通过pd.read_csv读取数据内容,查看columns。Index([‘Name’, ‘Author’, ‘User Rating’, ‘Reviews’.原创 2021-05-08 10:37:19 · 268 阅读 · 1 评论 -
LogisticRegression-手机参数与价格关联性分析
目录01 | 数据来源02 | 分析思路03 | 代码04 | 可视化01 | 数据来源链接: https://pan.baidu.com/s/1QEYV6MpubaDgDUKHBy49Zw提取码: 7p8bkaggle:https://www.kaggle.com/iabhishekofficial/mobile-price-classification这是一个来自kagle上面的数据集。数据集收集了不同型号手机的具体参数以及价格区间。通过对数据集的分析,我们可以找出什么要素.原创 2021-05-07 15:42:16 · 1059 阅读 · 0 评论 -
pyecharts-Map()-全球星巴克分布图
目录01 | 数据集02 | 思路03 | 代码01 | 数据集链接: https://pan.baidu.com/s/1t-37O5f4bwEZpMLaV8m_fw提取码: msb402 | 思路①导入所需要的库,包括pyecharts的Map(),opts,常用的数据可视化以及数据预处理库② 将数据集转为集合的格式,里面一组的格式为(‘国家名称’,‘门店数’)③设置参数,另存为html④注意:map.add(‘门店数量世界分布图’,data,‘world’)中,data.原创 2021-04-27 23:26:39 · 913 阅读 · 1 评论 -
pyecharts常用图库
目录01 | Funnel() 漏斗模型01 | Funnel()# 1.导入需要的库和调参模块from pyecharts.charts import Funnelfrom pyecharts import options as optsbehaviour = ['浏览页面','跳转程序','授权登录','进入游戏','充值消费']user_counts = [50000,34245,23453,21456,5321]behaviour_.原创 2021-04-15 23:53:38 · 257 阅读 · 0 评论 -
pycharts—地区年度GDP统计统计
目录01 | pycharts简介02 | 数据来源03 | 代码演示04 | 可视化01 | pycharts简介1.简介pyecharts 是一个用于生成 Echarts 图表的python库。它实际上就是 Echarts 与 Python 的结合。使用 pyecharts 可以生成独立的网页、图片等。也可以在 flask , Django 中集成使用。2.pyecharts包含的图表 Bar(柱.原创 2021-04-12 16:44:50 · 574 阅读 · 0 评论 -
数据分析面试题
1.描述身高与体重之间的关系,应该采用什么图形来表现( )A.直方图 B.散点图 C.条形图 D.环形图身高体重属于定量变量,散点图可以用来表现两个定量变量之间是否存在某种相关关系直方图适用单个变量,可以直观展现三个特征:集中趋势、离散程度、分布状态条形图、环形图适用于单个变量,可以直观观测到数据的频数跟占比情况2.某学校男生升学率下降,女生升学率下降,那么总体升学率( )A.增加原创 2021-03-16 21:04:27 · 841 阅读 · 1 评论 -
描述统计—AppStore app分析
数据来源https://pan.baidu.com/s/1WSWlp9bFSf7SqYNk9wW1Zw提取码: 6qmj目录01 | 项目简介02 | 数据处理03 | 可视化01 | 项目简介1.项目内容本项目是通过app store的数据,对苹果商店app的热度、分布情况进行一个描述统计分析。主要是手段利用python进行数据的预处理,通过power bi对结果进行可视化操作。2.数据介绍通过word或者excel打开数据,发现其中共有16个字段。字段对应.原创 2021-02-07 14:28:55 · 759 阅读 · 0 评论 -
火锅店日销售情况可视化
所需数据链接: https://pan.baidu.com/s/1lWXVGr8y3Z2JF3bx5OU6Lw 提取码: xpu7 目录1.项目简介2.数据简介3.数据预处理4.数据可视化1.项目简介这是一家火锅店一天的流水信息,其中包括三个excel表格,覆盖了包括收入、客流等内容。我们通过对数据的筛选以及统计,来获得所需要的信息,实现数据的可视化。2.数据简介打开网盘里的文件夹,其中共有‘表结构信息’、‘order’、‘bill’、‘shop’四个表格,‘表格结构信息原创 2021-01-04 10:48:35 · 785 阅读 · 2 评论 -
京东app产品分析
目录01 | 如何分析app页面02 | 整体数据的分发效率01 | 如何分析app页面1.引流(场)首页作为最大带量单位,分发效率如何评估2.漏斗(货)北极星指标交易额只是数字,重点在于理解数字转化过程3.用户(人)成熟的app中,老用户相对稳定,应该考虑新用户获取怎么优化02 | 整体数据的分发效率分发效率的评估除了要关注日活、留存、渗透率等常规指标外,还要找到能反映产品问题的指标。比如 CTR 和人均访问页面数,这两个指标就能很好反映产品问题。CTR:CTR .原创 2020-12-24 12:17:59 · 3176 阅读 · 0 评论