python数据分析
文章平均质量分 87
爱炫耀的阿姚
这个作者很懒,什么都没留下…
展开
-
数据处理步骤
一 数据获取: 数据库或数据仓库 问卷数据 :csv(数据量比excel大) txt excel 合作数据 (第三方购买数据):注意数据来源 二 数据探索(EDA探索性数据分析) 1.数据观测:形状() 数据类型(不合适的类型要转换或映射) 观测有无重复值(分情况选择 不管或 删除) 空缺值(空缺率过大选择删除,或填充:经验法----前后填充;统计法----均值 中位数 众数 最大值 最小值 其他分位数),挖掘法:分类 回归) 异常值(过大或过小,不符合现实。修改为99%数据,原创 2021-08-04 01:14:47 · 868 阅读 · 0 评论 -
numpy+pandas
1.jupyter的使用 一. 安装与使用 1.Jupyter Notebook是基于网页的用于交互计算的应用程序,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。 运行 pip install jupyter命令即可安装Jupyter. 在命令行中输入jupyter notebook即可启动Jupyter. jupyter启动以后,原创 2021-08-04 01:13:41 · 2085 阅读 · 0 评论 -
Python基础
编码 一个字节byte 是8位bit 字符是由字节构成的。 utf8中:z=1byte=8bit=2`8二进制(0-255位) 不同编码,一个字符所占的字节不一样 ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间 utf-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节 Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。 终端命令 盘符: 重定向 即 转到其他位置:cd>文件名,把路径放进去 rd 删除空目录 rd原创 2021-08-04 01:10:44 · 2758 阅读 · 0 评论 -
数据的统计分析
数据的统计分析 附原文 三步搞定数据统计分析:统计+分析+可视化 | 人人都是产品经理 (woshipm.com) 一、统计 埋点 --> 数据 --> 五类(整体概况、用户获取、活跃与留存、事件转化) 1.整体概况 实时数据的意义:可以获取到每个小时的产品实时数据,帮助你了解产品目前的实时情况 使用概况:产品整体的使用情况,包括用户量、访问情况、留存等,帮助你对产品整体指标有一个大致了解 2.用户获取 渠道访问意义:每个渠道的用户使用情况,包括渠道中新用户占比、留存等,帮助你了解产品原创 2021-08-04 00:38:42 · 308 阅读 · 0 评论