数据分析
wenfei1997
这个作者很懒,什么都没留下…
展开
-
将单行数据拆分到多行
将单行数据拆分到多行id科目1数学、英语2语文、英语转换成id科目1数学1英语2语文2英语all_log = all_log.drop("科目", axis=1).join( all_log['科目'].str.split('、', expand=True).stack().reset_index(level=1, drop=True).rename('枯木'))...原创 2021-10-11 09:14:05 · 291 阅读 · 0 评论 -
数据库中的并发事务,及并发事务的两种机制
数据库中并发事务出现的问题为了解决数据库并发事务时,可能会产生的数据不一致,数据库提供了隔离级别和锁。数据库中并发事务出现的问题1)脏读:数据库并发访问的情况下,不同的事务对同一条数据操作,事务A修改数据未提交时,事务B读取了该数据修改后的结果,但事务A回滚rollback,未提交。导致事务...原创 2020-08-12 16:42:27 · 352 阅读 · 0 评论 -
数据分析-numpy-知识点-思维导图
数据分析-numpy-知识点-思维导图原创 2020-10-15 11:17:28 · 292 阅读 · 0 评论 -
如何建立数据指标体系
数据指标体系做数据分析的时候,有一个很重要的过程,就是搭建数据指标体系。对于指标体系,在某些出版物中是这么定义的,指标体系,是由一系列具有相互联系的指标所组成的整体,可以从不同的角度客观的反映现象总体或样本的数量特征。指标体系中的指标彼此间要存在逻辑关系,单独一个指标或毫无关系的指标都不能称作指标体系。1.指标架构按照不同的意识形态,构建不同的指标架构。理解与认知需要一个主体,而主体圈定范围。目前互联网公司基本都有自己的CRM、ERP、OA等信息管理系统,这是以公司为主体,组织层面根据业务搭建管理系统原创 2020-09-18 19:45:21 · 2786 阅读 · 0 评论 -
业务数据分析中可能用到的简单的数据挖掘方法——相关性分析、主成分分析、因子分析
业务数据分析中可能用到的简单的数据挖掘方法——相关性分析、主成分分析、相关性分析相关性分析相关性分析通过相关系数来描述两个变量之间的相关性程度。通过相关系数判断两者会不会相互影响,影响是正相关还是负相关。相关系数包括皮尔森相关系数、斯皮尔曼秩相关系数、肯德尔秩相关系数。皮尔森相关系数只描述线性关系,另外两者不限于线性关系,可以描述非曲线关系,如幂函数,反相关的关系等。 但在现实中也不知道是怎么用的。。。。相关系数不为0并不以为两者间存在显著的相关性。要判断两者是否存在显著的相关性,需要对相原创 2020-08-12 18:27:16 · 5678 阅读 · 0 评论 -
脏数据及处理
** 秋招复习8/12**## 什么是脏数据?怎么处理###1. 脏数据从目标中取出来的 已经过期、错误、或者没有意义的数据。脏读:读取出来的脏数据就叫脏读”脏数据“分类及处理方法a.数据缺失:空值(缺一行 )或者记录的一些值处理方法:1)不将空值纳入分析范围2)补值:从数据库中重新导入数据或采用平均数、零、或者等比例随机数等补值。b.数据重复:人工判断处理,保留数据中的一条。c.数据错误1)异常值:数值大于区间范围处理方法:...原创 2020-08-12 15:05:58 · 4569 阅读 · 0 评论 -
数据分析——如何根据图表回答问题?
数据分析——如何根据图表回答问题?如何根据图表回答问题?请看上图作答:上个月业绩情况如何?为什么第三周业绩较前两周下跌了?先对问题定位:问题1的解读。表中的指标是什么?表中的维度是什么?拆分问题解读:表中的指标业绩。此处的维度是分类维度。维度是周、日、产品分类。有分类维度是,问题一定要分为总体和局部。顺序:整体-局部-个案问题可以分为part1 总体业绩part2周业绩描述日业绩描述A、B产品业绩例如:问题2 为什么第三周业绩较前两周下跌了?不能仅原创 2020-08-26 16:04:57 · 726 阅读 · 0 评论