自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Oracle基础1-函数、查询、基本数据处理

lpad(字段名,总长度,补充元素)lpad(salary,10,’*’) —长度不足10位时,用星号在左侧补足10位,如果超过10位呢?rpad(col1,10,’’)trim(‘H’from’HHHKALAJHKAH’) -->HHKALAJHKA 去掉收尾,不区分大小写?replace(‘HHHKALAJHKAH’,‘H’,‘a’) -->aaaKALAJaKAa 替换所有,不区分大小写?数字函数round(453.369,2) --453.37 四舍五入round

2021-01-31 19:57:15 240

原创 Oracle数据库基础2-事务、约束、视图、索引

数据库事务定义事务就是的本质是改变数据库的状态,实现这一目标的途径是通过DML语句(>=1个)、DDL语句(1个)、DCL语句(1个)。结构开始:DML语句是开始结束:COMMIT或ROLLBACK语句;DDL语句(自动提交);用户会话正常结束;系统异常终止。COMMIT和rowback语句rowback 每次都回滚到最近的一次操作;可以指定回到保存点。约束约束是表级别的强制规定常见的物种约束UNIQUENOT NULLPRIMARY KEYFOREI

2021-01-31 19:55:56 224

原创 pandas计算结果插入到MYSQL中报错-error 1054 UNKNOW COLUMN

问题描述如上图,将表导入到Mysql中报错。查看了计算的Dataframe 和 mysql表字段都不包含inf这个名字的字段。所以网上那些可能是写错了列名、包含了空格等原因都排除。问题分析最后把计算的结果输出到excel,查找inf这个词,发现确实存在。其实自己没仔细看,之间用df.sample也出现了inf。仔细看是因为利润率=利润/成本,数据中成本为0 的情况导致inf的出现。解决方案成本为0其实是异常数据,应该在前序的数据清洗中就剔除或是填充。遗留问题:是否可以直接跳过成本为0 的行.

2020-09-20 14:37:33 723

原创 帆软层次坐标应用:纵向扩展列之间相除

场景:构造一个如下图所示的报表,其中 环比=(本周-上周)/上周,城市、本周、上周都是纵向扩展的。如果直接用单元格来进行计算得到的结果不是目标结果。解决方法知识点:层次坐标条件写法B2[!0]{A2=$A2} 表示B2按相同的单元条件扩展出来的的单元格。本案例中的写法:(C5[!0]{B5=KaTeX parse error: Expected 'EOF', got '}' at position 3: B5}̲ - D5[!0]{B5=B5}) /D5[!0]{B5=$B5}...

2020-09-15 19:23:00 1871

原创 零售数据分析方法学习笔记

零售数据分析方法学习笔记零售行业数据指标体系商品分析ABC分析商品价格带分析品牌效益分析门店分析门店分析的指标体系库存分析库存分析的指标体系会员分析会员分析的指标体系活动分析活动分析的指标体系零售行业数据指标体系零售的核心:人、货、场报表的使命:反应过去发生了什么”以及“正在发生什么”。商品分析零售数据分析关注的点有:到底哪些商品能够获得消费者青睐,一路飘红?哪些商品应该淘汰?应该淘汰的商品销售额占比是多少?同一种商品的价格区间分布是怎样的等等ABC分析根据商品对店面销售的贡献度

2020-08-29 14:33:46 1043

原创 FineReport帆软报表常见问题及解决办法合辑(不断更新)

如何动态设置坐标轴的最大值?max(value(‘数据集名称’,数值所在列序号)) + 一个动态值或者固定数值柱状图的分类顺序跟表格中的数据顺序相反?图标计算逻辑和单元格计算逻辑不同导致的,解决办法:在样式→坐标→X轴→位置 选择开启轴逆序想给坐标轴添加单位?方法一:坐标轴下的格式→轴标签格式→自定义语句中添加单位;(推荐)方法二:坐标轴下的格式→轴标签格式→直接在通用格式下的单元格中输入单位。环形图怎么做?在已经制作好的饼图基础上,选择单元格元素→样式→系列→样式→内径占比填入数字。折.

2020-08-02 13:21:25 9283

原创 FineBI入门

数据准备数据的导入和链接所有导入的数据默认在数据自助集中。如果需要归类就在数据准备–>数据列表–>添加分组,对数据进行分组。并且可以通过添加业务包将同一个工程或者业务需要的数据打包在一起。导入的方式有:Excel/SQL数据集/数据库表等。其中导入EXCEL直接选择添加EXCEL数据集,找到存放位置直接上传即可。创建–>添加EXCEL数据集–>选则要存放的位置–>上传数据–>填写表名字。例如多个月份的表分别上传又希望汇总,则直接在已经上传的表基础上追加上传即可

2020-07-26 20:53:19 6940

原创 数仓建模

表的分类维度表维度表是事实表分析的角度,是对事实的描述。例如:时间维度表,包含日期、星期、年、月、日等数据。地区信息维度表中包含国家、地区、省、市等信息。事实表事实表是维度和指标的有机结合。实体表存放客观存在事务的数据。常见模型星型模型一个事实表,多个维度表,且维度表只有一个层次。雪花模型一个事实表,多个且多层次的维度表。星座模型多个事实表+多个维度表,且不同事实表有共用的维度表。不同模型的对比...

2020-07-24 13:27:37 162

原创 数仓常见的架构

3NF1NF: 字段不可再分。即原子性。2NF: 有主键,非主键字段依赖主键。即唯一性,一个表只说明一个事务。3NF: 非主键字段不能相互依赖。也就是每一列都跟主键有直接关系,不存在传递依赖混合集市架构每个部门或者某类需求对应一个数据集市,每个数据集市支撑单独的BI应用。各个数据集市之间相互独立,数据口径、权限可能不一致,部门间相互访问可能受限制。个数据集市保留汇总数据,不保留原子数据。inmon架构原子数据到BI应用中间有DW数仓+DM数据集市DW遵循3NF规则,具备大且全的原

2020-07-24 13:03:27 1025

原创 mysql知识体系脑图

2020-07-14 14:03:44 176

原创 python处理链家数据项目总结

项目背景数据来自某课程老师教学案例数据,目标是根据数据对北京市房价进行分析,获取单价、单价的周走势、成交数量的周走势等信息。项目中遇到的问题及应对数据读取部分已经写在上一篇博客中python读取csv报错数据清洗部分Q1. 缺少关于地区的信息。其实是原始数据将大区信息放在该区域数据之前单独一行。复制含有地区信息的列查看该列数据特点:除了有用的数据外都是数值用空值替代数值用地区...

2020-04-07 14:28:55 525

原创 python项目练习--链家房价分析

import numpy as npimport pandas as pdimport matplotlib as mpl # 注意此处的引用不要漏掉,否则下面的中文显示设置报错import matplotlib.pyplot as pltimport warningswarnings.filterwarnings('ignore')mpl.rcPa...

2020-04-07 14:25:26 1337 2

原创 python读取csv报错

python读取csv文件报错数据:链家分区汇总.csv说明:该数据非官方数据,不具有真实使用价值,仅作为学习素材使用思路如下:读取报错initializing文件名中文导致错误修改文件名为英文增加编码及引擎信息先open后读取UnicodeDecodeError:gbk...**总结:文件名为中文名会导致读取失败。日常工作中最好使用英文名作为文件名。读取文件样成指定engine,...

2020-04-02 13:58:59 1710 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除