gaoshayo-CSDN博客

原创优化新知识

1.对空值排序利用关键字 nulls first ，nulls lastSelect from ename, comm from emo order by 3 nulls first2. 根据条件取不同列的值来排序–创建新的一列4.

2021-11-10 09:34:55 183

19.更新数据的方法数据更新的方法20. 动态SQL在PL/SQL程序开发中，可以使用DML语句和事务控制语句，但是还有很多语句（比如DDL语句如 create table , truncate insert into 这种）不能直接在PL/SQL中执行。这些语句可以使用动态SQL来实现。PL/SQL块先编译然后再执行，动态SQL语句在编译时不能确定，只有在程序执行时把SQL语句作为字符串的形式由动态SQL命令来执行。在编译阶段SQL语句作为字符串存在，程序不会对字符串中的内容进行编译，在运行阶段再

2021-10-11 15:10:55 172

原创项目二电商

1.新建数据库开始–找到这个绿色的，点它然后一直点下去,其中新建资源库的名称为BI，所有口令用同一密码口令123456，不要启动维护。完成关闭。2.kettle抽数九个表格都抽完3.建数据字典4.找表关系...

2021-10-08 18:57:43 227

原创更新数据的方式及日志与异常处理

更新数据的方法更新的方式离线（每几个小时更新一次，或者每天更新一次，日更居多，一般拿两天的数据，但是这样的话数据会重复（前天的））实时全量更新增量更新一般增量删除再更新（目的是防止终端补录前天数据）维度表：基本是全量更新，因为数据比较少，最多才几万条事实表，一般是增量更新方法一：现将目标表的记录在增量范围之内删除，然后在将增量插入第一种方式：开头删除处设置时间段在查询内设置时间段方法二，使用marge into更新CREATE OR REPLACE PROCEDURE SP_

2021-09-29 13:39:12 1102

原创 PLSQL

PLSQL是一种块结构的语言，即模块化，一个PL/SQL程序包含了一个或多个逻辑块（模块）基本操作包括：声明和赋值（变量与常量），条件空值，循环控制，游标一.变量的使用语法BEGIN --开始–逻辑部分EXCEPTION --异常处理END; --结束变量的命名规范：V_变量名1.认识函数：输出（打印）函数DBMS_OUTPUT.PUT_LINE(打印内容）；（类似python的print）打印函数只能打印具体值或者变量里面的值，不能打印查询结果如JOBeg：打印HELLO

2021-09-28 19:14:31 452

原创补充知识点，五种语言类型，约束，存在，序列

1. 五种语言数据定义语言DDL 包括CREATE ,ALTER , DROP ,TRUNCATE数据操纵语言 DML：包括 INSERT UPDATE,DELETE,数据查询语言 DQL: 基本查询语句，ORDER BY ,GROUP BY事务控制语言 TCL 包括COMMIT（提交） ROLLBACK（回滚）数据空值语言 DCL 包括GRANT（授权）,REVOKE（撤销）2.约束按用途分类1）PRIMARY KEY 主键约束（可以没有主键，但主键是非空且唯一）（查看–键）创建主动约

2021-09-28 09:31:35 208

原创维度表，事实表，宽表，窄表

维度表，事实表形象化讲解

2021-09-24 20:34:44 674

原创数据仓库、事实表、维度表、DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解

详情请点击

2021-09-24 09:45:31 1159

原创深入浅出统计学

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加第一章：深入浅出统计学之信息图形化：第一印象例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、信息图形化：第一印象1.各类展示的图例及处理数据2.类别数据和数值型数据二、使用步骤1.引入库2.读入数据总结前言一、信息图形化：第一印象1.各类展示的图例及处理数据饼图每一块代表一个组（类），扇形块越大，代表该

2021-09-23 20:09:16 711

原创 BI项目1 酒店相关

概览：从来源抽取数据（用kettle），（ODS）存储到数据仓库，对数据整合（先放在DW层），整合成两类表，事实表，维度表。然后可能再整合到 DM层（数据集市）整合成宽表。做成报表（报表工具：帆软，tableau）数据仓库包括好几部分 ODS（性能，数据备份）,DW命名叫做ODS ：贴源层（最贴近来源的层），具有数据同构性（来源内什么样抽过来基本就什么样）为了不影响来源的完整性，抽取速度要越快越好，否则可能会丢失数据。数据放到DW层内。到DM可视化前置操作创建普通用户，用户名命名为O

2021-09-23 20:06:17 233

原创 kettle（抽数工具，能够跨库抽取）安装流程

BI文档内，找到kettle右键解压–剪切整个文档到桌面-- 打开后将windows批处理文件–文件格式的spoon文件–发送快捷方式到桌面建资源库：右上角 connect --other repository–get started --FILE repository – 创建账户名和路径，选择桌面新建的kettle–然后finish-- start nowkettle的使用1.建来源库（目标库）工具栏–第三个资源库—连接—[+号]—起连接名（source【随意起】）数据库选Mysql–

2021-09-23 12:04:59 1218 1

原创 SQL 练习2021.9.22

–1.使用EMP表–(1) 查询每种职业的平均工资SELECT DISTINCT JOB,ROUND(AVG(SAL) OVER(PARTITION BY JOB ),2) AVG_SALFROM EMPORDER BY AVG_SAL ;–(2) 将第一步的查询结果展示为如下所示（5 种方法）/*办事员销售总裁经理分析员1037.5 1400 5000 2758.33 3000*/–1.位移分析函数 leadSELECT AVG_SAL 办

2021-09-23 09:54:53 152

原创三类分析函数（开窗函数）

功能强大的函数三类聚合分析函数排序分析函数位移分析函数聚合分析函数聚合函数使用条件：使用聚合函数后，SELECT后面只能出现聚合函数或者分组字段（聚合分析函数接触了第一个闲置）聚合函数不能使用在WHERE后面聚合分析函数的使用格式SUM(目标字段) OVER()AVG(目标字段) OVER()MAX(目标字段)OVER()MIN(目标字段) OVER()COUNT(目标字段) OVER()eg：查询每个员工的信息以及所有员工的信息总和，平均工资，最高工资，最低工资，员工个数

2021-09-22 11:09:55 769

原创 oracle练习中常见问题

1.掉线当你发现table打不开，说明你的软件掉线了，重新登录就好（左上角类似钥匙按钮）

2021-09-18 14:59:02 68

原创子查询练习

例：查询工资高于平均工资的员工SELECT E.*FROM (SELECT DEPTNO,AVG(SAL) AVG_SALFROM EMPGROUP BY DEPTNO) AJOIN EMP E ON E.DEPTNO = A.DEPTNOWHERE E.SAL > A.AVG_SAL;先查询平均工资，将这整个结果作为一个表，然后和工资表EMP进行关联，然后再进行比较。练习：1.查询每个部门的最高工资对应的员工信息SELECT *FROM(SELECT DEPTNO,

2021-09-18 10:02:03 319

原创 CSDN如何快速升级-博客积分规则

CSDN博客是依靠积分来提升等级的，博客积分是CSDN对用户努力的认可和奖励，也是衡量博客水平的重要标准。博客等级也将由博客积分唯一决定。想要快速提升等级，就需要按照CSDN的积分规则来获取积分，积分规则具体如下：1、每发布一篇原创或者翻译文章：可获得10分；2、每发布一篇转载文章：可获得2分；3、博主的文章每被评论一次：可获得1分；4、每发表一次评论：可获得1分（自己给自己评论、博主回复评论不获得积分）；5、博文阅读次数每超过100次：可获得1分，阅读加分最高加到100分，即文章点击上万次截止

2021-09-17 09:47:21 523 10

原创安装FineReport流程

安装流程右键finereport解压到finereport——右键kettle。。——解压到kettle————打开 ETL&报表————finereport——bin——designer进入后打开服务器——定义数据链接——将ip改为LOCALHOST——主界面左侧【+】号，写入sql代码，导出数据表格。表格的类型共有三种表格：普通表格聚合表格决策表格三种表格的使用方法较为类似，均以拖拽的方式进行操作简单流程为：写好sql代码——提取数据（左侧+号）——制作表格各类参数的设置

2021-09-16 17:41:14 446

原创 SQL基础语法主体知识

SQL代码构成SELECT + 字段名/算术表达式/函数FROM + 表名/结果集WHERE +筛选条件GROUP BY + 分组字段HAVING + 筛选条件ORDER BY + 排序字段#在结尾加分号，表示代码结束。下列为具体介绍每个代码的使用方法#eg：查询员工信息SELECT EMPNO , ENAME #出现多个字段名，用逗号隔开 FROM EMP #查询字段（列）EMPNO的数据*用来表示全部字段，即整张表的查询3.筛选调节：字段名关系构成关系的数据。

2021-09-15 11:34:41 1113

原创 csv模块：csv.Dictwriter()

存储数据从之前代码的运行结果可以看到，我们是将爬取到的数据都储存到了新建的 csv 文件中。所以我们可以使用 csv 模块的 DictWriter() 类，接下来我们简单回顾一下这个知识点。1）调用 csv 模块中类 DictWriter 的语法为：csv.DictWriter(f, fieldnames)。语法中的参数 f 是 open() 函数打开的文件对象；参数 fieldnames 用来设置文件的表头；2）执行csv.DictWriter(f, fieldnames)后会得到一个 DictW

2021-09-14 22:57:29 6957

原创 scrapy项目：爬取豆瓣畅销书排行榜内容（仅爬取2020年1-3页：无保存）

目标如题先进入cmd进入想要创建项目的文件夹，例如cd C:\Users\MI\Desktop\python学习\python爬虫学习内容\13_scrapy1然后在cmd输入 crapy startproject dangdang这样就创建了一个scrapy的项目框架如下图进入douban再进入douban文件夹（子）spider文件夹内部：其中的bestseller.py ， main.py文件在创建scrapy框架时时没有的，后续会提到创建框架部分说完了。接着是代码部分

2021-09-09 15:39:09 272

原创 scrapy框架使用流程

scrapy介绍上面的这张图是Scrapy的整个结构。你可以把整个Scrapy框架看成是一家爬虫公司。最中心位置的Scrapy Engine(引擎）就是这家爬虫公司的大boss，负责统筹公司的4大部门，每个部门都只听从它的命令，并只向它汇报工作。我会以爬虫流程的顺序来依次跟你介绍Scrapy爬虫公司的4大部门。Scheduler(调度器)部门主要负责处理引擎发送过来的requests对象（即网页请求的相关信息集合，包括params，data，cookies，request headers…等），会把

2021-09-08 23:18:06 2842 2

gaoshayo的博客

原创优化新知识

原创 SQL基础语法主体知识2

原创项目二电商

原创更新数据的方式及日志与异常处理

原创 PLSQL

原创补充知识点，五种语言类型，约束，存在，序列

原创维度表，事实表，宽表，窄表

原创数据仓库、事实表、维度表、DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解

原创深入浅出统计学

原创 BI项目1 酒店相关

原创 kettle（抽数工具，能够跨库抽取）安装流程

原创 SQL 练习2021.9.22

原创三类分析函数（开窗函数）

原创 oracle练习中常见问题

原创子查询练习

原创 CSDN如何快速升级-博客积分规则

原创安装FineReport流程

原创 SQL基础语法主体知识

原创 csv模块：csv.Dictwriter()

原创 scrapy项目：爬取豆瓣畅销书排行榜内容（仅爬取2020年1-3页：无保存）

原创 scrapy框架使用流程

原创 annaconda3 scrapy框架创建

原创 python:爬虫selenium入门

原创 bug相关：os.system(‘clear‘)

原创 VScode装了库但无法使用的解决方法

原创 input()函数使用方法

原创误差分析方法

原创 python小知识总结

原创 Call back代码注释（用于达到目标就停止训练，加快训练速度）

转载 Python shuffle() 函数

空空如也

空空如也