- 博客(23)
- 收藏
- 关注
原创 MYSQL--SELECT语句书写/执行顺序
select 语句书写顺序子句顺序说明备注select要返回的列或表达式必须使用from从中检索数据的表或试图仅从中检索数据时使用where行级过滤仅对记录进行筛选时使用group by分组字段仅在分组聚合运算时使用having组级过滤仅对分组进行筛选时使用order by输出排序仅对查询结果进行排序时使用limit限制输出仅对查询结果限制输出时使用select 语句执行顺序from --> where -
2020-08-29 15:23:41 204
原创 MYSQL批量导入数据
MYSQL8.0 默认不允许客户端从本地导入文件,因此需要将载入的文件放在安全路径下导入:查看安全路径: -- 查看安全路径show variables like '%secure%'; 将数据文件放入安全路径下,同时复制路径 ( 路径中不能含有中文,且需要将‘\’ 改为 ‘\ \’ 或 ‘/’)load data infile ‘文件路径’ into table 表名-- 批量导入数据load data infile "C:/ProgramData/MySQL/MySQL
2020-08-29 12:02:12 338
原创 Python--文本字符串的处理方法
import numpy as npimport pandas as pd#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"data = pd.DataFrame({'City':['London','Berlin','Rome','Paris'], 'State':[' Unite
2020-08-24 21:26:09 317
原创 Python实用小技巧
Python进行绘图时,默认情况下使用中文会乱码,此时在程序中插入以下代码即可:plt.rcParams['font.family'] = 'SimHei' # windows系统显示中文 #plt.rcParams['font.family'] = 'Arial Unicode MS' # mac 显示中文 plt.rcParams['axes.unicode_minus'] = False # 显示负号或plt.rcParams['font.sans-serif']='SimH
2020-08-23 19:03:42 496
原创 reset_index()与set_index()的区别
在数据清洗或拼接的过程中,时常会遇到索引序列不连续的情况,此时可以使用reset_index()进行重置索引,让索引序列变成连续的序列,而set_index()是更改索引序列。data1 = pd.DataFrame({'A':[1,2,3],'B':[4,5,6]})data2 = pd.DataFrame({'A':[2,2,2],'B':[6,6,6]})data1data2>>> A B0 1 41 2 52 3 6>>> A B
2020-08-23 10:07:36 914
原创 Jupyter Notebook中添加目录插件和更换主题
当在Notebook中写入的内容过多时,使用鼠标不便于查找,此时我们可以通过安装目录插件,利用目录,提高查找效率:安装代码: pip install jupyter_contrib_nbextensions配置:jupyter contrib nbextension install --user使用步骤:启动 Jupyter Notebook选择 Nbextensions勾选 Table of Contents打开 .ipynb 文件,在工具栏中点击目录选项,就会在左侧生成目录
2020-08-21 19:29:56 489
翻译 Jupyter Notebook--快捷键使用
Jupyter Notebook中有两种不同的键盘输入模式:编辑模式:允许将代码或文本输入到一个单元格,并通过一个绿色的单元格来表示命令模式:将键盘与notebook本级命令绑定在一起,并通过一个灰色的单元格边界显示,该边框为蓝色的左边框***********************命令行模式(按 Esc 生效) ***********************F: 查找并且替换Ctrl-Shift-F: 打开命令配置Ctrl-Shift-P: 打开命令配置Enter: 进入编辑模式
2020-08-21 19:01:52 250
原创 Anaconda安装流程
Anaconda安装点击Anaconda下载网址:https://www.anaconda.com/products/individual进入官网首页,点击“Download”进行下载找到自己系统的最新版本进行下载双击下载好的安装包,进入安装点击“Next”,然后选择“I Agree”同意条款选择“All Users”,点击“Next”选择默认安装路径,或者自己设置安装路径,设置好之后,点击“Next”在Advanced Options中勾选第一
2020-08-16 21:26:05 412
原创 数据的概括性度量-- 集中趋势度量
数据的概括性度量-- 集中趋势度量集中趋势一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值分类数据:众数众数:一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数,如:(1)没有众数:1,2,3,4,5(2)一个众数:1,2,3,4,4(3)多个众数:1,2,2,3,3主要用于分类数据,也可用于顺序数据和数值型数据(1)分类数据中的众数:调查的89人中有30人
2020-08-16 10:24:03 1214
原创 Python基础--推导式及其使用
推导式是从一个或几个迭代器快速简洁地创建数据结构的一种方法。它可以将循环和条件判断想结合,从而避免语法冗长的代码。列表推导式列表推导式的形式如下:[expression for item in iterable] 即 [表达式 for 项 in 迭代器]a. 输出由1-5各整数的平方构成的列表number_list = [number**2 for number in range(1,6)]number_listOut:[1, 4, 9, 16, 25]b.将列表[2,6,61,
2020-08-15 21:45:27 238
原创 Python中不同进制数字的转换
Python中不同进制数字的转换在Python中,默认使用十进制数,同时,我们还可以使用下列几种进制的数字将其转化成十进制数字:二进制:形式为0b或0B。利用bin()函数可将十进制下的数字转化成二进制# 二进制下的100转换成十进制0b100Out: 4# 十进制下的4转换成二进制bin(4)Out: '0b100'八进制:形式为0o或0O。利用oct()函数可将十进制下的数字转化成八进制# 八进制下的100转换成十进制0o100Out: 64# 十进制下的6
2020-08-15 15:35:26 840
原创 Python多行输出--全局输出控制语句
Python多行输出–全局输出控制语句# 设置全部行输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"上述代码表示,在输出结果时,以单元格为单位,对所有可以被输出的对象,依次进行输出。没有运行全局输出控制语句前a = 2+3b = 2*3abOut[1]: 6运行全局输出控制语句后a = 2+3b =
2020-08-15 10:12:44 1093
原创 LaTeX数学公式编辑在线网站
LaTeX数学公式编辑在线网站http://latex.codecogs.com/eqneditor/editor.php
2020-08-15 09:57:19 518
原创 BI中的两种汇总规则
BI中的两种汇总规则通常情况下,汇总规则是一对多的对应关系,且是一表出维度,多表出度量(一筛多),具体见多表查询中对应关系的汇总(销售业绩表)(客户信息表)客户信息表和销售业绩表的连接方式如下(客户信息表是一表,销售业绩表是多表)顺着筛选器的筛选方向筛选,结果是正确的,如下逆着筛选器方向筛选,即客户信息表出度量,销售业绩表出维度,此时结果是错误的。若将筛选器的指向单向改成双向则根据筛选器的方向可以出现多表筛一表的情形,这种汇总方式是BI中特有的汇总方式(类型2,T2)
2020-08-05 21:23:41 1188
原创 Power BI中对字段新建组
Power BI中对字段新建组利用Power BI新建报表时,当对某个字段建立切片器时,可能会因字段中记录过多而导致切片器不能满足自己的需求,如下图,此时可以对切片器中的字段新建组。操作步骤:点击需要分组字段右侧的更多选项选择新建组在组中修改名称和装箱大小点击确定,新建组创建完毕5.用新建组的价格箱创建切片器,就可以看到里面的数据是以5为间隔递增的...
2020-08-03 17:48:50 1280
原创 Power Query获取网页信息
Power Query获取网页信息)Power Query获取网页信息获取网页信息的过程示例Power Query获取网页信息获取网页信息的过程确定要获取信息所在网站解析网址明确应使用什么函数取数(Web.Page(Web.Contents(“网址”)))明确所要数据在网址全部数据中的什么位置创建参数表或自定义函数,批量或灵活爬取所要信息示例用自定义函数爬取大气质量数据(提示:用文本型参数指定城市名称)网址:http://www.air-level.com/方案一:获取单个城市
2020-07-31 23:24:26 2422
原创 数据分析表达式(DAX)--几个常用函数
数据分析表达式(DAX)--几个常用函数DAX表达式:Power Pivot的特有函数集DAX思考逻辑常用函数SWITCH 函数FILTER 函数CALCULATE 函数ALL 函数SUM 函数RELATED 函数示例DAX表达式:Power Pivot的特有函数集DAX表达式的结果应用在数据透视表中DAX表达式的结果作用于整列或者表中所有行DAX表达式主要是用来解决度量和规则问题的,要想得到最终的计算结果还需要在数据透视中加入维度(度量、规则+维度=>值)还需注意以下几点:a. 表名用
2020-07-30 22:48:49 6905
原创 时间智能函数(DAX)
时间智能函数(DAX)时间智能函数(DAX)TOTALMTD 函数PREVIOUSMONTH 函数DATEADD 函数时间智能类函数Bug的解决方案时间智能函数(DAX)DAX包括时间智能函数,这些时间智能函数通过使用时间段(包括日、月、季度和年)对数据进行操作,然后生成和比较针对这些时段的计算,支持商业智能分析的需要。要想时间智能函数使用更加灵活,主要需要解决下列三个问题:参照依据(参考的是时间点还是时间段)位移量(从参考的时间点/段往前/后移动多长的时间)返回区间涉及到时间智能函数的细节
2020-07-30 22:48:30 2680 1
原创 多表查询中对应关系的汇总规则
多表查询中对应关系的汇总规则多表查询连接方式决定多表连接结果的三个属性对应关系一对一多对多一对多多表查询通过不同表中具有相同意义的关键字段,将多个表进行横向连接,查询不同表中的字段信息。注:连接两表时,用于连接的字段称为关键字段。连接方式内连接和外连接(左连接和右连接)决定多表连接结果的三个属性方向性:在外连接中,写在前面的表为左表,写在后面的表为右表主附关系:主表要出所有的数据范围,附表与主表无匹配项时标记为null,内连接时无主附表之分对应关系:关键字段中有重复值的表为多表,没有
2020-07-29 15:14:03 791
原创 Power Query中如何使用自定义函数
Power Query中如何使用自定义函数自定义函数格式如下:(参数1,参数2,参数3,…)=>函数运算表达式注:通过调用函数得到的函数返回值成为函数值具体使用示例1、求两数的均值步骤:a. 新建源–空查询b. 点击高级编辑器c. 查询界面中先输入参数,再在let中输入对应的函数表达式,in中输入对应返回的函数值d. 点击查询,输入参数后点击调用,即可完成自定义函数的计算2、用自定义函数与判断语句,创建由三个参数构成的自定义函数,自定义函数用来选择做四则运算中的哪种运算
2020-07-27 21:56:00 3458
原创 Power Query快速查询M函数
Power Query快速查询M函数1、新建源–空查询2、在编辑器中输入= #shared3、经过步骤2得到的是非关系型数据表中的记录,此时不能进行筛选,需要转换成表的形式进行筛选,点击上方的到表中4、在表中进行筛选,如在筛选器中输入Text.5、点击确定,就筛选出文本类函数6、想快速了解对应函数的具体使用方法,点击右侧的Function即可(如Text.Format)...
2020-07-27 21:12:47 1232
原创 使用不同路径的Power Query文件报错
使用不同路径的Power Query文件报错原因解决方法原因Power Query数据仓库用的是外部数据源的数据,而不是直接存储生成的数据,如Excel文件数据是复制粘贴到Power Query空间中的,即缓存在其中,所以每次打开Power Query文件,都会从第一步操作开始执行,重新更新,更新时需要找到Excel文件,再把Excel文件中的信息重新缓存到Power Query空间中,然后才能继续后面的操作(Power Query与数据源是同步变化的),所以当源文件路径和Power Query中文件的
2020-07-27 20:10:34 1345
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人