悦光阴-CSDN博客

原创 SQL Server 并发控制：Fabric Warehouse只支持快照隔离

最近在项目中用到Fabric Warehouse，于是学习了关于Fabric Warehouse的快照隔离的知识点，整理成本文，希望对读者有所帮助。Fabric Warehouse只支持快照隔离，这是强制执行的，且不能修改隔离级别，还是默认省略SET ISOLATION SNAPSHOT 语句。

2025-11-04 16:29:00 435

原创 SQL Server 并发控制第四篇：Snapshot Isolation (SI) 和 Read Committed Snapshot Isolation (RCSI)

乐观控制模式假定阻塞很少，快照隔离通过使用行版本控制来避免大多数锁定和阻塞。当尝试修改数据时，这些行的原始数据(在此修改操作之前，且是已提交的数据)会被复制到 tempdb 并赋予事务序列号，此操作称为写时复制 (Copy on Write)，并用于所有的插入、更新和删除操作。当另一个会话读取相同的数据时，将返回读取事务开始时的复制到tempdb的已提交数据版本。通过避免大多数锁定，这种方法可以比事务隔离以更低的成本显著提高并发性。当然，“天下没有免费的午餐！

2025-11-03 19:14:00 730

原创 SQL Server 并发控制第四篇：快照隔离（续）

关于SQL Server的快照隔离，我学到一些新的知识点，于是整理一篇续文。乐观控制模式假定阻塞很少，并使用行版本来避免大多数锁定和阻塞。当尝试修改数据时，这些行的原始数据(在此修改操作之前，且是已提交的数据)会被复制到 tempdb 并赋予事务序列号，此操作称为写时复制 (Copy on Write)。当另一个会话读取相同的数据时，将返回读取事务开始时的复制到tempdb的数据版本。通过避免大多数锁定，这种方法可以比事务隔离以更低的成本显著提高并发性。当然，“天下没有免费的午餐！

2025-11-03 19:14:00 519

原创 Python学习目录

大龄报表工程师自学Python。

2025-07-21 21:08:00 152

原创 DAX: 模型的关系

所谓模型的关系，是模型中的两个表，通过两个列建立的连接。关系的用途，是把过滤器从一个表传递到其他表。过滤器传递的方向，是关系的方向；过滤器传递的路径，是由两个表之间相关联的两列组成的。表，表之间的关联，以及关联的方向，也构成了数据模型。因此，对于一个数据模型来说，关系传播的路径是确定的，这意味着，过滤器(Filter)始终以相同的方式传播，并且不会随机变化。但是关系可以被DAX函数禁用，或者通过DAX函数来激活不活跃的关系，以动态改变过滤器上下文。

2025-05-27 16:10:00 758

原创 DAX：嵌套分组

原文：Nested grouping using GROUPBY vs SUMMARIZEEVALUATEADDCOLUMNS ( VALUES ( 'Product Category'[Category] ), "Max SubCat Avg Price", CALCULATE ( MAXX ( ADDCOLUMNS ( ...

2025-02-28 16:50:00 214

原创 DAX：翻译《介绍SUMMARIZECOLUMNS》

原文：Introducing SUMMARIZECOLUMNS建议用SUMMARIZECOLUMNS来代替SUMMARIZE函数，和ADDCOLUMNS/SUMMARIZE的组合。下面两个DAX的结果是一样的：Sales by Year and Color new style =SUMMARIZECOLUMNS ( 'Date'[Calendar Year], 'Prod...

2025-02-27 23:47:00 583

原创 DAX：翻译《使用SUMMARIZE和ADDCOLUMNS添加扩展列》

原文：Best practices using SUMMARIZE and ADDCOLUMNS在实践中，可以用SUMMARIZE添加分组列，而用ADDCOLUMNS添加计算列。ADDCOLUMNS( SUMMARIZE( <table>, <group by column>,... ), <column_name>, CALCULATE...

2025-02-27 23:17:00 429

原创 DAX：引用表变量中的列

引用表变量的列：VAR TableFaktGradPerAnsatt = ADDCOLUMNS ( SUMMARIZE ( 'dim Organization', 'dim Organization'[AnsattNr], "FG%", [Faktureringsgrad %] )...

2025-02-12 18:16:00 163

原创 Field Parameter的设置

1，Field Parameters 的层次结构2，Field Parameter的分组把多个列设置到一个组中文档：Power BI Field Parameters

2024-10-30 16:41:00 245

原创 DAX：GROUPBY 嵌套聚合

GROUPBY函数的作用是根据输入的表进行数据聚合，输入的表可以是表表达式，也就是说，GRUOPBY的参数可以是一个动态查询返回的表，也就是说GROUPBY函数主要用于嵌套聚合的情况。GROUPBY (<table> [, <groupBy_columnName> [, <groupBy_columnName> [, …]]] [, <name&gt...

2024-03-21 18:11:00 675

原创 Newtonsoft.Json 入门介绍

本人是C#小白，这里摘抄并整理了两位大神的文章：Newtonsoft.Json笔记 -JToken、JObject、JArray详解Json 基于类 Newtonsoft.Json.Linq.JToken的应用简介简单介绍如何使用Newtonsoft.Json类库和操作Json对象，这里主要介绍Linq to Json类。Newtonsoft.Json封装类实现了JToken，直接对JS...

2023-11-13 17:44:00 2528 1

原创 PowerBI 开发第23篇：共享数据集

Power BI共享数据集的优点是：只要数据集刷新，那么引用该数据集的报表都会自动刷新，节省了报表数据刷新的时间和算力，缺点是：使用共享数据集的报表，虽然可以新增Measure(Measure仅存在于本地报表中，不会同步到共享dataset)，但是无法修改数据模型，比如，无法修改关系，不能创建计算列，不能查看共享Measure的定义等，这导致报表开发的自由度受到限制。一，什么是共享数据集？在...

2023-06-12 15:59:00 1712 1

原创 DAX：概述EARLIEST和EARLIER函数

EARLIEST和EARLIER函数只用于行上下文中，并且主要用于计算列的行上下文中。行上下文的作用是迭代，逐行扫描表，并且不会筛选数据。EARLIER函数用于访问外层行上下文，即使用外层行上下文，而不是最内层的行上下文检索列的值。EARLIER(<column>, <number>) EARLIEST(<column>) 注意：EARLIER函数...

2023-05-04 18:40:00 1336

原创 DAX：概述ALL函数

简单的说，当ALL用作表函数时，忽略应用到表上的任何过滤器，并返回数据表；当ALL用作CALCULATE和CALCULATETABLE函数中修饰器时，ALL函数从扩展表中移除已经应用的过滤上下文。注意自动存在(auto-eixist)对ALL()函数的影响。正常情况下，包含 ALL() 函数的 DAX 表达式，会忽略已应用到表或指定列上的任何过滤器。但是，由于auto-exists机制的存...

2023-04-20 15:11:00 1110

原创 DAX：LOOKUPVALUE 函数

LOOKUPVALUE函数用于根据一个或多个搜索条件，从另一个表中获取一个或0个值。LOOKUPVALUE运行在行上下文中，根据当前表中的当前行，从另一个表中查找条件相等的行，查找不需要两个表之间存在关系，搜索结果也不受过滤条件的影响。当两个表之间存在关系时，考虑使用RELATED函数，因为RELATED函数查询性能更快。LOOKUPVALUE( <result_columnN...

2022-12-09 18:21:00 4052

原创 DAX：GROUPBY函数

DAX 中的 SUMMARIZE 函数功能强大，但同时也很难使用。它可用于执行表之间的分组和连接，正如我们之前在分组数据一文中描述的那样。不幸的是，它在计算聚合值时存在一些众所周知的性能问题。除了性能之外，SUMMARIZE 的计算限制是它无法聚合在查询本身内动态计算的值。一，SUMMARIZE函数的限制例如，考虑以下查询，它应该为每个产品类别返回相关子类别的平均价格的最大值。ADD...

2022-12-08 18:53:00 857 1

原创 DAX：SUMMARIZE的秘密

作为一个查询函数，SUMMARIZE 执行三个操作：它可以按表本身或相关表的任何列对表进行分组；它可以创建新列，在行上下文和过滤上下文中计算表达式；它可以产生不同级别的小计(subtotal)。在 SUMMARIZE 的三个主要操作中，只有第一个是安全的。另外两个操作——创建新列和计算小计——应该避免。并不是说这些功能不起作用。问题是 SUMMARIZE 的语义非常复杂，以至于...

2022-12-08 15:51:00 2011 1

原创 VS配置OpenCV

OpenCV下载地址：http://opencv.org/downloads.html，根据操作系统选择合适的安装包。本文使用的是OpenCV-3.4.16的Windows版本，Visual Studio是VS2022版本。我把OpenCV解压到D:\Program Files (x86)\opencv。1，在Windows 10 中添加环境变量在系统变量的Path变量中添加以下两个路径：...

2022-09-01 17:17:00 1186

原创 pandas Series矢量化的字符串函数——Series.str

在清理文本数据时，对pandas Series(序列)可以使用map函数，所有的字符串都可以应用字符串函数或正则表达式，但是如果存在NA，就会报错。为了解决这个问题，Series有一些可以跳过NA值的字符串操作方法，这可以通过Series的str属性来访问。s1 = pd.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN])s...

2022-08-12 12:28:00 969

原创 pandas merge 和 concat

merge是按照列值或索引值进行连接，concat是按照轴进行拼接。一，merge数据库风格的连接是merge，DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', ...

2022-08-11 17:04:00 949

原创 pandas reindex、set_index 和 reset_index

操纵索引包括：重索引、设置索引、替换轴的索引、重置索引一，重索引 (reindex)重索引是指数据框按照新的索引进行排列，如果已存的索引和新索引不匹配，那么使用NA来填充。DataFrame.reindex(labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=...

2022-08-11 12:07:00 1478

原创 pandas 排序和排名

Series和DataFrame可以按照索引进行排序，也可以按照值来排序，对值也可以进行排名。一，按照索引排序(sort by index)对于一个Series或DataFrame，可以按照索引进行排序，使用sort_index()函数来实现索引的排序：DataFrame.sort_index(axis=0, level=None, ascending=True, inplace=Fal...

2022-08-10 16:35:00 1476

原创 pandas pivot、pivot_table和melt

pandas的pivot和pivot_table 用于表格数据的行列互换，而melt用于unpivot 表格数据。1，pivot有如下数据集：import pandas as pdimport numpy as nptable = {"Item":['Item0','Item0','Item1','Item1'],"CType":['Gold','Bronze','Gold',...

2022-08-09 10:45:00 1238

原创 pandas stack和unstack

在使用pandas进行数据整理时，经常会用到stack和unstack两个函数。stack直译过来是堆叠，堆积，unstack是展开。但是stack和unstack的作用类似于pivot和unpivot，stack用于把列转换为行，而unstack用于把行转换为列。因此，可以把stack和unstack的功能解释为行列互换。stack()：从列到行堆叠，把列转换为行unstack()：从行...

2022-08-04 11:19:00 1950

原创 pandas 学习第15篇：分组 groupby

对DataFrame 和 Series 进行分组之后，会返回一个数据类型为GroupBy的对象。对数据进行分组之后，能够得到一个分组键和一个分组数据，一个分组对应的分组键是唯一的，分组是具有相同分组键的行或列的列表。一，groupby函数的基本原理这一节的内容引用于《Pandas教程 | 超好用的Groupby用法详解》，我强烈建议阅读原文，原文写的真棒。为了后续图解的方便，采用模拟生成的...

2022-08-01 16:06:00 2317

原创 PowerBI 开发第22篇：发现异常（Find Anomalies)

异常检测通过自动检测时间序列数据中的异常来增强折线图，并且提供了异常解释，以帮助用户进行根本原因的分析。异常检测只能用于Line Chart中，并且必须有Date字段作为X坐标轴，也就是说，只能按照时间序列来检测异常数据。启用异常检测，只需要在Analyse面板中选择“Find anomalies”。一，格式化异常开发人员可以格式化表示异常的icon的形状、大小和颜色，以及预期范围的颜色...

2022-07-19 20:06:00 795

原创 PowerBI开发第21篇：关键因素（Key Influencer）

关键因素(Key Influencer)图表能够帮助用户分析KPI的因素，并按照因素的重要性进行排名，也就是说，该图表可以查看哪些因素会影响到KPI，并计算出因素的相对重要性。使用Key Influencer Visual，不仅可以查看单个因素的影响，还可以查看多个因素构成的组合(称作Segment)对指标的影响。Key Influencer Visaul 的配置：Key Influenc...

2022-07-12 18:33:00 1023

原创【转】评估分类模型的指标：ROC/AUC

原文：【机器学习笔记】：一文让你彻底理解准确率，精准率，召回率，真正率，假正率，ROC/AUC作者：xiaoyu微信公众号：Python数据科学知乎：python数据分析师ROC/AUC作为机器学习的评估指标非常重要，也是面试中经常出现的问题(80%都会问到)。其实，理解它并不是非常难，但是好多朋友都遇到了一个相同的问题，那就是：每次看书的时候都很明白，但回过头就忘了，经常容易将概念弄...

2022-06-02 10:14:00 607

原创 DAX ：表值函数 ADDCOLUMNS 和 SELECTCOLUMNS

函数ADDCOLUMNS和SELECTCOLUMNS的功能相似，都是迭代函数，在行下文中计算表达式，并返回一个表，但是从数据沿袭的角度来看：在ADDCOLUMNS函数中，添加的列不具有数据沿袭的能力。在SELECTCOLUMNS函数中，SELECTCOLUMNS 保留简单列引用的数据沿袭，对列执行的任何表达式都会破坏数据沿袭。一，ADDCOLUMNS函数ADDCOLUMNS是一个迭代...

2022-05-25 11:15:00 3250

原创 DAX ：【翻译】自动存在（auto-exist）

自动存在是 DAX 中内置的一项技术，其唯一的目标是避免无用计算，换句话说，它是 DAX 的过滤机制使用的一种优化技术，目的是减少计算值的工作量。例如，假设有人构建了一份按大陆和国家/地区划分的报告。在一个数据库中，一个人可能有两大洲和五个国家：在这些数据上，可以运行一个简单的查询，如下所示：EVALUATESUMMARIZECOLUMNS ( Geography[Con...

2022-05-23 17:49:00 335

原创 DAX 第八篇：【翻译】数据沿袭（Data Lineage ）

数据沿袭实际上存在DAX中的每个角落，它的设计如此好，以至于很多开发人员在不知情的情况使用。DAX使用数据沿袭来维护关于列值来源的信息。数据沿袭实际上是一个标签(Tag)，分配给表中的每一列，此Tag用于标识数据模型中的原始列，即列的值源自于该列。通过数据沿袭，DAX可以利用现有的关系来过滤数据模型。对列的简单引用会保留数据沿袭，对列执行运算会破坏数据沿袭。1，对列的简单引用会保留数据沿袭...

2022-05-22 19:01:00 981

原创 DAX：直接过滤和交叉过滤

在筛选上下文中，一列可能是由于应用了过滤器而被直接筛选，也可能是由于关系的传递，其他列被筛选而导致该列被间接筛选。因此，可以把数据模型中的筛选分为直接过滤和交叉过滤。直接过滤：当过滤器直接作用到表中的一列上时，该列是被直接过滤的。直接过滤是由外部的切片器和查询上下文中的行和列过滤器确定的，不受交叉过滤器的影响。注意：如果外部切片器没有勾选任何选项时，默认显示基础表中所有的唯一值。交叉过滤：...

2022-05-19 13:28:00 549

原创 DAX：表值函数 VALUES和DISTINCT

表值函数 VALUES, DISTINCT 都用于返回一列的唯一值，唯一的区别是处理表种空行的行为不同。当关系代表的约束无效时，数据模型会再关系的“一”端的任何表中自动创建一个空行，这就是空值的由来，也就是说，在一个1:M的关系中，如果“多”端在“一”端没有对应的值，那么数据模型默认把BLANK作为值来关联“多”端。一，VALUES函数VALUES函数收到过滤上下文的影响，并可以添加BL...

2022-05-18 21:40:00 1766

原创在Windows服务器上启用远程桌面连接

按照以下的步骤来启用远程桌面连接，可以允许同时连接多人。Step1：登录Windows 服务器“”，打开“Start”(按下Windows键)，输入“Edit group policy” 或 “gpedit.msc”来加载“Local Group Policy Editor”Step2：导航到Computer Configuration>>Administrative Te...

2022-05-12 20:50:00 3564 1

原创 DAX：RELATED 和 RELATEDTABLE

函数RELATED 和 RELATEDTABLE用于在表达式内部操作关系，从关系的角度，这两个函数的区别是：在一对多的关系中，RELATED 用于从“多”端访问“一”端，在这种情况下，相关表中至多有一行。如果数据行不存在，那么RELATED 函数返回BLANK。如果希望从关系的“一”端访问到“多”端，就需要使用RELATEDTABLE 函数，在这种情况下，相关表中可能有多行，RELATE...

2022-05-03 21:34:00 1943

原创 PowerBI开发：用自然语言来探索数据--Q&A

Power BI报表的用户，肯定会被Q&A的功能惊艳到，在查看报表时，仅仅通过输入文本就可以探索数据，并且结果是可视化的，更令人惊艳的时，结果几乎是实时显示出来的。这使得Q&A Visual就像一个搜索引擎，输入你想查询的问题，Q&A返回一个可视化的结果。在您开始输入问题之前，Q&A会显示一些建议，如下图所示：用户也可以输入自己的问题，Q&A支持广...

2022-04-11 22:03:00 915

原创 numpy 学习：保存和加载

numpy使用save(), savez()和load()函数来保存和加载numpy的二进制文件。一，保存文件save()和savez()的区别是前者是非压缩的，而后者是压缩存储。1，save()函数def save(file, arr, allow_pickle=True, fix_imports=True)save()函数：以.npy格式将数组保存到二进制文件中。.npy格...

2022-01-05 14:47:00 1606

原创 numpy 学习：统计函数和相关性

数组的统计函数用于对数组做统计运算。一，统计方法NumPy内置数据分析常用的统计量：mean()：计算元素的均值median()：计算中位数var()：计算元素的方差std() ：计算元素标准差max()：计算元素的最大值min()：计算元素的最小值ptp()：计算元素的取值范围，即最大值和最小值的差值percentile()：计算百分位quantile()：计算分为数...

2022-01-05 14:21:00 653

原创 numpy 学习：数组的查找

1，查找最大值或最小值所在的索引按照特定的轴查找最大值或最小值的索引numpy.argmax(a, axis=None, out=None, *, keepdims=<no value>)numpy.argmin(a, axis=None, out=None, *, keepdims=<no value>)举个例子，查找最小值的索引：>>&gt...

2022-01-05 14:18:00 1505

<利用Python进行数据分析>的源代码和数据集

开了个全英语的会议，真的听不懂，人和人之间的差异，真的很大，加油吧，打工人