自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 第18课使用视图

视图:是虚拟的表,与包含数据的表不一样,视图不包含任何列或数据,包含的是一个查询。SELECT cust_name, cust_contact FROM Customers, Orders, OrderItems WHERE Customers.cust_id = Orders.cust_id AND OrderItems.order_num = Orders.order_num AND prod_id = 'RGAN01'; 此查询用来检索订购了某种产品的顾客,检索其他产品 (或多个...

2021-07-06 19:32:48 171

原创 第17课创建和操纵表

创建表:CREATE TABLE语句CREATE TABLE Products ( prod_id CHAR(10) NOT NULL, vend_id CHAR(10) NOT NULL, prod_name CHAR(254) NOT NULL, prod_price DECIMAL(8,2) NOT NULL, prod_desc VARCHAR(1000) NULL ); 对于 MySQL,varchar 必须替换为 text。在创建新的表时,指定的表名...

2021-07-06 17:30:57 144

原创 第16课更新和删除数据

更新数据:UPDATE 语句更新单个列:UPDATE Customers SET cust_email = 'kim@thetoystore.com' WHERE cust_id = '1000000005';要更新的表名为 Customers,SET 命令用来将新值赋给被更新的列。UPDATE 语句以 WHERE 子句结束,它告诉 DBMS 更新哪一行。没有 WHERE 子句,DBMS 将会用这个电子邮件地址更新 Customers 表中的所有行。更新多个列:UPD...

2021-07-06 15:38:04 145

原创 第15课插入数据

数据插入:使用insert语句可1,插入完整的行,2,插入行的一部分,3,插入某些查询的结果。(使用insert语句需注意是否有足够的安全权限)。插入完整的行:要求指定表名和插入到新行中的值(如果某列没有值,则应该使用 NULL 值)。INSERT INTO Customers VALUES('1000000006', 'Toy Land', '123 Any Street', 'New York', 'NY', '11111', 'USA', NULL, NULL); 此语法很...

2021-07-06 12:28:24 151

原创 第14课组合查询

执行多个查询(多条select语句),并将结果作为一个查询结果集返回。也称为并、复合查询。UNION操作符1,select cust_name, cust_contact, cust_email from customers where cust_state in ('il', 'in', 'mi');2,select cust_name, cust_contact, cust_emailfrom customers where cust_n...

2021-07-05 21:44:01 158

原创 第13课创建高级联结

使用表别名除了可以对列名和计算字段使用别名,还可以给表名起别名。这样可以在一条select语句中多次使用相同的表。select rtrim(v1) + ' (' + rtrim(v2) +')' as v3 from v order by v1;select c1,c2 from customers as c ,oders as o ,orderitems as oi where c.c1=o.c1 and i.o1=o.o1 and oi1=...

2021-07-05 19:07:14 135

原创 第15章卡方检验:拟合优度和独立性检验

拟合优度的卡方检验:(单因素,≥2个水平)主要使用样本数据检验有关总体分布形态或比例的假说。检验决定所获得的样本比例与虚无假设中的总体比例的拟合程度。拟合优度的卡方检验的虚无假设:无偏好、等比例假设。在已知总体中没有差别。卡方统计: ;实际频数;期望频数计算自由度: df=C-1 C类别数量报告卡方值:...

2021-07-03 22:42:30 7835

原创 第14章相关和回归

相关:测量两个变量X和Y之间的关系相关有三种特征:1,方向,正相关表示变化是同方向的2,形式,最常见是直线(用皮尔逊相关预测),还有其他形式(如用斯皮尔曼相关)。3,程度,相关值测量了数据点与其特殊形式拟合的程度。皮尔逊相关:主要用来测量两个变量的线性关系方向和程度(即数据点在何种程度上于直线拟合)。离均差积和: 解释相关:1,相关只是描述两个变量之间的关系,并不能解释为什么两个变量有关系。相关不能解释两个变量的因果关...

2021-07-03 18:07:32 702

原创 第13章重复测量和双因素方差分析

重复测量方差分析变异的分解:将个体差异从分子、分母中都移除了自由度的计算:效应量计算:计算处理效应所解释的方差比例重复测量方差分析假设:1,...

2021-07-03 11:33:45 5184 1

原创 第12课联结表

联结:用来在一条select语句中关联表。使用特殊的语法,可以联结多个表返回一组输出,联结在运行时关联表中正确行。将数据分解为多个表能更有效的储存,方便处理,可伸缩性更好。可伸缩性:能够适应不断增加的工作量而不失败。如:products表只存储产品信息:产品名称、描述、价格、供应商ID。vendors表只储存供应商信息:供应商ID、供应商名、地址、联系方式。这样比存在同一个表中的好处是:供应商信息不重复,省时间空间。如果供应商信息变动,可以只更新venders表中的单...

2021-07-02 20:53:34 119

原创 第11课使用子查询

子查询:嵌套在其他查询中的查询。利用子查询进行过滤select o1 from o where o2 in (select o2 from pwhere p1='r1');首先执行(select o2 from pwhere p1='r1'),再执行select o1 from o where o2 in()。作为子查询的select语句只能查询单个列,否则会返回错误。作为计算字段使用子查询select c1,c2,...

2021-07-02 18:28:13 119

原创 第10课分组数据

使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。创建分组:group by 子句select p1,count(*) as nfrom p group by p1;group by 子句可以包含任意数目的列,因而可以对分组进行嵌套,更细致的进行数据分组。如果在group by子句中嵌套了分组,数据将在最后指定的分组上进行汇总。group by子句中列出的每一列必须是检索列或有效的表达式,但不能是聚集函数。如果在se...

2021-07-02 17:48:55 147

原创 第9课汇总数据

聚集函数:对某些行运行的函数,计算并返回一个值。Avg()函数:自动忽略NULL值。Select avg(p1) as a from p;Select avg(p1) as a from p where p2='a';Count()函数Select count(*) as c from p; 对表中的行进行计数,包括NULL行。Select count(p1) as c from p; 只对表中p...

2021-07-01 20:20:11 109

原创 第8课使用函数处理数据

每个DBMS都有特定的函数,只有少数几个函数被所有的DBMS支持。大多数SQL实现支持以下类型的函数。常用的文本处理函数日期和时间处理函数:可移植性最差Select o1 from o where year(o2)=2012;数值处理函数:用的最少但可移植性最好...

2021-07-01 20:14:22 116

原创 第7课创建计算字段

与列不同,计算字段并不实际存在于数据库表中。字段:基本和列意思相同。拼接字段将值联结到一起(将一个值附加到另一个值)构成单个值。Select concat(v1, ' (' ,v2, ')') from v order by v1; 拼接了v1,一个空格,左括号,v2,右括号。去掉多余空格的函数:RTRIM()去掉字符右边的空格,LTRIM()去掉字符左边的空格,TRIM()去掉字符左右两边的空格。Select r...

2021-07-01 20:08:50 145

原创 第6课用通配符进行过滤

like操作符前面介绍的操作符都是针对已知值进行过滤的。通配符:用来匹配值的一部分的特殊字符。为在搜索子句中使用通配符,必须使用like操作符。like后跟的搜索模式利用通配符而不是简单的相等匹配进行比较。通配符搜索只能用于文本字段(字符串)。百分号%通配符表示任何字符出现任意次数(不管有多少字符)。Select p1,p2 from p where p2 like 'b%'; 执行...

2021-07-01 20:02:06 156

原创 第5课高级数据过滤

组合where子句操作符:用来联结或改变where子句中的子句的关键字。And操作符Select p1,p2,p3 from p where v='a' and p2=10;or操作符检索匹配任一条件行Select p1,p2 from p where v='a' or p2='b';求值顺序Select p1,p2 from p where v1='a' or v2='b' and p2=10;...

2021-07-01 19:51:42 104

原创 第4课过滤数据

使用WHERE子句where子句在from子句之后。Order by 子句位于最后。Select p1,p2 from p where p2=3;where子句操作符不匹配检查Select p1,p2 from p where p2!=‘a’;范围值检查Select p1,p2 from p where p2 between 5 and 10;空值检查空值NULL,不同于0...

2021-07-01 19:48:06 122

原创 第3课排序检索数据

排序数据Select p1 from p order by p1;对p1列按字母顺序排序数据,order by 必须是最后一个子句。按多个列排序Select p1,p2,p3 from p order by p2,p3;按列位置排序Select p1,p2,p3 from p order by 2,3;指定排序方向:默认升序排序(字母A~Z),降序排序需指定desc关键字Se...

2021-07-01 19:43:29 113

原创 第2课检索数据

检索单个列SQL 语句不区分大小写 SELECT同select,但是表名、列名、值可能会区分大小写。单条语句结束后要加分号。语句中所有空格都会被忽略。Select p1 from p; 检索返回表中所有行,数据无过滤无排序。检索多个列Select p1,p2,p3 from p; 检索多个列,列名中间必须以逗号分隔。检索所有列Selecct * from p; 使用通配符...

2021-07-01 18:58:33 103

原创 第1课了解SQL

数据库:保存有组织的数据的容器。表:某种特定类型数据的结构化清单。 (要求同一类型,如,顾客的信息和库存的信息应该分2个表储存)模式:关于数据库和表的布局及特性的信息。列:表中的一个字段。每一列都有相应的数据类型。行:表中的一个记录。主键:一列或几列,其值能够唯一标识表中的每一行。任意两行都不具有相同的主键值。每一行都必须具有一个主键值(主键列不允许NULL值)。主键列中的值不允许修改或更新。主键值不能重用(如果某行从表中删除,它的主键不能赋给以后的新行)。可多列作为主键,所有列值的组.

2021-07-01 18:51:39 112

原创 第12章方差分析介绍

方差分析用以比较两组及以上处理之间的平均数差异的情况因素:方差分析中,用于分派组别的变量水平:因素的个别情形或个别值方差分析与t检验比较(为什么使用方差分析而不用t检验多次比较均值差异):检验α水平:做一个单独的假设检验时犯第一类错误的可能性。实验α水平:当一个实验包括多个不同的假设检验时,实验中全部独立的检验所犯第一类错误积累后的犯错总概率。通常,实验α水平比任何一个单独的检验的α值大。方差分析可在一次实验中同时进行三个及以上均值差异的比较,避免了实验α的膨胀。方差分析...

2021-07-01 00:44:42 1720

原创 第11章两个相关样本的t检验

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录 前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基

2021-06-30 16:14:25 4213

原创 第10章两个独立样本的t检验

独立样本的t检验效应大小计算: 样本方差和样本量在独立测量t检验中的作用:独立测量t检验的基本假设:1,每个样本的观察是独立的。2,样本来自的两个总体必须是正态分布。3,为了得到合理的合并方差,样本来自的两个总体必须有相同的方差。(方差的同质性,非常重要)【对于大样本(n30)来说,前...

2021-06-29 23:47:12 6500

原创 第9章t检验介绍

单样本t检验逻辑:假设检验的目的是得到未知总体的相关信息,但使用z分数需要知道未知总体的信息(需要总体的标准差计算标准误)。当总体方差未知时,可使用相应的样本数据代替。用样本标准差计算标准误:因为样本方差是总体方差的无偏估计,样本方差中自由度df=n-1,样本方差 S²=SS/n-1 (使用n-1使样本方差精确无偏差地估计总体方差)。t分数公式和z分数公式的区别:z分数使用的是实际的总体方差,t分数使用的是总体参数未知时相关样本的方差。样本的自由度越大,样本方差越能更好的代表总体方差,.

2021-06-29 22:51:35 1192

原创 第8章假设检验介绍

假设检验是一个推论的过程,它使用来自样本的数据得出关于总体的结论。这个过程开始于一个关于未知总体的假设。然后,选择一个样本,样本数据提供的证据可能支持或者拒绝假设。假设检验4个步骤:1,提出虚无假设,选择一个α水平。虚无假设提出不存在效应,在这种情况下,虚无假设提出接受处理的总体的均值与处理之前相同。α水平通常是0.05或0.01,它提供了关于“非常不可能”的定义,确定了犯第一类错误的概率。还需要提出备择假设,它是虚无假设的反面。2,定位拒绝域,拒绝域为虚无假设为真时极不可能出现的样本结果。3,收集数据

2021-06-29 22:25:24 1547

原创 第7章概率和样本:样本均值的分布

抽样分布:通过从总体红选择一定大小的随机样本得到的统计量的分布。(分布中的值不是分数,而是统计量)样本均值的分布:所有来自总体的样本量为n的随机样本的样本均值的分布。样本均值的分布是抽样分布的一个特例,也叫M的抽样分布。建立样本均值的分布步骤:1,从总体中选择一个样本量为n的随机样本,计算样本均值,2,再从总体中选择另一个样本量为n的随机样本,计算样本均值,3,重复以上过程,得到一系列可能的随机样本及样本均值,形成样本均值的分布。样本均值分布的特征:1,样本均值围绕总体均值分布,2,样本均值的分

2021-06-29 19:02:46 9365

原创 第6章概率和正态分布

一个特定事件A的概率被定义为一个比例:P(A)=分类为A的事件数量/所有可能结果的数量。这个定义值只对随机样本成立。随机抽样要求总体中的每个个体有相等的机会被选人样本,且如果样本的数量大于1,则每次选取个体被选中的概率不变。通过随机抽样得到的样本即为随机样本。随机样本必须满足两个要求:1,总体中的每个个体有相等的机会被选择,2,当多于一个个体被选择时,概率必须保持不变,这意味着必须有放回抽样。所有概率问题都能被转述为比例问题:对于正态分布,能在单位正态分布表中找到这些概率(比例),此表提供了正态

2021-06-29 18:42:40 441

原创 第5章分数的位置及标准化分布

z分数能指出每个X值在分布中的具体位置。其中,z分数的符号(+或-)表示该分数在平均数之上还是之下,数值表示该分数到平均数的距离等于几个标准差。z分数符号表示X位于平均值之上(正值)或之下(负数),z分数的数字表示X到平均数的标准差个数。根据z分数公式转换X值:把z分数转换成X值:对于总体 X=μ+zσ对于样本 X=M+zsz分布与原分布形状相同,平均数为0,标准差为1z分数接近0表示该分数接近平均数,具有代表性...

2021-06-29 18:33:27 609

原创 第4章变异性

变异性:分布中分数间差异的定量测量,描述了分数分散或聚集的程度。测量变异性的方法:全距、标准差、方差全距=最大值(精确上限)-最小值(精确下限)每个分数都可以通过它的离均差或到平均数的距离来描述。离均差=X-μ计算离均差的平方和SS步骤:1,计算每个分数的离均差(X-μ),2,给每个离均差取平方,3,求各离均差的的平方和。方差是离均差的平方的平均数(离均差的平方和SS除以N)。总体方差 σ²=SS/N样本方差 S²=SS/n-1标准差是方差...

2021-06-29 18:01:51 520

原创 第3章集中趋势的测量

测量集中趋势的目标是通过确定一个值来确定数据分布中心,以最好地描述整个分布情况。集中趋势的三种标准测量方式是众数、中数和平均数。平均值:将所有数据的总和除以数据个数所得的值。总体均值通常用μ表示,样本均值用M表示。改变分布中的任何一个数据都会使平均值发生变化。如果分布中的每个数据都增加一个常数,则平均数也将增加同样的常数。如果分布中的每个数据都乘以一个常数,则这组数据的平均数也将乘以该常数。均值是等距或等比量表数据的最佳代表。中数:将分布恰好等分为两部分的数据。当分布中有少数极端值时,均值将受影响,

2021-06-29 17:50:41 2734

原创 第1章统计学入门

参数:描述总体的特征统计量:描述样本的特征样本能代表总体,但不能完美准确描述总体,样本的统计量和相应总体参数之间存在差异,叫抽样误差描述统计:用来总结、整理、简化数据的统计方法推断统计:能够用于研究样本并对样本所属总体做出推论的技术变量:可以改变或者有不同取值的一种特征或情况常数:一个不变的、对每个个体都相同的特征或者环境寻找变量间关系的方法:相关法、实验法相关:可以观察两个变量并考察两者是否有联系,但只是简单描述了关系,没有解释因果关系。实验法:目的是建立两个变量之间的

2021-06-29 17:27:32 615 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除