- 博客(20)
- 收藏
- 关注
原创 数据分析Part 1 描述统计分析
(一)描述数据常用的4个指标 1.平均值 计算简单,但是易受异常值、极端值的影响 2.四分位数 2.1中位数 1)将数字从小到达排序 2)中间位置:奇数即为中间的数,偶数为中间两个数的平均值 2.2四分位数 上界:数据中最大值 下界:数据中最小值 Q1下四分位数:下界到中位数的中点 Q2中位数 Q3上四分位数:上界到中位数的中点 2.3箱线图 中位数若离下四分位数较近,说明大部分数据集中在下端及在...
2020-04-15 17:40:33
614
原创 机器学习:第二章 单变量线性回归
2.1模型表示 监督学习:对于每一个数据来说,都给出了“正确答案” 回归:根据之前的数据预测一个准确的输出值 分类:预测离散的输出值 训练集:监督学习中已有数据的数据集 m:代表训练集中实例的数量 x :代表特征/输入变量 y :代表目标变量/输出变量 (x,y): 代表训练集中的实例 (x(i),y(i) ): 代表第 i 个观察实例 h :代表学习算法的解决方案或函数也称为假设(hypothe...
2020-03-18 22:30:53
350
原创 MySQL必知必会:第二十章 更新和删除数据
1.更新数据 UPDATE:更新表中特定行;更新表中所有行 UPDATE语句组成: 要更新的表 列名和他们的新值 确定要更新行的过滤条件 UPDATE `customers` SET cust_email='elmaei@fudd.com' WHERE cust_id=10005 UPDATE `customers` SET cust_email='elmaei@fudd.com', cu...
2020-03-17 23:24:43
250
原创 MySQL必知必会:第十九章 插入数据
1.插入完整的行 INSERT INTO customers VALUES ( NULL, 'pep e.lapew', '100 main street', 'los angeles', 'CA', '90046', 'USA', NULL, NULL) #各个列必须以它们在表中出现的次序进行填充 #一般最好在表名后面加上列名 插入多个行时...
2020-03-16 22:52:01
184
原创 MySQL必知必会:第十八章 全文本搜索
1.通配符和正则表达式限制 性能:通配符和正则表达式匹配通常要求MySQL尝试匹配表中所有行由于行数的增加,搜索可能非常耗时 明确控制:很难明确的控制匹配什么,不匹配什么 智能化的结果:不能提供智能化的选择结果的方法 2.使用全本文搜索 必须索引被搜索的列,而且要随着数据的改变不断地重新索引,在索引之后,SELECT 可与Match()和 Against()一起使用进行搜索 2.1启用全文本搜...
2020-03-16 22:20:07
232
原创 MySQL必知必会:第十七章 组合查询
1.组合查询 组合查询:允许执行多个查询,并将结果作为单个查询结果集返回 以下情况需要使用组合查询: 在单个查询中从不同表返回类似结构的数据 对单个表执行多个查询,按单个查询返回数据 2.创建组合查询 2.1UNION操作符:在各条SELECT语句之间放上关键字UNION即可 表示执行两条SELECT语句,并把输出组合成单个查询结果集 SELECT * FROM products WHERE...
2020-03-15 20:44:34
177
原创 MySQL必知必会:第十六章 创建高级联结
1.自联结 自联结通常作为外部语句用来替代从相同表中检索数据时使用的子查询语句. 因为处理联结要比子查询快得多. #子查询 SELECT prod_id,prod_name FROM products WHERE vend_id IN ( SELECT vend_id FROM products WHERE prod_id='DTNTR') #自联结 SELECT b.prod_id,b.p...
2020-03-15 16:42:58
224
原创 MySQL必知必会:第十五章 联结表
1.关系表 例子: 假如有一个包含产品目录的数据库表,其中每种类别的物品占一行。对于每种物品要储存的信息包括描述和价格,以及生产该产品的供应商信息。现在,假如有由同一供应商生产的多种物品,那么在何处储存供应商信息呢? 可建立两个表,一个存储供应商信息,另一个存储产品信息。vendors表包含所有供应商信息,每个供应商占一行,每个供应商具有唯一的标识。此标识为主键,可以...
2020-03-15 15:18:51
181
原创 MySQL 练习题
本来是50题,做题中发现有重复,删去了一道,剩49 数据 ```mysql CREATE TABLE `Student`( `s_id` VARCHAR(20), `s_name` VARCHAR(20) NOT NULL DEFAULT '', `s_birth` VARCHAR(20) NOT NULL DEFAULT '', `s_sex` VARCHAR(1...
2020-03-13 23:08:16
191
原创 MySQL必知必会:第十四章 使用子查询
1.利用子查询进行过滤 子查询总是从内向外处理 #列出订购TNT2的全部客户信息 SELECT * FROM customers WHERE cust_id IN ( SELECT cust_id FROM orders WHERE order_num IN ( SELECT order_num FROM orderitems WHERE prod_id = 'TNT2')) 2.作为计算...
2020-03-12 22:43:27
227
原创 MySQL必知必会:第十三章 分组数据
1.分组GROUP BY() SELECT vend_id,COUNT(*) AS num_prods FROM `products` GROUP BY vend_id 注意: GROUP BY()可以包含任意数目的列,这使得能对分组进行嵌套,为数据分组提供更细致的控制 如果在GROUP BY()子句中嵌套了分组,数据将在最后规定的分组上进行汇总 GROUP BY()子句中列出的每个列都必须是...
2020-03-10 22:29:48
556
原创 MySQL常见问题
1.UUID – UUID是通用唯一识别码的缩写,其目的是让分布式系统中的所有元素都能有唯一的便是信息,而不需要通过中央控制端来做辨识信息的指定。 – 三部分:时间戳生成的时间信息、主机的硬件时钟序列、主机的唯一机器识别号 SELECT UUID(); – 输出:5e37e7fc-5e0f-11ea-a3e6-000c298c86f1 – 为了避免每个MySQL各自生成的主键产生重复 – UUI...
2020-03-10 18:58:55
227
原创 MySQL必知必会:第十二章 汇总数据
1.聚集函数 聚集函数:运行在行组上,计算和返回单个值的函数。 函数 说明 AVG() 返回某列的平均值 COUNT() 返回某列的行数 MAX() 返回某列的最大值 MIN() 返回某列的最小值 SUM() 返回某列之和 1.1AVG() 可以用来返回在所有列的平均值,也可以用来返回特定列的平均值 SELECT AVG(prod_price) AS avg_p...
2020-03-09 23:10:41
229
原创 MySQL必知必会:第十一章 使用数据处理函数
1.函数 大多数SQL实现支持以下函数: (1)用于处理文本串的文本函数(如删除or填充值,转换大小写等) (2)用于在数值数据上进行算数操作的数值函数 (3)用于处理日期和时间值并从这些之中提取特定成分的日期和时间函数(如返回两个日期之差,检查日期的有效性等) (4)返回DBMS正使用的特殊信息(如返回用户登录信息,检查版本细节)的系统函数 2.文本处理函数 函数 说明 Left...
2020-03-08 12:35:01
209
原创 MySQL必知必会:第十章 创建计算字段
1.concat()语句:拼接 将值连起来构成单个值,concat()语句 #vend_name(vend_country) SELECT CONCAT(vend_name,'(',vend_country, ')') FROM vendors 2.RTrim():去掉右边的所有空格;LTrim():去掉右边的所有空格; SELECT CONCAT(RTRIM(vend_name),'(',R...
2020-03-05 22:24:20
170
原创 MySQL必知必会:第九章 用正则表达式进行搜索
1.正则表达式 正则表达式:是用来匹配文本的特殊的串(字符集合) 使用MySQL正则表达式 2.基本的字符匹配 使用like SELECT prod_name FROM products WHERE prod_name LIKE '%1000%'; 使用正则表达式 SELECT prod_name FROM products WHERE prod_name REGEXP '1000'; LIK...
2020-03-05 21:05:34
224
原创 MySQL特别的CRUD
1.IGNORE表示忽略错误,继续执行下面的 INSERT IGNORE INTO t_dept(deptno,dname,loc) VALUES (40,'企划部','北京'), (50,'培训部','上海'), (60,'后勤部','北京'), (70,'技术部','北京'), (80,'市场部','北京') 就算中途某条执行错误,MySQL还是会继...
2020-03-05 19:59:30
303
原创 机器学习Day1
1.机器学习定义 卡内基梅隆大学的Tom Mitchell提出,机器学习是一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时性能有所提升。 2.监督学习 监督学习的基本思想是数据集中的每个样本都有相应的“正确答案”,再根据样本做出预测。就是说数据集中每个样本会明确标出是正样本还是负样本。 3.分类与回归 分类:目的是预测离散的输出值 回...
2020-02-23 19:28:54
151
原创 DID双重差分模型Day1
1985年普林斯顿大学的Ashenfelter和Card的一篇论文中,第一次引入了DID模型;2001年哈佛大学公共卫生学院学者使用DID模型对中国海南省的医疗报销付费制度改革进行了分析;2001年杜克大学学者对美国保险制度对于妇幼健康的影响进行了研究;2005年,中国学者周黎安。陈烨使用DID模型的思路,运用7个省591个县市级数据对我国农村税费改革政策的效果进行系统的评价,这是国内学者首次运用...
2020-02-19 19:50:55
8866
1
原创 Day1关于正则表达式小小的复习
正则表达式:查看一个字符串是否与我们所设定的字符串相匹配;快速检索文本,实现一些替换文本的操作。 import re a='asd-dfa-ggr' r=re.findall('asd',a) print(r) 元字符 \d表示数字0-9 \D匹配非数字 \w全部数字和字母和下划线_ \W非单词字符空格啊换行啊\n\t等 \s空白字符 .匹配除换行符\n之外的其他所有字符 ...
2020-02-16 22:08:57
185
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅