数据库
文章平均质量分 68
阿尔卑斯山林
这个作者很懒,什么都没留下…
展开
-
【python】写入mysql数据库
在爬虫过程中,想要把爬取后的数据直接写入mysql数据库,经过多次尝试,几次报错,终于总结出一个比较稳定的步骤。原创 2023-05-09 00:53:51 · 1225 阅读 · 0 评论 -
SQL常见问题整理(五)
8.处理重复数据 (1)防止表中出现重复数据 使用primary key索引 create table person(last_name char(20) not null,first_name char(20) not null,address char(40),primary key(last_name,first_name)); 使用unique索引 create table person(last_name char(20) not null,first_name char(20) not null原创 2022-03-26 21:31:56 · 1321 阅读 · 0 评论 -
SQL常见问题整理(四)
7.统计技术 (1)计算描述性统计 整体特征: 观察的数量、总和及其范围(最小值和最大值) 集中趋势的度量,例如均值,中位数和众数 变化的度量,例如标准偏差和方差 统计信息: 中位数: 通过查询统计观察值的数量,根据这个数量,可以确定中位数的计算需要一个值还是两个值,以及在有序的观察值集合内它们排在第几个 通过包含order by子句的查询,对观察值进行排序,并利用limit子句提取中间的一个或两个值 .如果只有一个中间值,那么它就是中位数,如果中间值有两个,那么需要求它们的平均值 奇数个数:select原创 2022-03-25 21:14:26 · 1446 阅读 · 0 评论 -
SQL常见问题整理(三)
6.连接与子查询 (1)表之间的结合 join 内连接:生成的结果只显示两个表都有的值 外连接:不仅可以生成两个表都有的值,还可以显示只有一个表中存在的值 (2)查找表之间不匹配的行 使用外连接(left join 或right join):当需要一个表中找到没有匹配(或另一个表中不存在 )的值时,应该想“这是一个left join的问题” 另一个找出一个表有另一个表中没有的值的方法是not in子查询:select * from artist where a_id not in (select a_id原创 2022-03-24 23:21:20 · 439 阅读 · 0 评论 -
SQL常见问题整理(二)
5.汇总数据 (1)基本的汇总技巧 统计行数:count() 最大值或最小值:max()、min() 总和与平均值:sum()、avg() 去除重复:distinct() (2)查找与最小值和最大值相关的值 使用两个语句和一个用户定义的变量: set @max=(select max(pop) from states); select pop as ‘hightest population’,name from states where pop=@max; 使用子查询: select pop as ‘hig原创 2022-03-23 22:53:46 · 357 阅读 · 0 评论 -
SQL常见问题整理(一)
1.从表中查询数据 (1)指定查询的行与列 where子句 (2)指定查询结果中列的别名 as 注:不能在where子句中使用列别名 (3)查询结果排序 order by 降序排序在排序字段后加DESC 自定义排序:使用field()将列值映射到一个序列中,该序列可以按照所需的排序为列赋值order by field(name,‘Henry’,‘Suzi’,‘Ben’) (4)过滤重复行 distinct 统计唯一结果的数量 count(distinct A) (5)处理NULL值 is null、is n原创 2022-03-22 22:13:31 · 1533 阅读 · 0 评论