![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 54
cqu_shuai
实事求是,不自以为是
展开
-
MySQL——Linux版MySQL安装
参考链接https://www.bilibili.com/video/BV1KW411u7vy?p=3Linux版MySQL安装下载地址官网下载地址:http://dev.mysql.com/downloads/mysql/下载MySQL-server和MySQL-client RPM包检查当前系统是否安装过MySQL查询命令:rpm -qa|grep -i mysql删除命令:rpm -e RPM软件包名(使用上一个命令查出来的名字)如果安装过,查询命令会得到软件名;如果没装过,则没原创 2021-09-02 21:35:06 · 93 阅读 · 0 评论 -
MySQL——流程控制结构
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=170流程控制结构顺序结构:程序从上往下依次执行分支结构:程序从两条或多条路径中选择一条去执行循环结构:程序在满足一定条件的基础上,重复执行一段代码分支结构if函数功能:实现简单的双分支语法:IF(表达式1,表达式2,表达式3)执行顺序:如果表达式1成立,则if函数返回表达式2的值,否则返回表达式3的值应用:任何地方case结构特点:可以作为表达式,嵌原创 2021-09-01 16:39:22 · 66 阅读 · 0 评论 -
MySQL——存储过程和函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=155存储过程含义:一组预先编译好的SQL语句的集合,理解成批处理语句提高代码的重用性简化操作减少了编译次数并且减少了和数据库服务器的连接次数,提高了效率创建语法CREATE PROCEDURE 存储过程名(参数列表)BEGIN存储过程体(一组合法的SQL语句END注意:参数列表包含三部分:参数模式、参数名、参数类型举例:IN stuname VARCH原创 2021-09-01 14:35:11 · 62 阅读 · 0 评论 -
MySQL——变量
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=151变量系统变量变量由系统提供,不是用户定义的,属于服务器层面全局变量作用域:服务器每次启动将为所有的全局变量赋初始值,针对于所有的会话(连接)有效,但不能跨重启会话变量作用域:仅仅针对于当前会话(连接)有效使用的语法:查看所有的系统变量SHOW GLOBAL|【SESSION】 VARIABLES;查看满足条件的部分系统变量SHOW GLOBAL|【SESSION】原创 2021-09-01 13:31:29 · 122 阅读 · 0 评论 -
MySQL——视图
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=139视图MySQL从5.0.1版本开始提供视图功能。一种虚拟存在的表,行和列的数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的,只保存了SQL逻辑,不保存查询结果视图 vs 表视图创建语句:create view;;表创建语句:create table;视图只是保存了SQL逻辑,不实际占用物理空间;表保存了数据,实际占用物理空间视图也可以增删改查,但一般不能增删改原创 2021-09-01 12:19:39 · 102 阅读 · 0 评论 -
MySQL——事务控制语言TCL
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=134事务控制语言(TCL, Transaction Control Language)事务事务由单独单元的一个或多个SQL语句组成,在这个单元中,每个SQL语句是相互依赖的。而整个单独单元作为一个不可分割的整体,如果单元中某条SQL语句一旦执行失败或产生错误,整个单元将会回滚。所有受到影响的数据将返回到事务开始以前的状态;如果单元中的所有SQL语句均执行成功,则事务被顺利执行MySQL中的存储原创 2021-08-31 23:49:34 · 103 阅读 · 0 评论 -
MySQL——数据定义语言(DDL)
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=111数据定义语言(DDL)概述数据定义语言:库和表的管理创建:create删除:drop修改:alter库的管理库的创建语法:create database [if not exists] 库名;例如,创建库BooksCREATE DATABASE IF NOT EXISTS books;库的修改更改库名RENAME DATABASE books TO 新库名原创 2021-08-30 22:15:34 · 228 阅读 · 0 评论 -
MySQL——删除语句
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=107删除语句方式一:delete语法单表的删除DELETE FROM 表名WHERE 筛选条件;多表的删除SQL92:DELETE 表1的别名, 表2的别名FROM 表1 别名, 表2 别名WHERE 连接条件AND 筛选条件;SQL99:DELETE 表1的别名, 表2的别名FROM 表1 别名INNER|LEFT|RIGHT JOIN 表原创 2021-05-29 21:33:01 · 9833 阅读 · 0 评论 -
MySQL——修改语句
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=105&spm_id_from=pageDriver修改语句修改单表的记录语法UPDATE 表名SET 列=新值, 列=新值, ...WHERE 筛选条件案例比如,“修改beauty表中姓唐的女神的电话为13899888899”UPDATE beautySET phone='13899888899'WHERE NAME LIKE '唐%';又如,“修改原创 2021-05-29 20:50:32 · 17947 阅读 · 1 评论 -
MySQL——插入语句
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=102插入语句语法方式一INSERT INTO 表名(列名,...)VALUES (值1,...);方式二INSERT INTO 表名SET 列名=值, 列名=值, ...案例插入的值的类型要与列的类型一致或兼容INSERT INTO beauty(id,NAME,sex,borndate,phone,photo,boyfriend_id)VALUES(13,'原创 2021-05-29 20:20:44 · 19258 阅读 · 0 评论 -
MySQL——联合查询
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=100联合查询将多条查询语句的结果合并成一个结果语法查询语句1UNION查询语句2UNION...应用场景要查询的结果来自于多个表,且多个表没有直接的连接关系,但查询的信息一致时特点要求多条查询语句的查询列数是一致的要求多条查询语句的查询的每一列的类型和顺序最好一致UNION关键字默认去重,如果使用UNION ALL可以包含重复项案例比如,“查询部门编号>90原创 2021-05-29 19:55:27 · 66 阅读 · 0 评论 -
MySQL——分页查询
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=95分页查询应用场景当要显示的数据,一页显示不全,需要分页提交sql请求。语法SELECT 查询列表FROM 表JOIN TYPE 表2ON 连接条件WHERE 筛选条件GROUP BY 分组字段HAVING 分组后的筛选ORDER BY 排序的字段LIMIT offset,size;offset:要显示条目的起始索引(起始索引从0开始),可选size:原创 2021-05-29 18:30:18 · 142 阅读 · 0 评论 -
MySQL——子查询
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=87子查询含义出现在其他语句中的select语句,称为子查询或内查询外部的查询语句,称为主查询或外查询分类按子查询出现的位置select后面:仅仅支持标量子查询from后面:支持表子查询,要求必须起别名where或having后面【重点】:标量子查询(单行)【较多】、列子查询(多行)【较多】、行子查询(使用较少)exists后面(相关子查询):表子查询按结果集的行列数不同原创 2021-05-29 18:07:43 · 68 阅读 · 0 评论 -
MySQL——连接查询(sql92和sql99)
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=69连接查询含义连接查询,又称多表查询,当查询的字段来自于多个表时,就会用到连接查询笛卡尔乘积现象如果表1有m行,表2有n行,结果=m*n行。发生原因是没有有效的连接条件。分类按年代分类sql92标准:仅仅支持内连接sql99标准【推荐】:支持内连接+外连接(左外和右外)+交叉连接按功能分类内连接等值连接非等值连接自连接外连接左外连接右外连接全外连接交叉原创 2021-05-17 00:27:12 · 253 阅读 · 0 评论 -
MySQL——分组查询
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=59分组查询语法SELECT 分组函数,列(要求出现在GROUP BY的后面)FROM 表WHERE 筛选条件GROUP BY 分组的列表、ORDER BY 字句注意查询列表必须特殊,要求是分组函数和GROUP BY后出现的字段特点分组查询中的筛选条件分为两类:a)分组前筛选。数据源是原始表,位置在group by子句的前面,关键字是where;b)分组后筛选。数据原创 2021-05-16 15:21:05 · 129 阅读 · 0 评论 -
MySQL——常见函数之分组函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=53分组函数功能用作统计使用,又称为聚合函数或统计函数或组函数分类sum求和avg平均值max最大值min最小值count计算个数简单使用SELECT SUM(salary)FROM employees;SELECT AVG(salary)FROM employees;SELECT MIN(salary)FROM employees;SELECT原创 2021-05-10 10:36:27 · 240 阅读 · 1 评论 -
MySQL——常见函数之其他函数和流程控制函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=48其他函数SELECT VERSION();SELECT DATABASE();SELECT USER();流程控制函数if函数if else的效果SELECT IF(10<5,'大','小');SELECT last_name, commission_pct, IF(commission_pct IS NULL,'没奖金,呵呵','有奖金,嘻嘻') 备注FRO原创 2021-05-09 18:03:50 · 174 阅读 · 0 评论 -
MySQL——常见函数之日期函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=47日期函数now返回当前系统日期+时间SELECT NOW();curdate返回当前系统日期,不包含时间SELECT CURDATE();curtime返回当前时间,不包含日期SELECT CURTIME();获取指定的部分,年、月、日、小时、分钟、秒年SELECT YEAR(NOW()) 年;SELECT YEAR('1998-1-1') 年;S原创 2021-05-09 17:39:34 · 127 阅读 · 1 评论 -
MySQL——常见函数之数学函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=46数学函数round四舍五入SELECT ROUND(-1.55);指定位数SELECT ROUND(1.567,2);ceil向上取整,返回大于等于该参数的最小整数SELECT CEIL(1.00);floor向下取整,返回小于等于该参数的最大整数SELECT FLOOR(-9.99);truncate截断SELECT TRUNCATE(1.69原创 2021-05-09 16:32:41 · 89 阅读 · 0 评论 -
MySQL——常见函数之字符函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=43函数概念将一组逻辑语句封装在方法体中,对外暴露方法名好处隐藏了实现细节提高代码的重用性调用SELECT 函数名(实参列表)FROM 表;特点函数名函数功能分类单行函数。如concat、length、ifnull等分组函数。做统计使用,又称为统计函数、聚合函数、组函数。单行函数字符函数length获取参数值的字节个数SELECT LENGTH原创 2021-05-09 16:20:03 · 73 阅读 · 0 评论 -
MySQL——排序查询
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=39排序查询语法SELECT 查询列表FROM 表WHERE 筛选条件ORDER BY 排序列表ASC|DESC;特点ASC代表的是升序,DESC代表的是降序,如果不写,默认是升序ORDER BY字句中可以支持单个字段、多个字段、表达式、函数、别名ORDER BY字句一般放在查询语句的最后面,limit字句除外普通排序查询比如,“查询员工信息,要求工资从高到低排序原创 2021-05-09 15:42:22 · 119 阅读 · 0 评论 -
MySQL——安全等于<=>
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=36安全等于 <=>安全等于既可以判断NULL值,又可以判断普通的数值。比如,“查询没有奖金的员工名和奖金率”SELECT last_name, commission_pctFROM employeesWHERE commission_pct <=>NULL;又如,“查询工资为12000的员工信息”SELECT last_name, salaryF原创 2021-05-09 14:50:36 · 1540 阅读 · 1 评论 -
MySQL——条件查询(条件表达式、逻辑表达式和模糊查询)
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=31条件查询语法SELECT 查询列表FROM 表名WHERE 筛选条件;分类按条件表达式筛选简单条件运算符:>、<、=、!=、<>、>=、<=例如,“查询工资>12000的员工信息”SELECT *FROM employeesWHERE salary>12000又如,“查询部门编号不等于90号的员工名和部门编号”原创 2021-05-09 14:47:42 · 1413 阅读 · 0 评论 -
MySQL——IFNULL函数
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=27IFNULL函数表中某些字段有些行是NULL值,这样在进行拼接等操作时失败,我们需要在遇到NULL值时,将其替换为一个别的值,比如0。我们可以这样写:IFNULL(commission_pct,0)具体在拼接任务中,如“显示出表employees的全部列,各个列之间用逗号连接,列头显示成OUT_PUT”:SELECT CONCAT(first_name,',',last_name,',原创 2021-05-09 13:03:09 · 689 阅读 · 0 评论 -
MySQL——基础查询、取别名、去重和拼接等
基础查询语法select 查询列表 from 表名;特点查询列表可以是:表中的字段、常量值、表达式、函数查询的结果是一个虚拟的表格查询表中的单个字段SELECT last_name FROM employees;查询表中的多个字段SELECT last_name,salary,email FROM employees;查询表中的所有字段可以列出表中的所有字段名,好处是可以根据需求调整字段的顺序SELECT 字段1,字段2,...,字段n FROM employees;原创 2021-05-09 12:47:07 · 529 阅读 · 0 评论 -
MySQL基本概念和操作
参考链接https://www.bilibili.com/video/BV12b411K7Zu?p=1基本概念数据库的好处持久化数据到本地可以实现结构化查询,方便管理数据库的相关概念DB:数据库,保存一组有组织的数据的容器DBMS:数据库管理系统,又称为数据库软件(产品),用于管理DB中的数据SQL:结构化查询语言,用于和DBMS通信的语言数据库存储数据的特点将数据放到表中,表再放到库中一个数据库中可以有多个表,每个表都有一个名字,用来标识自己。表名具有唯一性表具有一原创 2021-05-09 12:05:54 · 145 阅读 · 0 评论 -
数据分析入门——各种数据源
数据源开放数据集一般是针对行业的数据库。比如:美国人口调查局提供人口信息,地区分布和教育情况等美国公民相关的数据:http://www.census.gov/data.html欧盟欧盟开放数据平台,提供欧盟各机构的大量数据:http://open-data.europa.eu/en/data/FacebookFacebook官方提供的API,用于查询该网站用户公开的海量信息:https://developers.facebook.com/docs/graph-apiAmazon亚马逊网络原创 2021-01-24 23:27:25 · 1307 阅读 · 0 评论 -
数据分析入门——用户画像建模
用户画像建模可以分为三步:1.统一化;2.标签化;3.业务化。统一化统一用户的唯一标识。用唯一标识是整个用户画像的核心。设计唯一标识可以从这些项中选择:用户名、注册手机号、邮箱、设备号、CookieID等。标签化给用户打标签,即用户画像。从四个维度进行标签划分:用户标签:包括性别、年龄、地域、收入、学历、职业等。这些包括了用户的基础属性。消费标签:消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。行为标签:时间段、频次、时长、访问路径。这些是通过分析用户行为,来得到原创 2021-01-24 22:41:18 · 2690 阅读 · 0 评论 -
数据分析入门——Pandas的常用操作
为什么使用PandasPandas提供的基础数据结构DataFrame与json的契合度很高;语言简洁、功能强大。Series和DataFrame是Pandas的两个核心数据结构,分别代表一维的序列和二维的表结构。SeriesSeries是个定长的字典序列,因为在存储的时候,相当于两个ndarray。Series有两个基本属性:index和values。index默认是递增的整数序列:0,1,2,…。也可以自定义索引,如index=[‘a’,‘b’, …]。import pandas a原创 2021-01-21 20:21:28 · 900 阅读 · 1 评论 -
pandas小笔记——去除数据中的NaN值
Pandas 会为缺少的值分配 NaN 值。我们可以选择对这些NaN值对应的行列进行删除,也可以选择填充。删除NaN值data.dropna(how = ‘all’) # 传入这个参数后将只丢弃全为缺失值的那些行data.dropna(axis = 1) # 丢弃有缺失值的列data.dropna(axis=1,how=“all”) # 丢弃全为缺失值的那些列data.dropna(axis=0,subset = [“Age”, “Sex”]) # 丢弃‘Age’和‘Sex原创 2020-12-19 01:37:21 · 27573 阅读 · 1 评论 -
数据分析入门——NumPy的常用操作
为什么使用NumPy而不是listlist的元素在系统内存中是分散存储的,而NumPy数组存储在一个均匀连续的内存块中。这样数组在遍历时不像list需要对内存地址进行查找,从而节省了计算资源。在内存访问模式中,缓存会直接把字节块从RAM加载到CPU寄存器中,因为数据连续地存储在内存中,NnumPy直接利用现代CPU的矢量化指令计算,加载寄存器中的多个连续浮点数。NumPy中的矩阵运算可以采用多线程的方式,充分利用多核CPU计算资源,大大提升了计算效率。ndarray对象(N-dime原创 2021-01-14 15:42:14 · 241 阅读 · 0 评论