自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 SQL面试考点

1. join ① inner join:两张表进行连接查询时,只保留两张表中完全匹配的结果集 ② left join:在两张表进行连接查询时,只返回左表所有行,而右表中没有匹配的记录则会NULL ③ right join:只返回右表所有行,而左表中没有匹配的记录则会NULL④ full join:返回坐标和右表中所有没有匹配的行2. 集中排序窗口函数的区别 ① row_number():相同值排名不同,序号连...

2022-04-14 16:46:43 1600

原创 机器学习 part

一、基础归纳:从特殊到一般的“泛化”过程,即从具体事实归结出一般性规律演绎:从一般到特殊的“特化”过程,即从基础原理推演吃u具体状况假设空间:色泽、根蒂、敲声分别有3、2、2种取值,则假设空间规模为 4×3×3+1 = 37版本空间:现实问题中常面临很大的假设空间,但可能有多个假设与训练集一致,即存在着一个与训练集一致的假设集合,称为“版本空间”奥卡姆剃刀原则:若有多个假设与观察一致,则选择最简单的那个没有免费的午餐(NFL)定理:没有一个学习算法可以在任何领域总是产生最准确的学习器

2022-04-10 22:38:26 1926

原创 数据库面试

一、事务1. 数据库事务:是访问并可能操作各种数据项的一个数据库操作序列,这些操作要么全部执行,要么全部不执行,是一个不可分割的工作单位。事务由事务开始与事务结束之间执行的全部数据库操作组成。2. 数据库事务特性① 原子性:事务组为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行② 一致性:事务应确保数据库的状态从一个抑制状态转变为另一个一致状态。一致状态的含义时数据库中的数据应满足完整性约束③ 隔离性:多个事务并发执行时,一个事务的执行不应影响其他事务的执行④

2022-04-05 22:46:39 1248

原创 数据仓库 & OLAP

一、数据库 vs. 数据仓库1. 构建目的不同:数据库主要用于实现企业的日常业务管理,提高业务运营的效率数据仓库用于将多个数据源的数据进行集成,用于分析,结果辅助决策2. 管理数据不同:数据库通常只包含当前数据,避免冗余,数据的组织应按照业务过程设计的数据实现,由应用驱动数据仓库中的数据按主题组织,以便分析;为方便查找存在大量冗余,通常存放历史数据3. 管理方法不同:数据库需频繁进行增删改等更新操作。除了要通过创建事务和处理的正确性外,还需复杂的并发控制机制保证事务运行的隔离性。(更新操

2022-03-29 12:30:30 2688

原创 Hadoop、Spark、Flink、Kafka

一、HadoopHadoop是一套大数据计数组件,三大核心组件: ① HDFS:Hadoop分布式文件系统。解决分布式系统的文件存储问题,本质是提供一套跨机器的文件管理服务。 ② MapReduce:Hadoop的分布式运算程序编程框架 ③ Yarn:Hadoop的分布式运算资源调度系统。解决分布式运算程序的启动、资源调度和资源回收。Hadoop外围组件: ① Hive:基于HDFS和MapReduce的sql工具 ...

2022-03-29 12:26:23 3771

原创 每日SQL day2

select date(in_time) as dt, round(sum(timestampdiff(second,in_time, out_time))/count(distinct uid),1) as avg_viiew_len_secfrom tb_user_logwhere date_format(in_time, "%Y-%m") = "2021-11" and artical_id!=0group by dtorder by avg

2022-03-27 13:52:37 406

原创 每日SQL day1

题目来源:牛客网sql大厂面试真题 01某音短视频问题1select t1.video_id, round(sum(if(t1.end_time-t1.start_time >= t2.duration, 1,0))/count(t1.start_time),3) as avg_comp_play_ratefrom(select * from tb_user_video_log where year(start_time) = 2021)t1le.

2022-03-25 13:27:18 1033

原创 Linux常用命令

Tab 键可以实现自动补全和提示;history 可以显示历史执行记录,也可使用方向键来切换前后执行过的命令一、Linux常用操作命令1. ls 显示指定工作目录下的内容ls -a 显示所有文件及目录(·开头的隐藏文件也会列出)ls-l 或者 ll 显示文件名、文件型态、权限、拥有者、文件大小等内容 ls -la2. cd 切换当前工作目录 cd ...

2022-03-24 18:49:13 1076

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除