自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 牛客sql练习 -84

描述分组计数每日简历总数考点日期范围限定:BETWEN AND 最快in 数字比 in 字符 快SELECT job, SUM(num) cntFROM resume_info# 最快WHERE date BETWEEN '2025-01-01' AND '2025-12-31'# 直接写数字会比字符执行快# WHERE year(date) = 2025# WHERE year(date) = ‘2025’GROUP BY jobORDER BY cnt DESC;

2021-07-04 20:20:22 79

原创 牛客sql练习 - 71

描述牛客每天有很多人登录,请你统计一下牛客每个日期新用户的次日留存率drop table if exists login;CREATE TABLE `login` (`id` int(4) NOT NULL,`user_id` int(4) NOT NULL,`client_id` int(4) NOT NULL,`date` date NOT NULL,PRIMARY KEY (`id`));INSERT INTO login VALUES(1,2,1,'2020-10-12')

2021-07-04 13:43:55 94

原创 牛客sql练习 - 69

描述牛客每天有很多人登录,请你统计一下牛客每个日期登录新用户个数drop table if exists login;CREATE TABLE `login` (`id` int(4) NOT NULL,`user_id` int(4) NOT NULL,`client_id` int(4) NOT NULL,`date` date NOT NULL,PRIMARY KEY (`id`));考点分组计数除了用count group by也可以用 sum(case )# 对满足

2021-07-03 19:04:52 119

原创 牛客sql练习 - 68

描述牛客每天有很多人登录,请你统计一下牛客新登录用户的次日成功的留存率考点次日留存率 = 次日留存用户数/用户数次日留存用户 = 首次登陆后第二天继续登陆的用户SELECT COUNT(DISTINCT a.user_id)/(SELECT COUNT(DISTINCT user_id) FROM login) (SELECT *,MIN(date) OVER(PATITION user_id) first_day FROM login) aWHERE DATEDIFF(date,f

2021-07-01 22:55:58 83

原创 牛客sql练习 - 60

描述求salary的累计和running_totalCREATE TABLE `salaries` ( `emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMARY KEY (`emp_no`,`from_date`));考点把sum聚合函数作为窗口函数使用SELECT emp_no, salary SUM(salary

2021-06-23 00:12:05 88

原创 牛客sql练习 - 51

考点length 和 replace 的用法select length('10,A,B') -length(replace('10,A,B',",",""))# hive sqlSELECT size(split('10,A,B', ',')) - 1 ;

2021-06-14 00:11:01 67

原创 牛客sql练习-50

描述将employees表中的所有员工的last_name和first_name通过(’)连接起来。CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hire_date` date NOT NUL

2021-06-14 00:06:49 60

原创 牛客sql练习-48

描述请你写出更新语句,将所有获取奖金的员工当前的(salaries.to_date=‘9999-01-01’)薪水增加10%。注:emp_bonus里面的emp_no都是当前获奖的所有员工create table emp_bonus(emp_no int not null,btype smallint not null);# why 建表语句不一样CREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NO

2021-06-13 23:56:15 65

原创 牛客sql练习-46

描述在audit表上创建外键约束,其emp_no对应employees_test表的主键id。(以下2个表已经创建了)CREATE TABLE employees_test(ID INT PRIMARY KEY NOT NULL,NAME TEXT NOT NULL,AGE INT NOT NULL,ADDRESS CHAR(50),SALARY REAL);CREATE TABLE audit(EMP_no INT NOT NULL,create_date datetime N

2021-06-13 23:55:40 72

原创 数据分析 - 基础知识考查(1)

1. 统计基础概念1.1 随机试验定义:在相同条件下对随机现象进行大量重复观测特点:可重复试验试验前不知道试验结果所有可能出现的试验结果是已知的1.2 随机变量定义:随机试验的结果分类:根据所描述的随机试验的所有可能结果是否可数分为:离散型随机变量连续型随机变量1.3 样本定义:每次随机试验的结果记录2.常用随机变量及分布2.1 离散型随机变量伯努利分布(0-1分布)二项分布(n重伯努利分布)泊松分布(单位时间或空间内随机事件发生的次数)

2021-06-06 18:53:16 59

原创 数据分析面试题

聊学校数学课的成绩聊项目细节聊两个熟悉的机器学习模型机器学习模型适用的场景,出现过拟合的解决办法对数据分析的理解SQL左连接与执行顺序SELECT * FROM t1JOIN t2 ON t1.id = t2.id AND t2.value >=30只是在连接表,没有条件选择SELECT * FROM t1 JOIN t2 ON t1.id = t2.id WHERE t2...

2019-10-23 21:57:53 350

原创 数据分析(技术方向)面试题

1 说一下大数定律和应用场景2 数据清理经常用什么库3 dataframe和series的区别4 数据可视化经常画什么图5 说一下AUC值6 说一下决策树是怎么生长的7 说一下word2vec8 写一个sql题...

2019-10-21 21:58:37 239 1

原创 SQL实用题型-计算工作经历为先在谷歌后在亚马逊的人数

面试货拉拉被问到的sql题,当时没想出来,回来的时候突然想到了,可能会有更好的解决方法,这里介绍一种笨方法,题目如下:给定表table1 如下:idcompanyyearAGoogle2016AAmazon2017AIBM2018BGoogle2016BAmazon2019CGoogle2016CIBM201...

2019-10-21 21:51:38 412

原创 记录一下Mac - git 连接

创建name和emailgit config --global user.name "name"git config --global user.email "email"创建keyssh-keygen -t rsa -C "email"查看keycat .ssh/id_rsa.pub在github中添加key验证连接ssh -T [email protected] 在git...

2019-10-12 11:03:09 94

原创 SQL实用题型-实现翻页

面试的时候被问到的题,第一反应是用ntile()开窗函数,但是被否决了,回头想一想,明明就是可以的呀,不过还是在这里总结一下常用的实现翻页的方法。1.翻页定义输入:page(页码),pagesize(每一页的数据条数)输出:该页对应的数据2.sql实现实现1:思路:只要跳过(页数-1)*页容量 后按照容量取数即可实现跳过这一操作可以对页码生成一个新的标签,利用where判断标签大...

2019-10-12 00:34:25 686

原创 SQL实用题型-列转行

面试的时候被问到的,第一想法是python里面pandas的用法,然后完全想不到sql要怎么做,现在来总结一下。1. 理解列转行假定我们有一个长数据表如下:table:yearmonthamount201812020182902018350201843020181202019260201931020...

2019-10-11 23:35:56 141

原创 mysql在MacOS的配置

1.从官网下载文件包本地安装好后:系统偏好设置 - 最后一个图标如下:点击进入后界面如下:点击 倒数第二个键:Initialize Database(初始化数据库),如下:设置一个数据专用的简单密码,点击OK后,回到上一界面。点击:Start MySQL Sever 后,输入电脑开机登陆的密码(不是刚刚设置的那个),然后等几秒,就可以看到程序前面的小圆圈变成绿色的了。2.查看是否sq...

2019-10-11 19:10:38 331

原创 数据研发面试题集合

数据库的索引结构 -B+树为什么用B+树 -更矮更宽,所有数据都只存在叶节点上,磁盘效率的,同样节点数,比较稳定,查询效率是相当的队列和栈的区别,先进先出,先进后出多态是什么意思-允许将子类类型的指针赋值给父类类型的指针。内存溢出 -不能提供所需要的内存泄露 -用完以后没有释放聚集索引 -叶节点上存了数据的非聚集索引 -叶节点上存的是地址索引是不是越多越好 -太多索引了更新速度会...

2019-10-10 08:47:04 183

原创 小组讨论面试

本科的时候面过很多小组讨论,但是为了找工作,这是第一次去面,抽到的题是排序题回顾一下自己的问题吧1.自我介绍的时候被带跑偏了,很紧张,语速过快。2.发表观点的时候逻辑不清晰,着重在表达自己的观点,没有去认真分析3.没有时间观念4.没有记录其他人的排序5.在自己还没有确定观点的时候就选择了某一种观点6.草稿纸太乱了,思路也就乱了7.走的时候没有推椅子如果有下次面试要注意的:1....

2019-10-09 14:24:09 155

原创 SQL实用题型-用户最长连续登陆天数

SQL-查询用户最长连续登陆天数sql经典题型:求用户连续登陆的最长天数题目难点:如何求连续登陆的天数本题的思考:sql经典题型:求用户连续登陆的最长天数已知:一个简单的用户登陆表:uiddatu12019/9/1u12019/9/2u12019/9/3u12019/9/8u12019/9/9u22019/9/2u2201...

2019-09-26 15:01:24 2915

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除