英语流利说数据分析笔试总结

本文总结了英语流利说数据分析笔试中的重点内容,包括SQL查询的执行顺序:from, join, on, where, group by, having, select, distinct, order by。并探讨了机器学习中哪些算法需要数据归一化,如SVM和线性回归,而决策树和朴素贝叶斯则不需要。此外,还提出了如何用SQL计算特定时间段内的按注册日和平台的次日留存率问题。" 122359834,11742947,C语言中的选择结构编程,"['C语言', '开发语言', '后端']
摘要由CSDN通过智能技术生成

一、sql执行顺序
(1)from
(3) join
(2) on
(4) where
(5)group by(开始使用select中的别名,后面的语句中都可以使用)
(6) avg,sum…
(7)having
(8) select
(9) distinct
(10) order by

下列哪些机器学习算法不需要做数据归一化处理
不需要归一化:
概率模型(决策树)不需要归一化,因为他们不关心变量的值,而是关心变量的分布和变量之间的条件概率。像SVM、线性回归之类的最优化问题需要归一化。归一化之后加快了梯度下降求最优解的速度,并有可能提高精度。
则这道题:k均值、线性回归是需要做归一化处理的,而决策树、朴素贝叶斯都不不需要归一化。

请用SQL计算任意一段时间内,按注册日、按平台的次日留存率
次日留存的定义:新用户在注册的第二天,产生活跃记录
次日留存率的定义:次日留存的用户数 /注册的用户数
select count(n.user_id) as next_nums
from new_user n join active_user a
where datediff(n.data_date,a.data_date)=1
表结构
用户的注册日期和平台记录new_user

字段 类型
data_date string
user_id int
platform string

每日的活跃用户记录active_use

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值