英语流利说数据分析笔试总结

最新推荐文章于 2024-01-03 20:28:02 发布

weixin_43223694

最新推荐文章于 2024-01-03 20:28:02 发布

阅读量800

点赞数

分类专栏：笔试记录

本文链接：https://blog.csdn.net/weixin_43223694/article/details/97820127

版权

本文总结了英语流利说数据分析笔试中的重点内容，包括SQL查询的执行顺序：from, join, on, where, group by, having, select, distinct, order by。并探讨了机器学习中哪些算法需要数据归一化，如SVM和线性回归，而决策树和朴素贝叶斯则不需要。此外，还提出了如何用SQL计算特定时间段内的按注册日和平台的次日留存率问题。" 122359834,11742947,C语言中的选择结构编程,"['C语言', '开发语言', '后端']

摘要由CSDN通过智能技术生成

一、sql执行顺序
(1)from
(3) join
(2) on
(4) where
(5)group by(开始使用select中的别名，后面的语句中都可以使用)
(6) avg,sum…
(7)having
(8) select
(9) distinct
(10) order by

下列哪些机器学习算法不需要做数据归一化处理
不需要归一化：
概率模型（决策树）不需要归一化，因为他们不关心变量的值，而是关心变量的分布和变量之间的条件概率。像SVM、线性回归之类的最优化问题需要归一化。归一化之后加快了梯度下降求最优解的速度，并有可能提高精度。
则这道题：k均值、线性回归是需要做归一化处理的，而决策树、朴素贝叶斯都不不需要归一化。

请用SQL计算任意一段时间内，按注册日、按平台的次日留存率
次日留存的定义：新用户在注册的第二天，产生活跃记录
次日留存率的定义：次日留存的用户数 /注册的用户数
select count(n.user_id) as next_nums
from new_user n join active_user a
where datediff(n.data_date,a.data_date)=1
表结构
用户的注册日期和平台记录new_user