一、sql执行顺序
(1)from
(3) join
(2) on
(4) where
(5)group by(开始使用select中的别名,后面的语句中都可以使用)
(6) avg,sum…
(7)having
(8) select
(9) distinct
(10) order by
下列哪些机器学习算法不需要做数据归一化处理
不需要归一化:
概率模型(决策树)不需要归一化,因为他们不关心变量的值,而是关心变量的分布和变量之间的条件概率。像SVM、线性回归之类的最优化问题需要归一化。归一化之后加快了梯度下降求最优解的速度,并有可能提高精度。
则这道题:k均值、线性回归是需要做归一化处理的,而决策树、朴素贝叶斯都不不需要归一化。
请用SQL计算任意一段时间内,按注册日、按平台的次日留存率
次日留存的定义:新用户在注册的第二天,产生活跃记录
次日留存率的定义:次日留存的用户数 /注册的用户数
select count(n.user_id) as next_nums
from new_user n join active_user a
where datediff(n.data_date,a.data_date)=1
表结构
用户的注册日期和平台记录new_user
字段 | 类型 |
---|---|
data_date | string |
user_id | int |
platform | string |
每日的活跃用户记录active_use