1,两表连接要注意连接字段类型是否一致;
2,两表字段做比较注意字段单位是否一致,比如用时间作比较的时候,弄清楚到底是“时间戳”还是“时分秒”,否则容易造成空值或结果不正确;
3,数据表随机取数时可以用取模操作来进行,比如数据表中有100万条数据,我们要随机取大约10万条,假设主键时id,我们可以用id%9=1;但是要注意每次验证数据表中的数据规模,如果是一千万条取10万,那么就需要用id%97或某个近似100的质数。
4,更新线上部署运行的表一定要确定优化确实有效,还要保证线下修改后的表补齐数据才能切换线上表,否则会造成线上数据丢失;
5,多表连接要注意每张表都要按照第一张表的某个键进行连接,否则会造成串行,例如
SELECT * FROM
table1
WHERE dt=datekey
)s1
JOIN
(
select * from
table2
where dt=datekey
)s2
ON s1.id=s2.id
JOIN
(
SELECT * from table3
where dt=datekey
)s3
ON s1.id=s3.id
JOIN
(
SELECT * from
table4
where dt=datekey
)s4
ON s1.id=s4.id
6,when……case……条件分枝语句要注意加上else,保留边界条件