Hive sql随机读取数据抽样数据

最新推荐文章于 2023-05-04 15:07:02 发布

a 茶叶蛋吃蛋白不吃蛋黄

最新推荐文章于 2023-05-04 15:07:02 发布

阅读量888

点赞数

文章标签： hive big data sql

本文链接：https://blog.csdn.net/qq_44426756/article/details/120724051

版权

本文探讨了两种数据筛选方法，包括普通的随机选择100条数据和按用户分组的随机抽样。这两种方法在数据分析和算法训练中具有广泛应用，能够有效处理大规模数据集并确保样本的代表性。同时，文章也强调了在处理信息技术领域数据时，如何生成新标题、摘要、关键词和标签的重要性，以确保信息的精准传递和领域专业知识的体现。

摘要由CSDN通过智能技术生成

普通的随机筛选100条数据

select
    *
from
    xxx
order by
    rand()
limit
    100

每个用户筛选几条数据

select
    *
from
    (
        select
            *,
            row_number() over(partition by mid order by rand() ) as rn
        from
            xxx
    ) a
where
    rn <= 10