鲸鲸说数据
码龄5年
关注
提问 私信
  • 博客:29,088
    社区:600
    29,688
    总访问量
  • 17
    原创
  • 83,019
    排名
  • 20
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2020-01-07
博客简介:

gzjgzj12345的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    2
    当前总分
    106
    当月
    0
个人成就
  • 获得30次点赞
  • 内容获得2次评论
  • 获得89次收藏
  • 代码片获得366次分享
创作历程
  • 2篇
    2024年
  • 15篇
    2023年
成就勋章
兴趣领域 设置
  • 大数据
    sqlmysqlhive
  • 人工智能
    数据挖掘语音识别目标检测机器学习人工智能word2vectensorflowpytorchpaddlepaddletransformernlp数据分析gpt-3
  • 数学
    概率论
  • 学习和成长
    leetcode职场和发展
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

342人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

列表处理

聚合的结果是一个数组的数组,需要将其转换成一个简单的一维数组。语句按id进行分组,以确保每个id的关键词都聚合到一行中。函数将关键词数组连接成一个逗号分隔的字符串,方便展示。函数去除重复的关键词,以确保每个关键词只出现一次。函数聚合每个广告主的关键词列表。函数将嵌套数组展开成一个单层数组。函数对关键词进行排序,便于阅读和分析。中包含广告数据,且每条记录有一个。列是一个包含关键词的数组。HiveQL 列表处理。
原创
发布博客 2024.11.05 ·
219 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

kmeans

Mini-batch K-means 是 K-means 的一种变体,它采用了小批量随机梯度下降的思想,每次迭代仅使用部分数据进行更新,从而加速了算法的收敛速度,并且降低了内存消耗。K-means++ 是对初始聚类中心进行改进的算法,它通过引入一种“启发式”方法来选择初始聚类中心,减少了 K-means 对初始点敏感的问题,提高了算法的稳定性和收敛速度。值越接近 0,数据越适合聚类,越接近 1,数据越接近随机分布。:K-means 对初始聚类中心的选择敏感,不同的初始点可能会导致不同的聚类结果。
原创
发布博客 2024.11.05 ·
799 阅读 ·
12 点赞 ·
0 评论 ·
20 收藏

机器学习入门必看!数据小白从0到1的基本概念资料分享

归纳学习就像是从具体的例子中找出规律。想象一下,你有一堆水果,有苹果、橙子、香蕉等等,每个水果都有特定的颜色、形状和大小。通过观察这些水果,你可以归纳出一些规律,例如苹果通常是红色或绿色,圆形或略带扁形,而香蕉则是黄色,弯曲的形状等等。这些规律就是你通过归纳学习得出的。接下来,当你看到一个你从未见过的水果时,比如一个红色、圆形的水果,你可以根据之前的归纳学习得出的规律猜测它可能是苹果。归纳学习的目的就是通过观察具体例子,找到一般规律,然后应用这些规律来预测未知的情况。
原创
发布博客 2023.05.19 ·
295 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

北美数据科学新手必看!梯度下降:吐血整理,让你轻松掌握!

深度学习中的神经网络训练:在深度学习中,神经网络模型具有大量的参数,需要通过梯度下降来训练这些参数。梯度下降通过反向传播算法计算每个参数的梯度,并根据梯度的反方向更新参数,以优化网络的性能。小批量梯度下降综合了批量梯度下降和随机梯度下降的优点,可以在一定程度上平衡收敛速度和参数更新的稳定性。通过反复迭代更新参数,梯度下降能够逐步接近损失函数的最小值,找到最优的参数配置,使模型能够达到最佳的性能。它不需要计算整个数据集的梯度,而是仅计算一小批样本的梯度,因此在大规模数据集上具有较好的可扩展性。
原创
发布博客 2023.05.18 ·
565 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

北美数据科学新手必看!主成分分析PCA:吐血整理,让你轻松掌握!

【代码】北美数据科学新手必看!主成分分析PCA:吐血整理,让你轻松掌握!
原创
发布博客 2023.05.17 ·
516 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

北美数据科学新手必看!XGBoost:吐血整理,让你轻松掌握!

web-share" allowfullscreen data-tool="mdnice编辑器">
原创
发布博客 2023.05.16 ·
597 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据科学新手必看!线性回归入门指南

【代码】数据科学新手必看!线性回归入门指南。
原创
发布博客 2023.05.15 ·
612 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

【鲸析】0基础SQL保姆级教程(附赠重磅分享!!)

学习SQL基础知识:首先需要学习SQL基础知识,包括SQL语句的基本语法、数据类型、数据表的创建和修改、数据的查询和排序等。可以选择一本SQL基础教材或者在线SQL教程进行学习。Mode Analytics SQL教程:Mode Analytics是一个在线数据分析平台,提供了SQL教程,包括SQL基础、聚合、连接、子查询和窗口函数等内容。W3Schools SQL教程:W3Schools是一个广受欢迎的在线编程学习网站,提供SQL教程,包括SQL基础、SQL进阶、SQL函数和SQL数据类型等。
原创
发布博客 2023.03.13 ·
308 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

MySQL实现累加、累乘、累减、累除

「MySQL实现累加、累乘、累减、累除」table: TEST+-----------+---------+---------+| PARENT_ID | PART_ID | QUALITY |+-----------+---------+---------+|         1 |    &nb
原创
发布博客 2023.03.09 ·
2253 阅读 ·
2 点赞 ·
0 评论 ·
9 收藏

【SQL面试】窗口函数如何实现【累加】?

SQL窗口函数实现累加?SQL 窗口函数可以用于实现各种计算,包括累加。在使用窗口函数进行累加时,可以使用 SUM() 函数结合 OVER 子句。OVER 子句定义了窗口,即要对哪些行进行计算。假设有一个名为 sales 的表,其中包含销售额和销售日期信息,可以使用以下 SQL 语句计算每个销售日期的销售额累加值:SELECT   sales_date, sales_amount, SUM(sales_amount) OVER (O
原创
发布博客 2023.03.07 ·
2585 阅读 ·
1 点赞 ·
1 评论 ·
6 收藏

【SQL面试】MySQL的NTILE函数使用

MySQL的NTILE函数使用MySQL的NTILE函数用于将一个数据集分成n个分组,每个分组中包含尽可能相等数量的行。该函数返回一个数字,该数字表示该行属于的分组号。NTILE函数在ORDER BY子句中指定排序的列,然后将结果集按照该列的值从小到大或从大到小进行排序。然后,将排序后的结果集分成指定数量的组。NTILE函数为每个行分配一个组号,表示该行属于哪个组。以下是NTILE函数的语法:NTILE(n) OVER ( [PARTITION BY 
原创
发布博客 2023.03.07 ·
1566 阅读 ·
1 点赞 ·
1 评论 ·
4 收藏

【SQL面试】WHERE 1=1 到底是啥意思?

WHERE 1=1 是啥意思?WHERE 1=1 是SQL语句中常见的写法,包括MySQL。它不是用来表示字面意义的,而是作为构建动态SQL查询的「占位符」。在SQL中,WHERE子句用于根据某些条件过滤数据。使用WHERE 1=1时,它始终返回true,因为表达式1=1始终为true。这意味着将选择表中的所有行。那么为什么要使用WHERE 1=1,如果它始终返回true呢?其中一个原因是,它允许我们轻松连接「基于用户输入或其他变量的其他条件」,构建动态SQL查询。SELECT *&nb
原创
发布博客 2023.03.07 ·
13603 阅读 ·
8 点赞 ·
0 评论 ·
36 收藏

WITH RECURSIVE递归生成斐波那契数列

在MySQL 8.0及以上版本中,可以使用WITH RECURSIVE语句来递归生成斐波那契数列。以下是一个使用WITH RECURSIVE语句生成斐波那契数列的示例:WITH RECURSIVE fib(n, val1, val2) AS (    SELECT 0, 0, 1    UNION   &nb
原创
发布博客 2023.03.07 ·
213 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

一句代码实现MySQL的伪序列

在查询数据的时候,我们有时候需要对查询出来的数据加上序列,「1,2,3,……n」例如:我们根据表的某个字段排序后,要对这些数据加上序列,这个时候序号常常不是我们建表时设置好的自增的主键id,怎么办呢?oracle数据库有专门的rownum来解决伪序列问题,但是mysql却到目前为止还没有内置的函数等来解决此问题!鲸鲸教大家「一句SQL语句代码」实现MySQL的伪序列问题!SELECT   @rownum:=@rownum+1 AS rownum,&n
原创
发布博客 2023.03.07 ·
146 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【SQL面试】为什么不建议用select *

为什么不建议用select *?不要使用SELECT *几乎已经成为了MySQL使用的一条金科玉律,但是到底是为什么呢?个人感觉直接使用SELECT *还是比较多的,原因有两个:(1)简单,后期添加或修改字段,SQL语句也不需过多调整(2)没必要过早对SQL进行优化,遇到问题再调呗不过还是要明白为什么不建议用select *!不必要的磁盘I/OMySQL 本质上是将用户记录存储在磁盘上,查询操作就是一种进行磁盘IO的行为。查询的字段越多,说明要读取的内容也就越多,因此会增大磁盘 IO 开销,
原创
发布博客 2023.03.07 ·
286 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql如何实现split操作?

在 MySQL 中并没有内置的 split() 函数,但可以通过自定义函数或存储过程来实现字符串分割。以下是几种实现方法:自定义函数 fn_split():DROP FUNCTION IF EXISTS fn_split;DELIMITER $$CREATE FUNCTION fn_split(s TEXT, del CHAR(1), i INT)RETURNS VARCH
原创
发布博客 2023.03.07 ·
4240 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

一文解决SQL连续问题!

一文解决SQL连续问题!计算连续活跃连续活跃或者登录的计算是数据分析业务场景中非常经典和常见的问题,而且涉及到的解题思路比较巧妙,所以也是面试笔试中非常喜欢考查的知识点~记录用户活跃时间信息的表logins如下:+--------+---------------+| userid | activity_date |+--------+---------------+|  10001 | 2021-01-01 &
原创
发布博客 2023.03.07 ·
243 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多