琉璃梦境
码龄13年
关注
提问 私信
  • 博客:164,128
    问答:9,266
    173,394
    总访问量
  • 64
    原创
  • 14,618
    排名
  • 2,402
    粉丝

个人简介:广漂一枚,认真做好技术,等混不下去就回家卖酒,哈哈...

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 目前就职: 广发银行股份有限公司
  • 加入CSDN时间: 2012-03-24
博客简介:

一个人的人生

查看详细资料
  • 原力等级
    当前等级
    4
    当前总分
    750
    当月
    19
个人成就
  • 获得158次点赞
  • 内容获得31次评论
  • 获得288次收藏
  • 代码片获得494次分享
创作历程
  • 3篇
    2025年
  • 14篇
    2023年
  • 3篇
    2022年
  • 29篇
    2021年
  • 5篇
    2020年
  • 1篇
    2019年
  • 2篇
    2017年
  • 8篇
    2016年
  • 51篇
    2015年
成就勋章
TA的专栏
  • 商城
    11篇
  • Cassandra
    4篇
  • 大数据
    28篇
  • Elasticsearch
    5篇
  • Docker
    4篇
  • 云计算
    10篇
  • 推荐系统
    2篇
  • 人工智能
    4篇
  • 分布式缓存
    5篇
  • 笔记
    1篇
  • Minio
    2篇
  • 消息中间件
    2篇
  • Spring Mvc
    3篇
  • 企业架构
    33篇
  • Spring Mvc 4.1
    12篇
  • Spring Mvc4.2
    18篇
  • Jquery
    4篇
  • SVN
    1篇
  • PL/SQL
    3篇
  • Spring boot
    7篇
  • 算法
    1篇
  • GIS
    3篇
  • Spring
  • Spring Mvc4.0
    4篇
  • Spring Security
    16篇
  • angularjs
    2篇
  • IOS
    2篇
  • 分布式架构
    25篇
兴趣领域 设置
  • Python
    python
  • Java
    java
  • 数据结构与算法
    算法
  • 大数据
    sparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

机器学习-学习算法

机器学习。
原创
发布博客 2025.01.16 ·
634 阅读 ·
29 点赞 ·
0 评论 ·
24 收藏

机器学习训练方式和三要素

​判别模型是对数据输出做判别的模型,多用于监督学习,尤其适合。继续编辑。
原创
发布博客 2025.01.16 ·
949 阅读 ·
8 点赞 ·
0 评论 ·
6 收藏

机器学习-数据标注(二)

是指三维数据的一种重要表达方式,通过激光雷达等传感器,能够采集到各类障碍物以及其位置坐标,而标注员则需要将这些密集的点云分类,并标注上不同属性,常应用于。数据标准是通过分类、画框、标注、注释等,对图片、语音 、文本等数据进行处理,标记对象的特征,以作为机器学习基础素材的过程。、语义分割、实例分割、 目标检测、图像分类、关键点、线段标注、文字识别转写、点云标注、属性判断等。负责对文本、图像、语音、视频等标注数据进行归来、整理、编辑、标记和批注。是对事物属性进行标签,属性标注包括:文本类别、新闻、娱乐等。
原创
发布博客 2025.01.16 ·
641 阅读 ·
30 点赞 ·
0 评论 ·
18 收藏

2024如何制定年度规划(1).pptx

发布资源 2024.01.02 ·
pptx

SparkSQL 执行底层原理解析

从Spark SQL 底层架构可以看到,我们写的SQL语句,经过一个优化器(Catalyst),转化为RDD,交给集群执行。SQL到RDD中间经过了一个Catalyst,它就是Spark SQL的核心,是针对Spark SQL语句执行过程中的查询优化框架,基于Scala函数式编程结构。
原创
发布博客 2023.12.24 ·
1596 阅读 ·
21 点赞 ·
0 评论 ·
25 收藏

Elasticsearch的分片平衡问题解决

2023年11月份在某电商系统生产中的Elasticsearch(以下简称ES)集群突然,出现了大量慢查询告警,导致请求堆积。经过几天的排查发现了ES节点主分片和副本分片分布存在不均匀的问题。当然了暂未有定论是由于分片不均衡导致了性能下降,但是主分片和副本分片分布不均匀确实是个问题。
原创
发布博客 2023.12.24 ·
2890 阅读 ·
20 点赞 ·
0 评论 ·
25 收藏

基于Headless构建高可用spark+pyspark集群

在启动spark worker脚本中需要传入master的地址,在容器云kubernetes dns且设置了service的缘故,可以通过ecc-spark-master.ecc-spark-cluster.svc.cluster.local:7077访问。没有默认负载均衡器,可直接访问 Pod IP 地址。spark master分为两个部分,一个是类型为ReplicationController的主体,命名为ecc-spark-master.yaml,另一部分为一个service,暴露master的。
原创
发布博客 2023.10.28 ·
961 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Python爬虫-经典案例详解

爬虫一般指从网络资源的抓取,通过Python语言的脚本特性,配置字符的处理非常灵活,Python有丰富的网络抓取模块,因而两者经常联系在一起Python就被叫作爬虫。爬虫可以抓取某个网站或者某个应用的内容提取有用的价值信息。有时还可以模拟用户在浏览器或app应用上的操作行为,从而实现程序自动化。
原创
发布博客 2023.10.28 ·
357 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive SQL 函数高阶应用场景

HIVE作为数据仓库处理常用工具,如同RDBMS关系型数据库中标准SQL语法一样,Hive SQL也内置了不少系统函数,满足于用户在不同场景下的数据分析需求,以提高开发SQL数据分析的效率。我们可以使用show functions查看当下版本支持的函数,并且可以通过describe function extended funcname来查看函数对应的使用方式和方法,下面我们将描述HIVE SQL中常用函数的高阶使用场景。
原创
发布博客 2023.10.22 ·
1505 阅读 ·
5 点赞 ·
4 评论 ·
5 收藏

spark读写minio文件代码实践

Minion作为一个先进的对象存储方案,对于大数据和人工智能的支持有着天然的优势。它支持与Spark\Flink等技术方案进行整合,并且通过S3协议实现数据查询的下沉,这让大数据的存储与查询分离提供了事实依据。(2) 根据部署的minio服务的信息(如端口、Access Key、Secret Key、存储桶名称等),创建一个SparkSession对象,可以使用如下步骤进行读写Minio。(1) 首先,需要部署minio服务集群,搭建minio对象存储桶,可以参考我的文章。
原创
发布博客 2023.08.14 ·
1235 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

推荐系统-基于物品协同过滤算法代码实现

当前Spark没有像mahout那样,严格区分基于物品的协同过滤推荐(ItemCF)和基于用户的协同过滤推荐(UserCF),只有基于模型的协同过滤推荐算法ALS(model-based CF)。但ALS算法对于一些特定的问题(用户数量较小的场景,以及物品数量明显小于用户数量的场景),效果并不理想,不像mahout提供了各种推荐算法选择。为了充分利用spark在速度上带来的提升同时为满足一些业务需求,于是使用spark构建ItemCF算法。
原创
发布博客 2023.08.02 ·
569 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

推荐系统-ALS协同过滤算法代码实现

从协同过滤的分类来说,ALS(Alternating Least Squares,交替最小二乘)算法属于User-Item CF,也叫做混合CF,它同时考虑了User和Item两个方面。用户和物品的关系,可以抽象为如下的三元组:。其中,Rating是用户对商品的评分,表征用户对该商品的喜好程度。ALS算法是基于模型的推荐算法,,评估出缺失项的值,以此来得到一个基本的训练模型,然后依照此模型可以针对新的用户和物品数据进行评估。
原创
发布博客 2023.07.27 ·
637 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

推荐系统-基于标签的Top-N个性化推荐代码实现

本文主要探讨如何利用用户打标签的行为为其推荐物品,UGC标签系统受到越来越多的关注,标签既能反映用户的兴趣又能描述物品的本身特征。
原创
发布博客 2023.07.18 ·
1336 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

Elasticsearch 数据迁移方案

倘若准备将自建的 elasticsearch 迁移K8s,或者的迁移到其他elasticsearch集群,可以根据自己的业务需要选择适当的迁移方案,
原创
发布博客 2023.06.24 ·
2672 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

每个人都要会“Chat AI”的提问方式

,点击右侧的【获取】按钮,此处是我已经安装了插件所以是【删除】按钮,点击获取按钮后会弹出对话框,选择【添加扩展】即可下载安装插件,后面安装流程按提示完成即可。(4)回到浏览器,点击右上方的【+】按钮,会弹出新的选项卡"WebTab新标签页”,在新页面中点击【问心一言 AI】图标按钮。(5)如果用户已经登录,则会直接进入"问心一言"的对话界面,如果未登录,登录msn邮箱账号即可开启使用"问心一言"了。(1)切换到浏览器,选择右上方选项卡,在弹出的对话框中选择【扩展】选项,
原创
发布博客 2023.06.21 ·
413 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

redis运维小记批量处理

过期命令: redis-cli -h ip地址 -p 端口 -a 密码 keys "ACE_*" | xargs - i redis-cli -h ip地址 -p端口 -a 密码 expire {} $(($RANDOM + 54321))删除命令: redis-cli -h ip地址 -p 端口 -a 密码 keys "ACE_*" | xargs - i redis-cli -h ip地址 -p端口 -a 密码 del {}登录命令: redis-cli -h ip -p 端口。
原创
发布博客 2023.06.05 ·
709 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

推荐系统-基于领域的协同过滤算法选择(一文足矣)

为什么新闻推荐使用UserCF算法,而购物网站使用ItemCF算法?
原创
发布博客 2023.03.12 ·
655 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

基于容器云提交spark job任务

spark提交Kind=Job类型的任务,首先需要申请具有Job任务提交权限的rbac,然后编写对应的yaml文件,通过spark-submit命令提交任务到集群执行。
原创
发布博客 2023.03.04 ·
1813 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ES使用Ngram分词器实现wildcard高性能替代方案

## 3.1 Ngram定义Ngram是一种基于统计语言模型的算法。Ngram的基本思想:是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度。该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。
原创
发布博客 2022.05.03 ·
5731 阅读 ·
3 点赞 ·
0 评论 ·
18 收藏

mysql 8.0的一份my.cnf配置笔记

my.cnf[mysqldump]socket=/data/mysql/dbcfg/mysql.sock[mysql]user=dbadminsocket=/data/mysql/dbcfg/mysql.sock[mysqladmin]socket=/data/mysql/dbcfg/mysql.sock[mysqld]derault_authentication_plugin=mysql_native_passwordbasedir=/opt/mysqldatadir=/data/m
原创
发布博客 2022.03.12 ·
3009 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏
加载更多