自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(52)
  • 收藏
  • 关注

原创 魔哈:Grok国内镜像

近日马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。当前,魔哈已经完整从HuggingFace上将grok-1镜像下来,并每日后台在自动与HF同步更新。赶紧分享给你身边还在“抱怨”无法下载的小伙伴吧 👋您可以使用和git两种方法下载grok。

2024-03-21 08:45:50 410

原创 最强开源背景去除模型​RMBG v1.4

RMBG v1.4是briaai公司最先进的背景去除模型,它可以将一系列类别和图像类型中有效地将前景与背景切分。RMBG v1.4是在精心挑选的数据集(库存图像、电子商务、游戏和广告内容)上进行了训练,使其非常适合为大规模企业内容创建提供动力的商业用例。准确性、效率和多功能性目前可以与领先的源可用模型相媲美。在内容安全、合法许可的数据集和偏见缓解至关重要的地方,这是理想的。BRIA MBG 1.4 是专门在专业级数据集上训练的显着性分割模型。关注"晓石AI" 了解我们更多产品。**模型类型:**背景去除。

2024-03-04 14:38:36 1461

原创 魔哈镜像迄今最大合成数据集 Cosmopedia

这些分割包括 web_samples_v1 和 web_samples_v2,约占数据集的 75%,源自类似于 RefinedWeb 的内部 Web 数据集。Cosmopedia 是一个由Mixtral-8x7B-Instruct-v0.1生成的合成教科书、博文、故事、帖子和WikiHow文章的数据集。数据集由8个拆分组成,具体取决于拆分中使用的种子数据的来源。主题聚类 我们的目标是以教科书等更干净的格式生成大量合成数据,涵盖广泛的主题(本质上,在网络上发现的任何有用的东西)

2024-03-01 19:27:57 410

转载 Moha·魔哈:开启你的专属HF加速器

Moha·魔哈已上线内测 🎉,现前100位注册用户可免费开通专属HF加速器,无限流量!注册地址:https://moha.xiaoshiai.cn仅需设置环境变量即可加速。

2024-01-24 00:24:29 213

原创 你应该知道的ChatGPT提示语

ChatGPT对话中提示语可以极大影响对话资料。定义明确的提示语可以帮助确保我们的对话保持在正确的方向上。并涵盖用户感兴趣的上下文信息,从而带来较好的用户体验。

2023-02-26 10:25:54 9164

原创 5分钟了解 KubeGems 1.23 GA

KubeGems 是一款开源的企业级多租户容器云平台。围绕云原生社区,KubeGems 提供了多 Kubernetes 集群接入能力,并具备丰富的组件管理和资源成本分析功能,能够帮助企业快速的构建和打造一个本地化、功能强大且低成本的云管理平台。

2023-02-02 21:56:37 520

原创 五分钟了解 KubeGems 可观测性

KubeGems 是一个100%纯开源的多云容器管理平台,在此希望广大云原生爱好者能够加入我们社区,无论你是开发者、运维或其它人员,任何一个 idea 都值得被尊重!

2022-10-20 22:43:13 810

原创 KubeGems教学系列 - 体验 Model X 模型仓库

Model X 是一个简单、高性能、 跨平台和可扩展的用于存储机器学习场景下的模型仓储服务。它参考了 OCI、Git Lfs 和 对象存储的设计思想和在 Kubernetes 中运行算法服务的场景,为用户提供了一个便捷的、可版本化的模型管理解决方案。

2022-10-17 17:17:27 502

原创 ModelX一款开源的机器学习模型管理仓库

ModelX 是一个简单的、 高性能的、可扩展的模型机器学习模型存储服务

2022-09-30 12:12:19 1055

原创 基于KubeGems可视化搭建SkyWalking

本文用于指导用户在 KubeGems 中快速部署并运行 SkyWalking服务,用户可在研发环境中快速启用此功能来验证 APM 相关功能。更多关于KubeGems 与 SkyWalking 的配置优化,我们会持续更新,敬请关注

2022-09-19 13:37:39 527

原创 KubeGems 启用 Nacos 配置中心

本文主要介绍了在 KubeGems 中启用并使用Nacos插件作为应用的配置中心的基本管理功能

2022-09-09 10:13:26 449

原创 使用 Kind 快速体验 KubeGems

本文将指导用户使用 Kind 快速部署一个 KubeGems v1.21的版本用于本地测试。

2022-08-05 23:55:58 340

原创 BGP 模式下 Calico 与 MetalLB 的组合

最近我司业务扩展在机房新开了一个区域,折腾了一段时间的 Calico BGP,为了能将整个过程梳理得更简单明了,我还是决定将这个过程记录下来。不管是对当下的总结还是未来重新审视方案都是值得的。大家都知道,云原生下的网络架构在 Kubernetes 里可以算是百花齐放,各有所长,这无形中也导致网络始终是横在广大 K8S 爱好者面前迈向高阶管理的几座大山之一。通常大家在公有云上使用厂家提供的 CNI 组件可能还感受不到其复杂,但一旦要在 IDC 自建集群时,就会面临 Kubernetes 网络架构选型的问题。

2022-05-12 13:27:05 594

原创 用Shell处理Linux操作审计

前段时间学习群中有朋友在询问线上 Linux 主机的命令行操作审计方案时,当时给了一个用 rsyslog + elasticsearch 的方案简单搪塞过去了,并没有对方案的细节进行说明。要命的是当时立了个 flag 说在下次公众号文章更新中推送,时间一晃快 2 个月过去了,今天终于来把之前的挖的坑给填上。首先,当谈到 Linux 的操作审计需求时,大多数我们希望的是还原线上服务器被人为(误)操作时执行的命令行,以及它关联的上下文。这个需求场景其实跟通用的业务日志采集一致,简单一点可以直接通过 histo

2022-03-15 11:35:00 2193

原创 Logging Operator - 优雅的云原生日志管理方案 (三)

c前文:Logging Operator 的文章去年拖更很久了,原以为不会再有进度,不过最近在自己的KubeGems项目中遇到处理日志可观察性部分的需求时,又重新研究了下它,于是有了本系列的第三篇。Logging Operator是BanzaiCloud下开源的一个云原生场景下的日志采集方案。它在 2020 年 3 月的时候经过重构后的 v3 版本,底层凭借高效的 fluentbit 和插件丰富的 flunetd,Logging Operator几乎已经完美的适配了 kubernetes 模式下的

2022-01-11 12:01:45 887

原创 产品如何做Kubernetes一致性认证

Certified Kubernetes是CNCF基金会在2018年推出的Kubernetes一致性认证计划。它由CNCF基金会提供的一套诊断测试工具(Sonobuoy)并运行在Kubernetes中。各云厂商如果需要将自己产品纳入到Certified Kubernetes当中,就需要按照操作指导进行自身测试,并将测试结果上传给CNCF社区,当报告审核通过,交付一定的费用(CNCF Members免费)后,就会得到CNCF基金会给企业颁发一个Certified Kubernetes的认证。也就是说得到认证后

2021-08-19 10:03:07 522

原创 五分钟快速学习Ansible Operator

Operator Framework是由CoreOS开发,后被RedHat收购的一个开源工具包,它可以有效的、自动化的和可扩展的方式管理 Kubernetes原生应用程序。该框架下包含Operator SDK,可协助开发人员利用自己的专业知识来引导和构建Operator,而无需了解 Kubernetes API复杂性。今天我们就学习它,用于创建一个基于Ansible的Operator应用(之前小白在《Loki Operator简明教程》中也简单聊到过),它可以利用现有 Ansible playbook和模块

2021-07-26 10:09:00 378

原创 优雅的在K8S中Debug容器和主机

曾几何时,我们将自己的应用运行在Kubernetes上,每当出现容器异常崩溃时,我们往往都是一边重启容器,一边面对崩溃的容器无从下手。通常在业务研发自己build的镜像内包含了shell,我们还能通过在command中嵌入一个["sleep", "3600"]命令来阻塞容器内服务启动,不过也有时候会出现不知道从哪里冒出来一个distroless镜像,这时可能最先崩溃的就是运维了。那是一种运维这个职业自诞生以来,第一次感受到手足无措并脱离掌控的无助感。于是在k8s环境下无法debug容器的梗开始在坊间广为吐槽

2021-07-01 11:09:12 692

原创 Loki生产环境集群方案

很多新入坑Loki的小伙伴当看到distributor、ingester、querier以及各种依赖的三方存储时,往往都比较懵逼,不知道从哪儿入手。此外再加上官方的文档里面对于集群部署的粗浅描述,更是让新手们大呼部署太难。其实,除了官方的helm外,藏在Loki仓库的production目录里面有一篇生产环境的集群部署模式。原文里面,社区采用的是docker-compose的方式来快速拉起一套Loki集群。虽然我们正式在生产环境中实施时,不会傻到用docker-compose部署在一个node上(显然这

2021-05-18 10:35:50 4349 4

原创 日志多租户架构下的Loki方案

当我们在看Loki的架构文档时,社区都会宣称Loki是一个可以支持多租户模式下运行的日志系统,但我们再想进一步了解时,它却含蓄的表示Loki开启多租户只需要满足两个条件:配置文件中添加 auth_enabled: true请求头内带上租户信息X-Scope-OrgID这一切似乎都在告诉你,“快来用我吧,这很简单”,事实上当我们真的要在kubernetes中构建一个多租户的日志系统时,我们需要考虑的远不止于此。通常当我们在面对一个多租户的日志系统架构时,出于对日志存储的考虑,我们一般会有两种模式来

2021-05-07 13:21:45 729 1

原创 Logging Operator - 优雅的云原生日志管理方案 (一)

Logging Operator是BanzaiCloud下开源的一个云原生场景下的日志采集方案。之前小白转载过崔大佬介绍的一篇文章,不过由于之前一直认为在单个k8s集群下同时管理Fluent bit和Fluentd两个服务在架构上比较臃肿,便留下了一个不适用的初步印象。后来小白在一个在多租户场景下对k8s集群的日志管理做方案时,发现将日志配置统一管理的传统方式灵活性非常的弱。通常操作者会站在一个全局的角度,尽量的让日志的配置做成模版来适配业务,久而久之模版就变得非常庞大且臃肿,对后续维护和接任者都带来了不小

2021-04-09 10:00:42 1123

原创 小白如何快速绘制原型图

说到绘制产品原型图的工具,大家一定首先先到的是大名鼎鼎的“Axure RP”,或者在线协同的“墨刀”。它们的功能确实非常的强大,以至于很多产品经理可以做出还原度非常高的产品原型,不过能够熟练的够驾驭它们,还需使用者有不少的磨练。对于小型的团队(3-5人),特别是在没有专业的产品经理的情况下,大部分我们在接到产品的需求时,我们需要借助一个简单的、快速的工具将需求体现在产品上。这也是今天小白要介绍的一个轻量级产品原型设计工具Balsamiq Mockups。简单来说,Balsamiq Mockups是一个用

2021-03-16 10:31:19 3136

原创 活久见,Pod日志也能做探针?

最近遇到一个有趣的场景,当业务方有一个只运行异步任务的容器,这意味着它逻辑简单,即从上游服务中获取内容进行数据处理,但应用本身不提供任何方式判断当前服务状态。当服务运行出现阻塞时,我们该如何在Kubernetes中来实现探针管理呢?很多同学都使用过存活探针、就绪探针和启动探针,不过它们有一个共同的属性就是需要应用本身提供一个Http/TCP接口或一个Command来评估服务当前是否健康。在不具备上述条件的情况下,我们就只能通过捕获容器的控制台日志输出来判断容器运行是否健康了不要问我业务应用阻塞的原因,.

2021-03-11 10:57:41 372

原创 如何用Loki来分析Kubernetes事件

在Kubernetes API的众多对象中,Events算是最容易被我们忽视的类型之一。与其他对象相比,Event的活动量很大,不太可能长时间存储在etcd中,默认情况下,Event留存时间也只有1小时。当我们使用kubectl describe获取一个对象时,可能因时间超限而无法获取它的历史事件,这对集群的使用者非常的不友好。除了能查看集群事件外,我们可能还有类似追踪一些特定的Warning事件(如Pod生命周期、副本集或worker节点状态)来进行相关告警的需求。那么在开启本期话题之前,我们先来理解下

2021-03-05 10:26:32 1147 4

原创 推荐一个小工具:flog

一直以来,小白在Kubernetes集群中测试Loki的日志采集都是在容器内执行echo命令输出到控制台。这种方式操作起来既不方便无法大规模做日志测试。直到小白遇到一个好用的日志输出小工具flog。flog是一个golang开发的测试日志生成器,它可以生成一些常见(如Apache、Nginx、RFC3164或Json)格式的日志在Mac下用homebrew可以直接安装brew tap mingrammer/flogbrew install flog或者直接用docker来运行docker ru

2021-02-05 11:35:38 859

原创 依葫芦画瓢,我用Loki画了个Traefik的面板

前段时间在Loki2.0发布时,更新了一个配套的用LogQL语法绘制Nginx监控面板的Demo。今天小白准备用同样的手法炮制一个基于Traefik日志的监控面板。还不清楚之前Nginx面板操作的同学可以看参考文末后的推荐阅读。TraefikTraefik是一个用Golang实现的云原生轻量级HTTP反向代理工具。由于它支持配置适配多种后端服务(docker,kubernetes,Mesos,redis)来做动态的路由配置。当前Rancher的边缘产品K3S也默认把Traefik作为默认的Ingress

2021-01-19 10:48:30 369

原创 如何在Loki中使用LogQL做聚合查询

自从Loki2.0发布以来,LogQL v2凭借丰富的查询功能,让Loki也逐渐具备日志分析的能力。对于有些时候,当研发的同学没有提供Metrics时,我们也能利用LogQL构建基于日志的相关指标,这里面就主要用到了聚合查询。常见操作熟悉PromQL的同学应该知道,常见的聚合查询包括sum、rate,count等等。那么在Loki中,也有两种常见类型的聚合操作第一种类型,将日志条目作为一个整体来计算数值支持的操作功能有:rate(log-range):计算每秒的日志条目数count_over_

2021-01-15 10:30:57 3197

原创 LogQL如何转义特殊字符 (译)

在之前的Loki操作方法系列中,我已经分享了创建快速过滤器查询的所有最佳技巧,这些查询可以在几秒钟内过滤掉TB级的数据。在本期中,我将介绍如何在Loki的LogQL中正确转义字符串中的特殊字符。在编写LogQL查询时,可能已经意识到,我们必须在多个地方编写用双引号分隔的字符串。对于标签匹配器,行过滤器,正则表达式和标签过滤器来说,这是没问题的,我们也在很多地方都使用双引号字符串。但是,当我们突然想要过滤包含双引号的行时,就会出现问题。例如,下面这条查询语句{namespace="loki-ops",

2021-01-11 10:38:23 613

原创 如何用LogQL在几秒内快速查询TB级的日志

LogQL在很大程度上受Prometheus的PromQL启发。但是,当涉及到在过滤海量日志时,我们就像面临在大海捞针一样复杂。LogQL是Loki特有的语句,在本文中,我们将提供LogQL的快速过滤器查询技巧,这些查询可以在几秒钟内过滤掉数TB的数据。在Loki中,我们可以使用三种类型的过滤器:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Label matchersLabel matchers(标签匹配器)是你的第一道防线,是大幅减少你搜索的日志数量(例如,从1.

2021-01-08 10:15:49 527

原创 辞旧迎新,新手使用Containerd时的几点须知

相信大家在2020年岁末都被Kubernetes即将抛弃Docker的消息刷屏了。事实上作为接替Docker运行时的Containerd在早在Kubernetes1.7时就能直接与Kubelet集成使用,只是大部分时候我们因熟悉Docker,在部署集群时采用了默认的dockershim。不过社区也说了,在1.20之后的版本的kubelet会放弃对dockershim部分的支持。作为普通小白,我们在更换Containerd后,以往的一些习惯和配置也不得不改变和适配。那么本篇也是最近小白逐渐替换Conta.

2021-01-05 09:56:09 1702

原创 浅谈Loki分布式架构中的一致性哈希

Loki在分布式部署的模式下,保存Ingester服务的状态主要有3个渠道,分别是etcd、consul和基于gossip协议的memberlist。不管Loki用的是什么方式,它们最终都是将哈希环以KV的方式保存。再聊Loki之前,先来了解下一致性哈希的基本概念。一致性哈希是在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法。相较于普通的哈希算法,一致性哈希除了继承数据的离散性、扩展性和容错性之外,还引入了虚拟节点的概念,极大的优化了数据在存储过程的中出现的倾斜问题。另外,遇到需要在不中.

2020-12-30 11:04:14 953

原创 年轻人,不讲武德?Loki告警日志内容的骚方法

很多小伙伴在用Loki的Ruler配置日志告警规则时都会有一个大胆的想法:“ 要是能把日志内容告出来该多好 ”在LogQL V1的时代,受限于简单的日志过滤解释器影响,我们往往只能通过简单的聚合函数将日志转化成区间向量加以告警,它的规则大改就像这个样子:rules: - alert: xxx告警 expr: sum(count_over_time({<日志标签>} |~ "xx关键字或者正则匹配字符串"[1m])) by (xxx) > 0 for: 0

2020-12-18 10:23:32 2349

原创 如何用Loki来绘制Ingress Nginx监控大屏

最近无意间发现Grafana官网的Dashboard页面首推了一个用Loki分析Nginx日志的页面,大体也就是Loki2.0后产品主推的LogQL V2语法的典型应用。也许是最近感受到大家愈发对新语法的不熟悉,社区也特地做了一个quick demo来简单说明其新语法的使用。在视频里,我们看到基于LogQL V2语法为Nginx日志分析提供了一个新的思路。这个demo我们可以通过官网的Dashboard中找到。不过今天小白想写的是如何在Ingress-Nginx中也能用上如视频般丝滑的界面。1. Ing

2020-12-16 10:35:52 1510 1

原创 Loki被限流了,Limits_Config到底限了个啥?

Loki中拥有这众多的limit策略,有的已经开放到配置文件中,还有的配置代码中已经实现但还没开放出来。大部分情况下开发者给了出一些默认参数足够优秀,不过有的时候我们也不免需要微调。那么小白这次先简单捡几个比较重要的策略来说明下Limits_Config中到底限制了什么。1. 限流器小白前段时间无意间重启升级了下Loki的服务,由于过程持续了一段时间,当服务恢复时客户端在push日志时总是会收到如下的报错,429 Too Many Requests Ingestion rate limit exc.

2020-12-03 11:31:01 3477

原创 日志从Kafka到Loki的N种方式

最近群里有小伙伴有说到自己的日志存储路径先是从客户端到Kafka,再通过消费kafka到ElasticSearch。现在要将ES换成Loki面临需要同时支持Kafka和Loki插件的工具。小白查了下当前市面上满足需求且足够可靠的工具分别为Fluentd、Logstash以及Vector。FluentdCNCF已毕业的云原生日志采集客户端。与kubernetes结合比较精密,插件丰富且有大厂背书。不足之处在于受ruby限制,在日志量大(建议使用FluentBit)时本身的资源消耗不小。Logst.

2020-11-20 20:24:27 2546

原创 Loki监控指标远比你我想象中的细

小白在Grafana Dashboard中发现居然没有现成的Loki2.0版本监控,无奈只有自己来造个轮子????先来看下截图吧:面板版本基本信息:Grafana v7.3.1Loki2.0.0依赖的服务Cassandra (Index)S3 (Chunk)Redis(Cache)如果没有以上依赖的同学可能Dashboard里面部分存在无数据Loki部署部分可以参考我的demo,里面有loki集群的部署和依赖服务的配置https://github.com/CloudX

2020-11-16 19:30:42 1701 2

原创 DNS在Kubernetes中的高阶玩法(一)

自从Kubernetes1.11之后,CoreDNS作为集群内默认的域名解析服务,你是否对它还仅仅还停留在对Kubernetes的Service解析呢?事实上光DNS在K8S内就有很多有意思的操作,今天我们不妨来看看CoreDNS的各种高阶玩法。1. 自定义hosts解析默认情况下,Kubernetes集群内的容器要解析外部域名时,CoreDNS会将请求转发给/etc/resolv.conf文件里指定的上游DNS服务器。这个是由这个配置决定的。forward . /etc/resolv.conf有

2020-11-11 22:03:11 801

原创 Nginx如何支持OpenTracing - Jaeger

小白前段时间做Loki分布式追踪时,遇到需要在Nginx这一层生成TraceID和打印traceid相关日志的需求,在网上找了一大圈恁是没找到合适的Docker镜像。原本应该用opentracing-contrib编译的nginx-opentracing的docker镜像,但是当pull镜像时居然发现它有1.5G的容量,看了Dockerfile才知道这个镜像把Nginx源码和所有编译所需的C库都放在里面,真是佩服。最后还是得我们自己根据OpenTracing的方法给Nginx安装插件。按照阿里云的文档.

2020-11-06 18:57:38 800

原创 Tempo - 分布式Loki链路追踪利器

Tempo是Grafana Labs在ObservabilityCON 2020大会上新开源的一个用于做分布式式追踪的后端服务。它和Cortex、Loki一样,Tempo也是一个兼备高扩展和低成本效应的系统。之前小白有提到Grafana Labs的云原生Observability宇宙只剩下trace部分,那么今天就拿Loki的分布式追踪来体验下这Observability的最后一环吧。关于TempoTempo本质上来说还是一个存储系统,它兼容一些开源的trace协议(包含Jaeger、Zipkin和O.

2020-11-03 10:02:09 3395

原创 Loki迎来2.0重大更新,LogQL语法大幅增强​!

就在10月27日,Loki迎来至1.0版本以来的重要更新! 原以为这次Release会是1.7,没想到直接跳到2.0,看来Loki的应用和成熟度都有不少的提升,那么就看下本次重大更新包含哪些内容。1. LogQL语法大增强本次LogQL已经将原先的filter expression更换为log pipeline,进一步增强了日志查询期间的管道功能,新的log pipeline包含了几大表达器。Line Filter Expression(行过滤表达式)原先filter expression大部分功.

2020-10-28 11:45:33 1396

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除