腾讯mini项目-【指标监控服务重构】2023-07-29

今日已办

根据导师代码评审的 comment 改进

  1. 修改命名 otelclient.otelExporterOtlpEndpoint to otelclient.endpoint
  2. 禁用 TLS 加密,移除 otelclient.insecureMode
  3. 避免命名缩写影响代码的阅读理解
  4. 把两个函数(createTraceExpcreateTraceProvider)合并
  5. 移除没有太大意义的封装handleErr
  6. 将 otel 初始化逻辑放到 consume 子命令中进行
  7. 还原 README.md 的内容
  8. 经过组员 郑兆隆 对 Log 逻辑的修改,Log 可以在 docker容器内部 和 SigNoz Web 都生效

调研

整个链路都要带上backend_id,调研是否有让trace带attribute的方法,而不是每个span都手动加上

Trace 下的所有 span

在使用 OpenTelemetry SDK 进行分布式追踪时,可以通过在 span 上设置属性(attribute)来添加自定义信息,以便更好地理解和调试应用程序的行为。要让一个 trace 下的所有 span 都带上 attribute,可以使用 OpenTelemetry SDK 提供的 Span Processor。

下面是一个示例代码,展示了如何使用 Span Processor 将指定的 attribute 添加到 trace 下的所有 span 中:

package main

import (
	"context"

	"go.opentelemetry.io/otel"
	"go.opentelemetry.io/otel/attribute"
	"go.opentelemetry.io/otel/exporters/stdout"
	sdktrace "go.opentelemetry.io/otel/sdk/trace"
)

func main() {
	// 创建一个 stdout exporter,将 span 输出到控制台
	exporter, err := stdout.NewExporter(stdout.WithPrettyPrint())
	if err != nil {
		panic(err)
	}

	// 创建一个 trace provider,使用 stdout exporter 输出 span
	provider := sdktrace.NewTracerProvider(sdktrace.WithBatcher(exporter))

	// 设置全局 trace provider
	otel.SetTracerProvider(provider)

	// 创建一个 span processor,将指定的 attribute 添加到所有 span 中
	processor := sdktrace.NewSimpleSpanProcessor(func(span sdktrace.ReadOnlySpan) {
		span.SetAttributes(attribute.String("my_attribute", "my_value"))
	})

	// 将 span processor 添加到 trace provider 中
	provider.RegisterSpanProcessor(processor)

	// 创建一个新的 span
	tracer := otel.Tracer("example")
	ctx, span := tracer.Start(context.Background(), "my_span")
	defer span.End()

	// 在 span 上设置其他 attribute
	span.SetAttributes(attribute.String("another_attribute", "another_value"))

	// 执行其他操作...
}

在上面的示例代码中,使用 sdktrace.NewSimpleSpanProcessor 创建了一个简单的 Span Processor,该处理器会调用指定的函数,并将当前 span 作为参数传递给该函数。在该函数中,可以使用 span.SetAttributes 方法添加需要的 attribute。然后,将该 Span Processor 添加到 trace provider 中,即可让所有的 span 都带上该 attribute。

需要注意的是,Span Processor 对所有 span 生效,因此要谨慎使用,以避免影响性能和数据质量。如果只想让某些 span 带上 attribute,可以在创建 span 时手动设置。

特点 Trace 下的所有 span

如果只想在一个特定的 trace 的所有 span 中加上某个 attribute,可以使用 OpenTelemetry SDK 提供的 Span Processor,并且在创建 Span Processor 时指定一个 filter 函数,该函数可以根据 span 的 trace ID 或其他属性来判断是否需要对该 span 添加指定的 attribute。

下面是一个示例代码,展示了如何使用 Span Processor 和 filter 函数来只在特定 trace 的所有 span 中添加指定的 attribute:

package main

import (
	"context"

	"go.opentelemetry.io/otel"
	"go.opentelemetry.io/otel/attribute"
	"go.opentelemetry.io/otel/exporters/stdout"
	sdktrace "go.opentelemetry.io/otel/sdk/trace"
)

func main() {
	// 创建一个 stdout exporter,将 span 输出到控制台
	exporter, err := stdout.NewExporter(stdout.WithPrettyPrint())
	if err != nil {
		panic(err)
	}

	// 创建一个 trace provider,使用 stdout exporter 输出 span
	provider := sdktrace.NewTracerProvider(sdktrace.WithBatcher(exporter))

	// 设置全局 trace provider
	otel.SetTracerProvider(provider)

	// 创建一个 span processor,将指定的 attribute 添加到指定 trace 下的所有 span 中
	processor := sdktrace.NewSimpleSpanProcessor(func(span sdktrace.ReadOnlySpan) {
		// 判断当前 span 是否属于指定的 trace
		if span.SpanContext().TraceID().String() == "my_trace_id" {
			// 如果是,将指定的 attribute 添加到该 span 上
			span.SetAttributes(attribute.String("my_attribute", "my_value"))
		}
	})

	// 将 span processor 添加到 trace provider 中
	provider.RegisterSpanProcessor(processor)

	// 创建一个新的 trace 和 span
	tracer := otel.Tracer("example")
	ctx, span := tracer.Start(context.Background(), "my_span")
	defer span.End()

	// 在 span 上设置其他 attribute
	span.SetAttributes(attribute.String("another_attribute", "another_value"))

	// 执行其他操作...
}

在上面的示例代码中,使用 sdktrace.NewSimpleSpanProcessor 创建了一个简单的 Span Processor,该处理器会调用指定的函数,并将当前 span 作为参数传递给该函数。在该函数中,可以使用 span.SpanContext().TraceID().String() 方法获取当前 span 的 trace ID,并根据需要判断是否需要对该 span 添加指定的 attribute。然后,将该 Span Processor 添加到 trace provider 中,即可让指定 trace 的所有 span 都带上该 attribute。

子 Span 继承父 Span 的属性

当一个 span 手动添加了属性后,它的子 span 并不会自动继承这些属性。但是,可以通过 OpenTelemetry SDK 提供的 Tracer.Start 方法的第二个参数来指定一个 trace.WithAttributes 选项,该选项可以让子 span 继承父 span 的属性。

下面是一个示例代码,展示了如何让子 span 集成父 span 的属性:

package main

import (
	"context"

	"go.opentelemetry.io/otel"
	"go.opentelemetry.io/otel/attribute"
	"go.opentelemetry.io/otel/exporters/stdout"
	sdktrace "go.opentelemetry.io/otel/sdk/trace"
)

func main() {
	// 创建一个 stdout exporter,将 span 输出到控制台
	exporter, err := stdout.NewExporter(stdout.WithPrettyPrint())
	if err != nil {
		panic(err)
	}

	// 创建一个 trace provider,使用 stdout exporter 输出 span
	provider := sdktrace.NewTracerProvider(sdktrace.WithBatcher(exporter))

	// 设置全局 trace provider
	otel.SetTracerProvider(provider)

	// 创建一个新的 span
	tracer := otel.Tracer("example")
	ctx, parentSpan := tracer.Start(context.Background(), "parent_span",
		otel.WithAttributes(attribute.String("parent_attribute", "parent_value")),
	)
	defer parentSpan.End()

	// 创建一个子 span,并让其继承父 span 的属性
	ctx, childSpan := tracer.Start(ctx, "child_span",
		otel.WithAttributes(parentSpan.Attributes()...),
	)
	defer childSpan.End()

	// 在子 span 上设置其他属性
	childSpan.SetAttributes(attribute.String("child_attribute", "child_value"))

	// 执行其他操作...
}

在上面的示例代码中,首先在父 span 上设置了一个属性,然后在创建子 span 时,使用 trace.WithAttributes(span.Attributes()...) 选项将父 span 的属性传递给子 span,这样子 span 就可以继承父 span 的属性了。在子 span 上也可以继续添加其他属性。

如果当前的代码块是在一个 span 中执行的,那么可以使用 trace.SpanFromContext(ctx) 获取当前 span,然后将其作为父 span。

结合项目

  1. 由于 backend_id 是有 venus 产生,可以由 venus 服务在 trace 中设置属性

  2. 目前 profile 消费的4个阶段,只有在第一个阶段UnpackKafkaMessage,才能解析到 backend_id,而初始化Tracer的代码位于全局,且经组员反馈在 SigNoz Web 的 Trace 无法观测到该属性

    consumerTracer = otel.Tracer("profile-consumer",
    		trace.WithInstrumentationAttributes(attribute.String("profile.work", "consumer")))
    

    trace.WithInstrumentationAttributesspan.SetAttributes 都是用于添加属性(attribute)到 span 中的方法,但它们的作用和使用方式略有不同。

    trace.WithInstrumentationAttributes 是用于在创建 Tracer 时添加一些与仪表化相关的属性,这些属性会自动添加到由该 Tracer 创建的所有 span 中。它通常用于标识当前 Tracer 所使用的仪表化代码库、版本号、语言等信息。

    span.SetAttributes 则是用于在创建 span 后手动添加属性,这些属性通常用于标识该 span 所对应的操作、请求、响应等信息。它可以在任何时候添加,可以添加多个属性,也可以添加自定义的属性。

总上考虑,暂时使用 在第一个阶段 UnpackKafkaMessage 的 Span 手动添加属性后,它的子 Span 去继承 父 Span 的属性

问题:

Span 没有 Attributes(),只有 ReadOnlySpan有 Attributes()

image-20230729185333347

明日待办

  • 组会讨论
    • 移除关于 Prometheus 的相关配置
    • 。。。

导师建议:让服务自己监控自己CPU、内存等指标然后上报是否合适。
我建议调研一下:

  1. 参考uptrace看看他们怎么做服务cpu、内存监控的
  2. 调研下独立服务监控指标,比如hostmetricsreceiver
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
1 目标检测的定义 目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。 目标检测任务可分为两个关键的子任务,目标定位和目标分类。首先检测图像中目标的位置(目标定位),然后给出每个目标的具体类别(目标分类)。输出结果是一个边界框(称为Bounding-box,一般形式为(x1,y1,x2,y2),表示框的左上角坐标和右下角坐标),一个置信度分数(Confidence Score),表示边界框中是否包含检测对象的概率和各个类别的概率(首先得到类别概率,经过Softmax可得到类别标签)。 1.1 Two stage方法 目前主流的基于深度学习的目标检测算法主要分为两类:Two stage和One stage。Two stage方法将目标检测过程分为两个阶段。第一个阶段是 Region Proposal 生成阶段,主要用于生成潜在的目标候选框(Bounding-box proposals)。这个阶段通常使用卷积神经网络(CNN)从输入图像中提取特征,然后通过一些技巧(如选择性搜索)来生成候选框。第二个阶段是分类和位置精修阶段,将第一个阶段生成的候选框输入到另一个 CNN 中进行分类,并根据分类结果对候选框的位置进行微调。Two stage 方法的优点是准确度较高,缺点是速度相对较慢。 常见Tow stage目标检测算法有:R-CNN系列、SPPNet等。 1.2 One stage方法 One stage方法直接利用模型提取特征值,并利用这些特征值进行目标的分类和定位,不需要生成Region Proposal。这种方法的优点是速度快,因为省略了Region Proposal生成的过程。One stage方法的缺点是准确度相对较低,因为它没有对潜在的目标进行预先筛选。 常见的One stage目标检测算法有:YOLO系列、SSD系列和RetinaNet等。 2 常见名词解释 2.1 NMS(Non-Maximum Suppression) 目标检测模型一般会给出目标的多个预测边界框,对成百上千的预测边界框都进行调整肯定是不可行的,需要对这些结果先进行一个大体的挑选。NMS称为非极大值抑制,作用是从众多预测边界框中挑选出最具代表性的结果,这样可以加快算法效率,其主要流程如下: 设定一个置信度分数阈值,将置信度分数小于阈值的直接过滤掉 将剩下框的置信度分数从大到小排序,选中值最大的框 遍历其余的框,如果和当前框的重叠面积(IOU)大于设定的阈值(一般为0.7),就将框删除(超过设定阈值,认为两个框的里面的物体属于同一个类别) 从未处理的框中继续选一个置信度分数最大的,重复上述过程,直至所有框处理完毕 2.2 IoU(Intersection over Union) 定义了两个边界框的重叠度,当预测边界框和真实边界框差异很小时,或重叠度很大时,表示模型产生的预测边界框很准确。边界框A、B的IOU计算公式为: 2.3 mAP(mean Average Precision) mAP即均值平均精度,是评估目标检测模型效果的最重要指标,这个值介于0到1之间,且越大越好。mAP是AP(Average Precision)的平均值,那么首先需要了解AP的概念。想要了解AP的概念,还要首先了解目标检测中Precision和Recall的概念。 首先我们设置置信度阈值(Confidence Threshold)和IoU阈值(一般设置为0.5,也会衡量0.75以及0.9的mAP值): 当一个预测边界框被认为是True Positive(TP)时,需要同时满足下面三个条件: Confidence Score > Confidence Threshold 预测类别匹配真实值(Ground truth)的类别 预测边界框的IoU大于设定的IoU阈值 不满足条件2或条件3,则认为是False Positive(FP)。当对应同一个真值有多个预测结果时,只有最高置信度分数的预测结果被认为是True Positive,其余被认为是False Positive。 Precision和Recall的概念如下图所示: Precision表示TP与预测边界框数量的比值 Recall表示TP与真实边界框数量的比值 改变不同的置信度阈值,可以获得多组Precision和Recall,Recall放X轴,Precision放Y轴,可以画出一个Precision-Recall曲线,简称P-R
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

奥库甘道夫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值