Nsight软件简介

Nsight

Nsight包含以下三部分

Nsight System

cpu threads
每个线程运行的情况和使用率
cpu的状态
OS runtime librarys的使用情况(file、io、pthread)
api 的使用情况(cuda/cuDNN/cuBLAS/TensorRT)
OS runtime library
识别每个调度周期内那些进程被blocked,并分析原因
显示api的调用栈,blocked的函数位置
cuda api
跟踪api 的调用栈信息
locate 对应的cuda workload和gpu信息
gpu workload
显示workload执行的时间
显示idle的gpu时间
nvtx instrumentation
从时间线分析api的信息,显示每个api执行的时间
如何在代码层面添加一个debug信息显示当前函数的执行时间
image
Nsight Systems is a system-level profiler

Nsight Compute

抓取报告文件例如内存碎片
根据不同的报告文件生成不同的结果
快速的数据收集
关键特性
API stream
使用api stream 进行交互式分析以下情况
Run to the next (CUDA) kernel
Run to the next (CUDA) API call
Run to the next range start
Run to the next range stop
Sections
记录设备上的每一个事件活动信息,并根据事件信息分析特定的指标,并在多组指标中寻找优化点
主要包含以下信息的:
cpu
memory
latency(延迟)
Unit details
主要包含以下模块
image
case
cpu workload analysis(流水线级别的分析)
Wrap scheduler statisticcs (调度器的统计)
Warp State Statistics
stall reason
an instruction fetch
a memory dependency
an execution dependency
a pipeline is busy
a synchronization barrier
Memory workload analysis
详细分析gpu内存的使用情况,包括带宽,和总线的繁忙程度,以及其他影响性能的因素
launch statistics
详细的分析gpu的资源,比如程序中的指令分发
帮助我们理解gpu的workload,以及共享内存和寄存器是如何影响占用的
source conters statistics
指明低效的内存访问,包含共享内存和全局内存
source page
理解nvcc生成的代码
understand stall reason
结果依赖
共享内存结果依赖或者频繁MUFU
等待本地的或者全局的指令操作队列没有满,并且只有在频繁的执行本地或者全局共享内存的指令时才会出现延迟
等待MIO(memory input output)指令队列没有满,并且只有频繁的在执行LDS MUFU 或者动态的分支预测
等待管道变成可用状态。
Nsight Compute is for kernel profiling tool

Nsight Graphics

安装指南
NV安装指南链接如下
https://docs.nvidia.com/nsight-systems/InstallationGuide/index.html
使用的抓取工具perf
要求Linux 操作系统的 perf_event_paranoid 级别必须为 2 或更低。使用以下命令进行检查:cat /proc/sys/kernel/perf_event_paranoid 如果输出>2,则执行以下操作以临时调整偏执级别(注意,每次重启后都必须这样做):sudo sh -c ‘echo 2 >/proc/sys/kernel/perf_event_paranoid’ 要使更改永久生效,请使用以下命令:sudo sh -c ‘echo kernel.perf_event_paranoid=2 > /etc/sysctl.d/local.conf’
内核版本要求
CentOS 和 RedHat Enterprise Linux 7.4+ 的 3.10.0-693 或更高版本
适用于包括 Ubuntu 在内的所有其他发行版
注意:
只有 CentOS、RedHat 和 Ubuntu 发行版经过测试/确认可以正常工作
用户指南
https://docs.nvidia.com/nsight-systems/UserGuide/index.html
nsys 命令
nsys [global_option]
gloabal_option
image
nsys [command_switch] [可选命令开关选项] [应用程序] [可选应用程序选项]
command_switch
在这里插入图片描述

上面具体每个命令如何使用,请参考用户指南链接
nsys 生成的文件
.nsys-rep
.nsys-rep 报告格式是 Nsight Systems唯一应被视为向前兼容的数据格式,Nsight Systems能够从 .nsys-rep 结果文件中导出 SQLite 数据库文件。SQLite 模式可以并且将来会改变。可以使用 sqlite3 工具内置命令获取具体数据库的架构.schema. sqlite3 工具可以位于Nsight Systems 安装的 Target 或 Host 目录中。目前表是惰性创建的,因此并非文档中描述的每个表都会出现在特定数据库中。这将在产品的未来版本中改变。如果您想要所有可能表的完整架构,请使用nsys导出 --lazy=false 在出口阶段。目前,为导出的数据库中的每种数据类型创建一个表。由于导出数据的使用模式可能会有很大差异,并且没有建立默认用例,因此没有创建索引或额外的约束。相反,请参阅 SQLite 示例部分以获取常用配方列表。这可能会在产品的未来版本中发生变化。要检查导出的 SQLite 文件的版本,请检查 EXPORT_SCHEMA_VERSION在里面EXPORT_META_DATA 桌子。架构版本是一个常见的三值主/次/微版本号。第一个值或主要值表示数据库的整体格式,并且仅在整个数据库格式发生重大重写或重构时才会更改。假设如果主要版本发生变化,所有脚本或查询都会中断。中间版本或次要版本会在任何时候发生更本地化但潜在的破坏性更改,例如重命名现有列或更改现有列的类型。最后一个或微版本在有添加时随时更改。

NV参考链接

https://docs.nvidia.com/
https://docs.nvidia.com/nsight-compute/NsightComputeCli/index.html#command-line-options-profile
https://developer.nvidia.com/nsight-systems
https://docs.nvidia.com/nsight-systems/index.html
https://docs.nvidia.com/nsight-systems/UserGuide/index.html

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据引用中提到的情景模式,"SCENE_MODE_NIGHT"是相机支持的夜景模式。根据引用中的描述,当相机设置为"USE_SCENE_MODE"时,必须使用"ANDROID_CONTROL_SCENE_MODE"来确定3A算法的行为。对于"SCENE_MODE_NIGHT",HAL可能会倾向于使用连续对焦(AF)模式,以便在夜间场景下获得更好的焦点。此外,在"SCENE_MODE_FACE_PRIORITY"下,AE/AWB/AF模式的工作方式与在"ANDROID_CONTROL_MODE_AUTO"模式下相同,但3A算法会倾向于进行测光,并对焦于已检测到的人脸。 因此,"SCENE_MODE_NIGHT"是相机的夜景模式,可以在夜间场景下获得更好的焦点。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span> #### 引用[.reference_title] - *1* *2* *3* [android中Camera获取系统支持的情景模式](https://blog.csdn.net/weixin_35899510/article/details/117764760)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *4* [Android Camera 3A 模式和状态转换](https://blog.csdn.net/haiping1224746757/article/details/106472497)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值