zaf赵-CSDN博客

原创 3D 高斯溅射 (Gaussian Splatting)技术，一种实现超写实、高效渲染的突破性技术

3D 高斯溅射 (3DGS) 的核心技术是通过数百万个微小的、半透明的椭球体（即“高斯溅射”）来创建和渲染 3D 场景。与依赖多边形或复杂神经网络的传统方法不同，3DGS 利用这些溅射点来表现场景。每个溅射点包含其位置、颜色、大小和透明度的信息。当经过组合后，这些溅射点能高度还原场景的真实感。

2024-12-18 10:52:32 5504

原创 3D标注工具和方法

https://yongqi.blog.csdn.net/article/details/128349749https://www.zhihu.com/question/290799294https://github.com/ch-sa/labelCloudhttps://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editorhttps://github.com/springzfx/point-cloud-ann

2024-08-01 10:27:36 466

原创通过Faiss和DINOv2进行场景识别

【代码】通过Faiss和DINOv2进行场景识别。

2024-07-24 17:03:46 581

原创 ARKit之ARFoundation入门

ARFoundation是Unity于2018年推出的跨平台AR开发工具，致力于建成一个统一、开放的AR平台，ARFoundation并不直接提供AR底层技术，而是通过对底层API的进一步封装，ARFoundation提供独立于平台的API，降低开发者对安卓平台ARCore、iOS平台ARKit等技术的开发时间成本。

2024-07-24 10:48:23 992

原创技术管理者的几个实用技巧

个人从程序员到技术 Leader 经历了不少的心路历程，我目前在带一支十几人的技术团队（控制团队人数主要是遵循亚马孙 CEO 贝索斯提出的两个披萨原则技术管理者需要哪些综合能力？如何才能在团队拥有 Leadership？从工程师到团队 Leader 有哪些转变？如何提升技术团队的工作效能？如何提升团队的凝聚力？沟通的技巧？管理者的自我认知和成长个人而言，做技术还是管理都不是很重要，找到自己最大的价值才是最重要的不要被别人走过的路限制住，也不要被职业限制住，没有谁可以定义你的发展。

2024-07-24 10:06:00 962

原创从技术转管理，80% 的人都不知道如何走好第一步

最简单的办法是，总结经验之后再去思考，如果这个任务再来一遍你能不能完成得更好。对于小的任务或者项目，要及时复盘；而对于大任务或者项目，要阶段性复盘；对于重要任务或者大任务完成后要全面复盘；甚至对于自身的事情也可以复盘。这样你能够不断累积各方面的经验，并把经验应用到更多的事情上。多用这个方法，能使我们避免重复犯错，能使好的固化下来，成为能力。

2024-07-24 10:02:13 835

原创 3DGS应用探索

在我们的研究项目 Presence 中，我们尝试了这些不同的方法，发现高斯溅射是一种可行的替代方案。例如，摄影测量对光线敏感，通常难以捕捉细节，尤其是在颜色均匀的物体中（例如，穿着均匀黑色服装的人）。以前，这是一项成本高昂且耗时的工程，需要专门的硬件和软件，例如 LiDAR 扫描仪和复杂的软件包。此外，考虑到我们之前在摄影测量和 NeRF 方面的经验，我们已经熟悉了创建高斯溅射的底层过程，因此这导致了短暂的初步研究。首先，创建一个帐户并登录。值得注意的是，这项初步研究是在高斯溅射刚刚兴起的时候进行的。

2024-07-12 09:53:39 1591

原创使用vscode调试带-m参数的python代码

我在命令行运行的是python -m debugpy --listen 5678 --wait-for-client render.py -m LangSplat/preprocessed_dataset/sofa/sofa --include_feature -l luage_features_1080p_dim3，但是在VSCode中的普通调试，会报模块找不到的问题（原因是普通调试不会带-m参数，所以有些路径就会找不到）。因此，本文记录如何用VSCode调试在命令行输入的如上Python指令。

2024-02-21 11:44:29 994

原创 huggingface镜像网站下载模型

huggingface镜像网站下载模型

2024-01-30 09:43:44 3347

原创 Colmap三维重建详解与使用方法

在重建场景的稀疏表示和输入图像的相机姿势后，MVS现在可以恢复更密集的场景几何。：空间中的一点与两张图片相机的光心，三者围成一个极平面，极平面与两张图片相交形成两条极线，对极几何约束是指，空间点X在摄像机1的成像平面中的像素点x，与之相匹配的摄像机2的成像平面中的像素点 x' 一定落在极线上。是通过一系列有重叠的且不同视角的图片重建出物体的三维结构（稀疏点云），并且输出相机的内外参数，内参指的是将真实空间的三维点通过内参矩阵转换为相机图片上的二维点，外参包含相机在切换不同视角时的平移和旋转信息。

2023-11-23 17:51:26 19368 1

原创神经辐射场（NeRF）中-相机参数与坐标系变换

为了唯一地描述每一个空间点的坐标，以及相机的位置和朝向，我们需要先定义一个世界坐标系。一个坐标系其实就是由原点的位置与XYZ轴的方向决定。接着，为了建立3D空间点到相机平面的映射关系以及多个相机之间的相对关系，我们会对每一个相机定义一个局部的相机坐标系。下图为常见的坐标系定义习惯。常见的相机坐标系定义习惯（右手坐标系）。注意：在OpenCV/COLMAP的相机坐标系里相机朝向+z轴，在LLFF/NeRF的相机坐标系中里相机朝向-z轴。

2023-10-07 18:24:29 1684 1

原创 NeRF项目LLFF 解决新场景pose生成的问题

最近一直在做NeRF相关的项目，其中LLFF前向数据集，是NeRF常用数据集，本文讲下怎么对NeRF数据进行处理几个重要的链接地址。

2023-09-07 09:49:40 532

原创 Ubuntu下多用户共享conda环境

现在你已经安装好了想要的 anaconda。如果有新用户，只需将其加入conda用户组，即可使用共享环境或创建新环境。参考。

2023-04-10 13:35:16 4130

原创 Ubuntu报terminals database is inaccessible

在Ubuntu的命令行窗口中使用clear命令的时候报terminals database is inaccessible错误clear方法一1.执行以下命令2.再次运行clear命令clear3.执行以下命令。

2023-04-07 18:09:14 2165 1

原创用神经辐射场在大场景中漫游

自 2020 年以来，神经辐射场 (NeRF) [1] 一直是计算机视觉领域的热门话题。通过使用神经网络对体积场景函数进行建模，NeRF 实现了新视图合成的最先进结果。虽然与 NeRF 相关的方法在学术界很受欢迎，但它们尚未在产品上广泛实施以提供用户体验。本文旨在演示如何使用 Neural Radiance Field 为徘徊在大型景点周围的用户创造身临其境的体验。

2023-02-20 10:40:56 1093

原创基于 NeRF 的 App 上架苹果商店，照片转 3D 只需一部手机，网友们玩疯了

原文标题：《基于 NeRF 的 App 上架苹果商店！照片转 3D 只需一部手机，网友们玩疯了》只用一部手机，现实中的 2D 照片就能渲染出 3D 模型？没错，无需再手动上传电脑或安装激光雷达，苹果手机自带 App 就能生成 3D 模型。这个名叫 Luma AI 的“NeRF APP”，正式上架 App Store 后爆火：小如 3D 装饰，兼具灯光和形状细节：大到整个墓园的 3D渲染版，都能被很好捕捉：这样无论是风景、3D 物体还是人物，都可以被很好地保存进手机，并快速生成对应的 3D 模型。

2023-02-09 10:53:50 1951

原创论文笔记：NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

传统方法中，通常这一任务采用三维重建再渲染的方式实现，NeRF 希望不进行显式的三维重建过程，仅根据内外参直接得到新视角渲染的图像。分层采样方案来自于经典渲染算法的加速工作，在前述的体素渲染 (Volume Rendering) 方法中，对于射线上的点如何采样会影响最终的效率，如果采样点过多计算效率太低，采样点过少又不能很好地近似。如图所示，白色点为第一次均匀采样的点，通过白色均匀采样后得到的分布，第二次再根据分布对进行红色点采样，概率高的地方密集，概率低的地方稀疏 (很像粒子滤波)。

2023-01-30 10:59:13 2467 1

原创世界坐标系-＞相机坐标系详细推导

首先我们需要定义三个量眼睛的位置 ee，就是相机放在什么地方。视线朝向的向量 gg，相机看向什么地方，类似于眼睛往哪里看。朝向上方的向量 tt，相机顶部的朝向，类似于人头顶的朝向，一般都朝向天空。以上的信息足够让我们定义出一个相机坐标系来首先gg是相机看过去的方向，而一般相机坐标系都是朝着ww轴的负方向看去，因此对gg取反并归一化，得到单位向量ww。接着tt类似于vv的朝向，然后tt和ww做叉乘得到uu，因为叉乘得到的是tt和ww构成平面的法向量，然后归一化。同理ww和uu叉乘得到v。

2023-01-30 09:59:42 1858

原创专利情况的基本了解

专利

2023-01-29 17:38:56 380

原创元宇宙与数字孪生有区别

元宇宙拥有完整的经济逻辑，数据、物体、内容以及IP都可以在元宇宙中存在，元宇宙的核心在于永续性、实时性、多终端、经济功能、可连接性和可创造性，而数字孪生、混合现实、物联网、5G等是建设元宇宙的手段和工具。元宇宙世界的却不限于物理世界，元宇宙作为一个独立的世界，一方面能够映射物理世界，优化物理世界的不同场景，另一方面也能够突破物理世界规则的现实，实现虚拟世界创造。在不断改变我们的生活，作用在生活中的各个场景，但是也仅仅作用于人类的物质生活层面。不仅作用于人类的物质生活，更是作用于人类的精神世界。

2023-01-29 17:22:40 865

原创元宇宙构建基石：三维重建技术

首先，接收输入物体的图像后，算法会对图像进行预处理，主要是做背景抠除，只保留被拍摄的物体本身，之后所有的图像运算都将限制在物体的蒙版上进行。通常基于深度学习的方法训练时，需要输入物体的真实三维结构，但三维结构需要通过精度很高的桌面扫描仪获得，导致金钱成本和时间成本都比较高，同时还面临着算法泛化性的风险。元宇宙的爆发式发展必定会带来内容自动生产的大量机会，依托百度领先的AI和VR技术，百度VR也将继续在这一领域持续深耕，致力将原本复杂的建模操作变得更为简单直接，让用户快速生成高质量的三维模型。

2023-01-29 16:13:56 677

原创 NeRF染助力虚拟物体创造

对于二维图像背后的三维世界建模，哪一种三维表示最合适？现在常见的表示方法有点云、体素和网格，其中多边形网格具有良好的紧致性和几何性质。但是使用神经网络直接由多边形网格生成图像比较困难，因为光栅化的过程阻止了反向传播。因此，本项目所参考的Repo的原作者提出了一个近似的梯度栅格化，使渲染集成到神经网络。使用这个渲染器，可以执行带有轮廓图像监督的单图像三维网格重建，并且该系统比现有的基于体素的方法更好。利用此类可微分的多边形网格光栅化与渲染，才有机会在元宇宙三维世界中进行视觉上的物体生成。

2023-01-09 13:58:46 254

原创 Colmap安装与实践

源码下载地址：COLMAP可以作为独立的app，通过命令行或者图形交互界面使用，也可以作为一个库被包含到其他源代码中。

2022-10-17 14:52:50 3242

原创 Win10下VsCode远程免密连接服务器

输入如下，期间的要求连按三次回车即可。填下服务器的账户名称。

2022-08-17 17:56:56 460

原创 Ubuntu下jax安装与使用

该项目目前仍然没有官方的Windows支持，需要自己编译。

2022-08-17 17:25:46 5295

原创 Ubuntu 给用户添加sudo权限

有时需要使用 root 权限，比如安装软件、启动服务等操作时就需要用到sudo命令来提升权限才能进行操作。而新添加的普通用户是没有权限进行 sudo 操作的，所以我们需要对普通用户授予 sudo 权限。授予 sudo 权限有三个方法，第一个是把用户添加到 sudo 用户组，第二个是修改 sudo 配置文件 ()，第三个是添加配置文件到目录中。选其中一个即可，推荐第三个方法。...

2022-08-17 17:03:46 18530

原创 Python：RuntimeWarning: invalid value encountered in true_divide解决方案

最近在做NeRF相关的项目，其中用到colmap估计图像位姿，运行python出现“RuntimeWarning: invalid value encountered in true_divide”问题。不要使分母为0，可以把分母设置为1e-12。

2022-08-17 16:40:30 5560

原创 Ubuntu开放指定端口

输入如下指令即可完成测试。

2022-08-17 15:39:25 16129 1

原创 OpenCV 4.0.0学习笔记 (一) 图像与视频的读写

它是一系列的预定义的常量，其命名规则为CV_(位数）+（数据类型）+（通道数）U（unsigned integer）表示的是无符号整数，S（signed integer）是有符号整数，F（float）是浮点数。第一个参数是数据流或视频路径，第二个是API设置，读取的摄像头编号，默认CAP_ANY=0,自动检测摄像头。imread读取图像，返回Mat对象，两个参数，第一个是文件名，支持位图bmp、dib，JPEG图像，PNG，webp，pbm，pgm,ppm,TIFF等多种图像，读取失败则返回空矩阵。....

2022-08-17 15:37:26 462

原创 Ubuntu安装NVIDIA独立显卡驱动出现X service error问题解决方法

5、修改驱动程序的执行权限：输入命令：chmod 777 NVIDIA-Linux-x86_64-396.18 #使所有用户和组都具有读、写和执行的权限。6、安装驱动程序：输入命令：sudo ./NVIDIA-Linux-x86_64-396.18.run #当前目录下执行NVIDIA驱动程序。3、输入命令：sudo service lightdm stop 或者 sudo stop lightdm，以便关闭X窗口会话。0、到NVIDIA 官网上下载驱动文件（.run 格式）：。....

2022-08-17 15:20:56 2703

原创语义分割与实例分割

语义分割只能划分类别，而同类无法划分，因此在语义分割之后还需要用实例分割来划分同类别的不同实例。

2022-08-17 14:52:20 873

原创 startx 命令详解

startx 命令用来启动 X Window X11 会话。startx 脚本是 xinit 的前端，它为运行 X Window 系统的单个会话提供了更好的用户界面，它通常没有参数运行。

2022-08-11 15:32:08 4341

原创 Win10配置instant-ngp算法环境说明

在进行源码下载过程中，如下图示红色矩形框部分，由于网速下载不全，会导致下载失败，需要手动对应的下载，然后放到源码对应的位置，切记依赖项。以为是交叉环境问题，然后各种百度，最后在网上找的答案统统都不对，让自己欲哭无泪，因此必须保证自己的源代码文件内容完整和版本一致。文件夹中比对查看依赖项是否完全下载完整，重要事情说三遍：一定要确保文件下载完整！按照官网说明进行安装，亲测cuda11.7都可以运行成功，cuda11.3会有报错。由于vs2019原因会出现相应库缺失，一定要保证库版本一致，不然会出现。......

2022-08-11 10:41:54 3492 13

原创 Pose Animator：使用实时TensorFlow.js模型的SVG动画工具

目录背景将 FaceMesh 和 PoseNet 与 TensorFlow.js 一起使用来制作全身角色动画索具流程概述钻机定义矢量路径的线性混合蒙皮运动稳定展望未来自己试试吧！正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消基于置信度分数的剪裁网格化或不网格化新的编辑功能...............

2022-07-14 14:01:33 1869 1

原创 Windows Docker 安装与问题解决

启动docker时报以下错误查看是否启动以下选项如果已经勾选依然报以下错误分析：未安装或安装的不是最新的wsl2，安装后即可正常打开docker安装：下载安装包，点击安装即可。

2022-07-14 11:40:30 707

原创 Windows安装wsl

管理员运行命令行然后执行现在一般使用wsl2，所以还需要设置接下来就可以打开Microsoft store安装想要安装的linux系统，这里我自己安装的是Ubuntu。或者在命令行中进行安装通过该命令设置默认root登录ubuntu（此步骤可以省略）官方指导：这里默认主机环境可以连接外网直接使用官方脚本自动安装.........

2022-07-14 11:32:11 793

原创【WSL2 Win10】解决子系统中nividia-smi出现的Failed to initialize NVML GPU access blocked by the operating systeM

环境：WIN10专业版 WSL2 Ubuntu x64架构尝试在WSL2中装CUDA，装好以后在wsl系统中输入nvidia-smi命令，结果报错。但是在Win10的CMD中正常显示Failed to initialize NVML: GPU access blocked by the operating systemFailed to properly shut down NVML: GPU access blocked by the operating system在网上搜了一下，没太多类似的情况

2022-07-14 10:48:31 6429 4

原创 OBJ格式模型详细介绍

obj格式有4种数据，分别以一下字母开头：v顶点vt纹理坐标vn顶点法向量f 面一、顶点格式：v x y z意义：每个顶点的坐标二、纹理坐标格式：vt u v w意义：绘制模型的三角面片时，每个顶点取像素点时对应的纹理图片上的坐标。纹理图片的坐标指的是，纹理图片如果被放在屏幕上显示时，以屏幕左下角为原点的坐标。注意：w一般用于形容三维纹理，大部分是用不到的，基本都为0。三、顶点法向量格式：vn x y z意义：绘制模型三角面片时，需要确定三角面片的朝向，整个面的朝向，是由构成每个面

2022-07-14 09:56:02 2838

原创 RTSP SDP RTP/RTCP介绍

SDP（1）SDP（Session Description Protocol）是服务器端生成的描述媒体文件的编码信息以及所在服务器的链接等信息的文件，客户端通过它来设置播放软件的参数。SDP只是一种用于会话描述的协议，它并不是一种传输协议，只是用于在不同传输协议之间传递消息的通知协议，其主要目的是解决多媒体会话通知、邀请和另外一些媒体会话的初始化工作。（2） SDP内容包括：会话名称和目的、会话持续时间、媒体类（音频、视频等）、传输协议（RTP/UDP/IP，H.320等）、媒体编码格式（MPEG4、H.

2022-07-12 10:51:01 1107

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

水印的算法

数字水印 Digital+Watermarking+and+Steganography 第二版

videoinput源码

斯坦福大学机器学习课程个人学习笔记（全集）

kalal大神的TLD目标跟踪算法MATLAB源码

Object Tracking via Partial Least Squares Analysis论文和代码

空空如也