自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不忘初心 方得始终

愿你一生努力 。一生被爱 。想要的都拥有,得不到的都释怀 。

  • 博客(276)
  • 资源 (13)
  • 收藏
  • 关注

原创 Unity3D一些问题的解决方法

Compute mesh inertia tensor failed for one of the actor's mesh shapes! Please change mesh geometry o

2014-06-19 17:18:44 11531 1

原创 Unity使用sherpa-onnx实现关键词检测

本文介绍了在Unity中使用SherpaOnnx实现关键词识别的方案。通过集成sherpa-onnx-kws-zipformer模型,实现了基于WebGL麦克风输入的实时关键词检测功能。代码展示了如何初始化关键词识别模型、配置音频流参数,并处理音频数据输入和识别结果输出。项目已在GitHub开源,为Unity开发者提供了轻量级的关键词识别解决方案。该方案支持自定义关键词列表,适用于语音交互、语音控制等应用场景。

2025-12-30 09:50:24 326

原创 UnityRenderStreaming多对多丐中丐方案

本文介绍了一种基于WebRTC的实时流媒体传输方案,主要包含以下要点:1)采用前后端分离架构,前端通过WebAPI获取connectionId并启动Unity客户端;2)利用阿里云服务器和本地高性能主机组成混合部署环境,通过Tailscale实现内网穿透;3)详细说明了WebAPI接口实现、跨域处理、ICE服务器配置等关键技术细节;4)重点描述了connectionId的生成传递机制,确保Unity端仅处理指定连接的消息。该方案在有限资源条件下实现了高效的实时流媒体传输,具有成本效益和实用价值。

2025-12-22 11:19:00 326

原创 UnityRenderStreaming内网转发到公网

本文介绍了WebRTC中继服务器coturn的配置与使用。内容包括:1)coturn服务器的配置文件和启动方法;2)WebApp源码编译及配置修改,重点调整ICE服务器设置;3)Unity工程中SignalingManager的URL和ICEServers配置;4)服务器端口开放要求;5)展示了运行效果截图。通过coturn实现NAT穿透,为WebRTC应用提供稳定的媒体中继服务。

2025-12-16 16:25:47 241

原创 Windows下编译coturn

本文介绍了在Windows系统下使用vcpkg和Visual Studio 2022编译coturn的步骤:首先克隆vcpkg并配置环境变量,然后下载coturn源码,通过CMake生成Visual Studio项目文件,最后在VS2022中编译解决方案。整个过程包括环境配置、项目生成和编译三个主要环节,提供了详细的命令和配置参数说明。

2025-12-15 16:10:55 336

原创 Cesium for Unity 去除Cesium Logo

本文介绍了在Windows系统下编译Cesium for Unity插件的完整流程。首先需要安装dotnet 9.0.307和CMake 3.31.9,并启用系统长路径支持。然后克隆cesium-unity仓库到Unity工程的Packages目录,使用dotnet发布项目。接着分别配置Debug和Release版本的CMake构建,通过14线程并行编译安装。文中还提供了解决"IonTokenTroubleshootingWindowImpl.h"头文件缺失问题的方法,以及如何通过修改C

2025-12-08 11:18:24 228

原创 Unity使用RVM实现实时人物视频抠像(无绿幕)

RobustVideoMatting项目实现了视频实时抠图功能,基于ONNX模型推理。项目使用Unity Sentis(现升级为Inference Engine)进行AI推理,包含完整的模型初始化、递归状态管理和图像处理流程。作者尝试了C# onnxruntime方案,但遇到GPU加速效果不佳(仅2fps)的问题。项目支持摄像头输入和静态图像处理,提供了前景、alpha通道和最终结果的输出显示功能,包含性能优化和错误处理机制。关键点包括:ONNX模型加载、CUDA加速配置、递归状态初始化、实时视频帧处理等。

2025-11-05 10:39:10 791 2

原创 Unity使用PP-MattingV2实现人像分割

PP-MattingV2是一个基于ONNX Runtime的高效人像抠图模型,实现了精确的实时图像分割功能。该Unity实现通过CUDA加速推理,支持512x512分辨率的输入,处理流程包括:模型初始化、输入纹理预处理、ONNX推理和后处理。代码提供了完整的处理流程,从加载模型到生成透明背景的人像结果图,并内置性能监控功能。项目支持StreamingAssets路径下的模型加载,可处理外部传入的Texture2D对象,输出抠图后的透明纹理。该方案适用于需要实时人像抠图的Unity应用场景,如虚拟直播、AR特

2025-11-01 18:20:11 286

原创 Unity使用AnimeGANv3实现动漫风格化效果(二)

本文记录了在Unity项目中实现GPU加速ONNX推理的过程。首先修改代码启用CUDA支持,然后安装配置了CUDA Toolkit 12.8和cuDNN 9.0.0.312环境。通过dumpbin工具分析ONNX Runtime的依赖关系,确认需要从CUDA和cuDNN中提取必要的DLL文件(如cublasLt64_12.dll、cudnn64_9.dll等)放入Unity项目的Plugins目录。虽然部分文件过大无法上传至GitHub,但成功通过nuget获取ONNX Runtime相关文件并完成了GPU

2025-10-31 14:59:40 227

原创 Unity使用AnimeGANv3实现动漫风格化效果(一)

本文介绍了在Unity中集成AnimeGANv3模型实现图像动漫化的方法。通过调用ONNX Runtime API加载预训练模型,将输入图像调整至512x512分辨率后传入模型进行推理。关键步骤包括预处理(将像素值归一化到[-1,1]范围)、模型推理和后处理(张量转回纹理)。测试效果图展示了良好的动漫风格转换效果,模型推理速度约数百毫秒。代码提供了完整的实现流程,支持CPU/GPU加速,可用于实时图像风格转换应用开发。

2025-10-31 10:53:40 603

原创 用Unity开发一款Win11壁纸程序

用Unity开发一款Win11壁纸程序

2025-10-23 10:44:14 400

原创 在Unity中实现DTLN-AEC处理音频文件的功能

在Unity中实现DTLN-AEC处理音频文件的功能

2025-09-05 18:04:44 353 1

原创 测试DTLN-aec模型

测试DTLN-aec模型

2025-09-04 17:51:59 284

原创 测试DeepVQE模型

测试DeepVQE模型

2025-09-02 10:46:56 303

原创 Unity使用GTCRN实现流式语音增强(二)

关于Unity使用GTCRN遇到的问题

2025-07-31 09:22:38 424

原创 Unity使用SoundFlow对音频文件降噪

Unity使用SoundFlow对音频文件降噪

2025-07-29 10:08:36 412

原创 Unity使用GTCRN实现流式语音增强(一)

Unity使用GTCRN实现流式语音增强

2025-07-17 15:42:50 570

原创 使用sherpa-onnx的热词功能

文章摘要:Sherpa-ONNX目前仅支持基于Transducer模型的离线/在线语音识别系统使用热词(hotwords)功能。文章提供了C#代码示例,展示如何实现一个离线语音识别系统,其中包含热词配置(通过hotwords.txt文件和HotwordsScore参数)。该系统还包括语音增强、标点符号添加等辅助功能,通过Unity的MicrophoneWebGL组件实现音频采集。代码演示了从模型初始化到语音识别结果回调的完整流程。

2025-06-07 10:31:12 982

原创 基于VLC的Unity视频播放器(四)

摘要:作者分享了解决unity-vlc m3u8播放问题的粗暴方法(SetFormat+Stop+Play),确认Android平台播放正常,Ubuntu24.04打包版本闪退问题已解决。项目已迁移至GitHub(https://github.com/xue-fei/vlc-unity),原码云存储空间即将耗尽。

2025-06-03 17:27:15 618 2

原创 Unity使用sherpa-onnx实现说话人识别

本文介绍了使用3dspeaker_speech_eres2net_base_200k_sv_zh-cn_16k-common.onnx模型进行说话人识别的实现方法。代码展示了如何初始化说话人特征提取器(SpeakerEmbeddingExtractor)和管理器(SpeakerEmbeddingManager),包括音频降噪处理、说话人注册和验证测试流程。通过ComputeEmbedding方法计算音频特征向量,使用Search方法进行说话人识别比对。该实现支持实时音频数据输入处理,能够将未知说话人标记为&

2025-05-19 17:30:18 870

原创 esp32s3聊天机器人(三)

esp32s3聊天机器人

2025-03-25 16:37:32 576 1

原创 Unity打包Android平台调用sherpa-onnx

本文介绍了在Unity中集成Sherpa-ONNX语音识别和合成功能的过程。作者首先在PC端(Windows/Linux)通过NuGet包测试了语音转文字和文字转语音功能。针对Android平台,通过预编译的.so库文件简化集成,避免了繁琐的Java代码编写。文章详细说明了Android打包所需的gradle配置修改,包括忽略模型文件、禁用R8优化等关键设置。最终成功在Android设备上运行,并附上了功能截图。整个方案充分利用了Sherpa-ONNX的跨平台特性,实现了高效的语音功能集成。

2025-03-14 14:31:47 3898 1

原创 esp32s3聊天机器人(二)

esp32s3聊天机器人

2025-03-06 11:11:35 744

原创 esp32s3聊天机器人(一)

esp32s3聊天机器人

2025-03-06 10:16:15 1521

原创 基于VLC的Unity视频播放器(三)

基于VLC的Unity视频播放器

2025-02-16 18:35:30 690

原创 Cesium for Unity Linux版本

本文记录了在Linux系统上安装Cesium for Unity的尝试过程。作者按照官方开发流程,使用dotnet和cmake工具进行安装,遇到了一些问题并通过GitHub issue找到解决方案。最终成功运行了编辑器界面,但打包过程耗时较长且出现了一些不明报错。整个过程展示了在Linux平台安装Cesium for Unity的可行性与挑战,为开发者提供了实践经验参考。

2025-02-12 10:11:55 778 2

原创 Unity在WebGL中拍照和录视频

Unity在WebGL中拍照和录视频

2025-01-24 11:16:09 574

原创 UnityRenderStreaming使用记录(五)

docker部署UnityRenderStreaming

2025-01-08 15:05:33 1169

原创 UnityRenderStreaming使用记录(四)

测试把UnityRenderStreaming部署在docker,剧透一下,嘎了……

2025-01-02 15:58:30 661

原创 UnityRenderStreaming使用记录(三)

测试UnityRenderStreaming在Ubuntu24.04.1LTS上的表现

2024-12-31 09:35:25 753

原创 使用Fleck的WebSocketServer遇到的一个问题

使用Fleck的WebSocketServer遇到的一个问题

2024-05-22 11:26:32 725

原创 Unity使用编辑器代码给模型添加SALSA组件

Unity使用编辑器代码给模型添加SALSA组件

2024-05-17 14:34:03 582

原创 Unity使用sherpa-onnx实现离线语音合成

本文介绍了在Unity中使用sherpa-onnx实现语音合成的过程。作者通过将相关dll和lib库导入Unity,并修改官方示例代码,成功实现了中文语音合成功能。文章详细展示了配置参数、回调函数处理以及音频保存的实现代码,并分享了测试过程中发现的问题:生成的音频采样率为8000Hz,以及编辑器模式下出现异常尾音(但打包后正常)。此外,作者还添加了测试UI界面,优化为流式AudioClip播放(3秒延迟),并测试了多个模型,发现其他模型的音质优于vits-zh-aishell3。项目代码已开源在Gitee平

2024-05-14 16:14:45 3286 21

原创 Unity使用编辑器代码给模型添加uLipSync组件

使用编辑器代码给模型添加uLipSync组件

2024-05-13 17:20:14 830

原创 使用sherpa-onnx给文字添加标点符号

本文介绍了在C#中实现ONNX标点符号添加功能的过程。作者发现ncnn框架不支持标点添加功能,于是参考ONNX示例实现了C#版本。通过创建OfflinePunctuation类,配置模型参数,并调用外部DLL接口,成功实现了文本标点添加功能。调试过程中遇到编码问题,经指点后通过设置系统UTF-8编码解决。该模型支持中英文混合文本,但默认输出中文标点。完整代码已开源在GitHub仓库中。

2024-05-05 16:00:45 1206 7

原创 UnityWebGL使用sherpa-ncnn实时语音识别

本文介绍了基于Kaldi和ncnn的离线语音识别系统sherpa-ncnn的WebGL实现方案。通过UnityWebSocket插件建立WebSocket连接,将Unity端采集的音频数据实时传输到C#服务器端进行识别处理。服务器使用Fleck框架搭建WebSocket服务,加载sherpa-ncnn模型进行流式语音识别,并将识别结果实时返回客户端。系统支持跨平台部署,包含完整的客户端和服务端实现代码,可用于开发无需互联网连接的实时语音识别应用。

2024-05-01 15:06:19 2249 11

原创 UnityWebGL获取话筒实时数据

UnityWebGL获取话筒实时数据

2024-04-30 09:52:51 1273 2

原创 MediaPipeUnityPlugin(最新版)摇摆拳人脸识别

MediaPipeUnityPlugin(最新版)摇摆拳人脸识别

2024-01-06 18:45:18 2771 7

原创 Unity添加所有场景到BuildSettings

Unity添加所有场景到BuildSettings

2024-01-05 15:35:18 1131

原创 MediaPipeUnityPlugin Win10环境搭建(22年3月的记录,新版本已完全不同,这里只做记录)

MediaPipeUnityPlugin Win10环境搭建(旧版)

2024-01-05 15:25:49 1061

vs快捷键大全.docx

vs快捷键大全,常用快捷键的说明都在里面

2014-03-06

游戏开发常用算法

游戏开发常用算法,讲解一些常见的游戏开发算法……

2013-03-01

LeapMotion_CoreAsset_Orion_4.1.5

LeapMotion_CoreAsset_Orion_4.1.5

2017-04-07

3DMax 2013 FBX 插件

3DMax 2013 FBX 插件

2012-12-21

LitJson.dll

LitJson.dll,json中的一种,简单容易利用。

2013-06-24

ninepatch-editor-1.25

ninepatch-editor-1.25

2014-03-06

TangoSDK_Eisa_Unity5.unitypackage

TangoSDK_Eisa_Unity5.unitypackage

2017-04-07

iGUI1.4.1b

iGUI1.4.1b,unity界面插件

2014-03-06

NGUI2.6.2插件

NGUI2.6.2,最好用的界面插件没有之一。

2013-09-17

[lua编程].Programming_in_lua.pdf

[lua编程].Programming_in_lua.pdf

2014-03-06

MyEclipse-8.5汉化包

MyEclipse-8.5汉化包,内有详细说明

2012-12-21

Gif截屏软件

Gif截屏软件

2017-04-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除