一些方法记录
文章平均质量分 77
一些技术的学习,总结一下步骤以及会碰到的麻烦
gootyking
这个作者很懒,什么都没留下…
展开
-
填坑 3D gaussian splatting里SIBR_viewers的安装
那剩下的就是我把这个链接地址给换掉了,反正就是换成了可以访问的到,并且就是要下载的那个资源。因为3DGS生成的模型要跑起来得用到GPU,所以一开始我就只能用它带的viewer,结果装了半天装不上,上篇文章评论里我看大家也遇到了吧。然后再编译,就成功了,安装完,所有的view软件都装在这个目录的install/bin里了。然后不出意外,就编译报错了,就是因为编译过程需要用个插件是github上的,结果下不下来。报错信息里有要下载的链接的关键词, 于是我复制了一下在代码里全局搜了一下找到了对应代码。原创 2024-01-13 16:35:17 · 2536 阅读 · 2 评论 -
3D Gaussian Splatting的使用
Gaussian splatting 快速生成自己屋子的模型原创 2023-12-04 15:02:25 · 5355 阅读 · 20 评论 -
很厉害的语音克隆TTS:coqui-ai TTS的使用过程
我录了几句话,十几秒的音频,然后就能克隆输出了,我用GPU,速度很快,3秒内就输出了,当然这和传的音频还有合成文字的长度有关系。这一串tts_models--multilingual--multi-dataset--xtts_v2 是程序自动创建的目录,如果模型下载失败,这个目录会直接删掉的,注意。coqui-ai开源的TTS,它的特色我总结为:可以上传自己的一段人声音频(哪怕就几句),它就能给你克隆了,并且把你要说的文字给转成语音读出来。如果想自己训练啥的,就下载源码按教程弄吧,这里就不说了。原创 2023-11-23 15:59:02 · 5652 阅读 · 9 评论 -
Colmap在Linux下的安装
如果有问题那就要么有更基础的没装,或者版本问题,总之仔细看报错的信息,分析一下应该就能找到解决办法。在用Gaussian splatting时,要先装colmap才能做一些预处理。以下是我这的安装过程记录,可能不一定适合其他人,但是仔细查查肯定能解决~进入目录,然后创建build目录,在这里进行编译和安装。结果,我这个编译安装过程异常顺利,有点不敢相信。cuda版本:11.8,显卡是4090。问题1: 有出现这个库出错的 libtiff4.0。解决:可能是依赖连续安装时,有些因为网络原因漏装了。原创 2023-11-21 15:45:48 · 1176 阅读 · 8 评论 -
语音识别神器 Whisper 的几个小技巧
综述所述,最后就固定一个prompt的写法,就能解决标点符号和繁体字问题。以下是普通话的句子,这是一段会议记录。如果想输出繁体字,上面内容就全用繁体字写。后半句写语音的内容概括,并且一定要加上句号。祝大家成功!原创 2023-11-18 11:48:51 · 3941 阅读 · 3 评论 -
升级和切换CUDA版本
这里先记录下初学时可能会搞迷糊的问题,就是跑深度学习这些的时候,CUDA版本到底看的是哪个,我开始就搞迷糊了。第2个版本是toolkit的版本,这才是编程要看的那个版本,一般是小于等于第1个显示的版本。在我的环境里这么操作是没问题的,如果大家遇到不一样的问题,就再多搜搜细心分析,肯定能解决的~第1个版本是显卡驱动的版本,这个版本显示了这个显卡最高支持的CUDA版本。1)nvidia-smi 命令出来的,比如当前我的版本显示的是 12.0。所以修改这个文件,把路径指到新版本的目录,就可以了。原创 2023-11-16 14:00:51 · 1600 阅读 · 1 评论 -
web.py 的基本使用方法
最近要快速做一些DEMO,所以直接用了web.py做后台web服务,记录下最基本最简单使用方法,理解一下它的逻辑。web.py的介绍就不说了,一搜就有,直接开始。我的环境是这样的:系统:ubuntu 22.04python: 3.8 (conda环境)如果大家用下来和我经历的不一样,那就再琢磨琢磨,总会解决的~原创 2023-11-15 19:32:20 · 452 阅读 · 0 评论