人工智能实用软件源码工具等分享
文章平均质量分 73
结合人工智能软件,分析技术原理,分享好用的软件。
优惠券已抵扣
余额抵扣
还需支付
¥239.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
Softboy_TM
-
视频与音频一键同步嘴型数字人ai工具分享
比如, 看演示a视频效果非常不错,自己去用却跟智障一样的。出现这种情况,我们首先不去评价这个工具的好用,我们得分析别人使用的前置条件。2:选择视频,就是你需要同步嘴型的视频。大部分前置条件都是大量的训练数据, 比较专业的数据,然后大量的ai训练。这样出现的ai效果是自然是还可用的。在ai发展的今天,各种虚拟主播工具层出不穷,我们在选择ai工具的适合往往陷入一个使用陷阱。普通人往往没这么专业,没有那么多数据,没有好的显卡花很多时间训练,难以达到别人演示的效果。目前这个是全网领先的ai数字人工具,基本是独家的。原创 2023-05-16 11:10:36 · 1205 阅读 · 0 评论 -
实时准确的全身多人姿态估计与跟踪系统
这是一个精确的多人姿态估计器,它是第一个在 COCO 数据集上实现 70+ mAP(75 mAP)和在 MPII 数据集上实现 80+ mAP(82.1 mAP)的开源系统。 为了跨帧匹配对应于同一个人的姿势,我们还提供了一个名为 Pose Flow 的高效在线姿势跟踪器。它是第一个在 PoseTrack Challenge 数据集上实现 60+ mAP (66.5 mAP) 和 50+ MOTA (58.3 MOTA) 的开源在线姿态跟踪器。它同时支持 Linux 和Windows! (推荐)使用 c原创 2022-06-20 12:03:20 · 795 阅读 · 0 评论 -
抖音上二次元虚拟主播直播方案
二次元虚拟主播国外发展比较早,国内也有几家作这个的。国内主要是2D的可以搜live2D 了解,比较多的方案,也有一些商用的,带动作捕获的 。今天我要分享是一个可以完全商用的,基于摄像头的进行动作捕获的虚拟主播。我们指导动作捕获的装备比较贵,整套下来预算估计得超过1个W。但是基于摄像头的纯软件的方案,在2021年以前,由于局限于AI算法的发展,完全商用难度比较大。但是随着科技居然google开源的midiapip后,视乎发生比较大的变化。废话不多说,我们今天来介绍就是该软件的使用教程。然后分享源码方案,文章的原创 2022-06-13 15:41:54 · 3178 阅读 · 0 评论 -
目标识别、检测和 6D 姿态估算源码与方案(最先进的方法和数据集)
3D 对象的准确定位和姿态估计对于许多更高级别的任务非常重要,例如机器人操作(如Amazon Picking Challenge)、场景解释和增强现实等等。最近推出的消费级深度传感器已经允许对传统的 2D 方法进行实质性改进,因为可以捕获更精细的 3D 几何特征。然而,仍然有一些挑战需要解决,包括:前景遮挡,背景杂乱,大尺度和姿势变化,多实例对象!【本专栏更到目前16章,订阅30+,原创不易,订阅获取源码方案】本文章的范围是列出可用于进一步帮助推动研究的最先进的方法和数据集,不罗嗦先看下方效果。先进的算法原创 2022-06-06 10:23:11 · 353 阅读 · 0 评论 -
网页中加载二次元3D虚拟主播源码(1:项目介绍和源码)
vrm格式的二次元3D虚拟主播在日本实际上已经盛行多年,由于文化和差异的原因,在我们这只有年轻人比较喜爱。今天我们讲的是如何加载这种模型,然后实现一些动画。别的不说,我们先上效果视频:3D二次元虚拟主播源码运行Demo视频视频中展示 是在浏览器中加载显示3D人物的效果,人物在加载了动画。这种格式的模型,还是支持人物一些动作控制,比如眨眼,张口。几个表情,以及肢体的动作。在设计模型的适合,你可用多设计一些动作,然后在代码中控制变量改变动作的幅度。我们先看代码:这一部分代码主要是显示模型原创 2022-05-29 10:26:01 · 1357 阅读 · 0 评论 -
Python自动发抖音脚本教程(1:介绍和源码)
如果你很懒,不想自己一步一步的手动操作发抖音。希望自动化一键操作,那么你来这就对了。本脚本可以模拟人工操作网页,自动发送抖音。不是纯接口的模式哦,如果符合你的期望请继续往后看。【订阅获取源码,源码在最后】我们先看效果:首先我们准备好视频文件和封面。自动发抖音需要的那么软件工具?1:你需要一个可调试的浏览器。我选择的是谷歌浏览器,并进行相关配置才能调试哦。为了让你的浏览器配置下面的新增的脚本 --remote-debugging-port=...原创 2022-05-11 21:16:06 · 6013 阅读 · 7 评论 -
Python可开一家AI公司的语音克隆源码方案
只需要任意人几秒的人声,AI已经能克隆任意人的声音了!这次是真的可以开一家公司,源码作者已经开了一家公司了!代码最早是19年首次开源,然后陆续开始编码达到一个非常完整AI源码方案的产品,同时源码开发者已经上线自家的AI网站,可以让普通人,通过上传自己的声音一键生成带自己声色的语音合成器,这里我简称TTS 。 其实语音合成器大家都不陌生,就是文字转语音 Text To Speech(tts)各大互联网公司都有自己的产品,比如 高德地图 林志玲声音 我就特别喜欢,他们做出这样效果往往非常复杂,今天安利.原创 2022-04-18 11:02:44 · 3747 阅读 · 0 评论 -
Python人脸表情动作迁移源码产品级别应用方案
这个面部动作表情迁移,是基于百度飞浆生成对抗网络开发套件。观察上图,输入一张人脸 & 和以断视频,输出由相片生成的视频并带有视频的人物的动作表情。【订阅获得该项目源码方案】我们再来看以断效果好的视频。Umurongo 效果视频改软件是基于这个开发出来的,效果还是蛮不错的,里面的人物唱歌各种动作表情,嘴型也是同步的非常好。接下来,我们看怎么使用吧,自己开发一个出来玩玩。整个实现步骤还是老样子,分为三步:下载PaddleGAN 运行First Order Mo..原创 2022-04-13 11:39:17 · 1466 阅读 · 0 评论 -
Python足够开一家语音识别公司的中文语音识别系统源码方案
对于刚开始接触语音领域的新人来说,如何学习入门是一个棘手的问题。那么今天我就在这里做一些如何入门的介绍和相关资料的推荐吧。做语音识别主要需要学习这三大类:数学、程序设计、算法,如果涉及到应用落地,还需要根据实际情况学习其他知识(比如网站前后端开发、移动应用开发等),但如果是做理论科研或者技术研发,就主要是这三个方面的知识。数学不用多说,“高等数学(微积分)”、“线性代数(矩阵)”、“概率论与数理统计”这三门大学基础课程一定要学好。这方面我就不需要做资料推荐了,市面上相关的资料非常多,大家可以自行选择原创 2022-04-12 11:36:58 · 5873 阅读 · 1 评论 -
Python输入音频wav同步嘴型源码方案
这是由ACM MM2020发表了的一篇论文,提出一个AI模型,只需要一段人物视频和一段目标语音,就能够让音频和视频合二为一,人物嘴型与音频完全匹配。【订阅栏目 获取全部的源码方案】选一张蒙娜丽莎的照片和一段简短的音频,就可以让嘴唇同步,这是静态的照片,所以照片中的人物头部没有任何动作,它还能让视频中的人物与输入的音频同步。我们来看一段视频吧。其实它的应用非常广,比如好莱坞可以用它来制作多国语音的电源,毫无违和感。然后最近流行的虚拟主播,也是广泛的使用嘴型同步。这个源码它就是通过训练模型,原创 2022-04-11 15:57:13 · 4143 阅读 · 1 评论 -
Python让AI虚拟主播接入微软Azure语音合成并精准嘴型同步
上一篇文字中讲了利用Python实现利用微软Azure无限免费将文本转mp3格式的音频文件并下载到本地。微软Azure TTS的优点不用多说,今天将讲如何利用Python将其接入到虚拟主播中来。订阅专栏,我将免费向您提供具体的方案。看过专栏其他文章的朋友,一定知道,我们使用的虚拟主播软件为Motionface,其支持一些简单好用的接口。我们先看看Motionface的效果:我们看到了其要求是需要wav格式的音频来驱动嘴型同步,但是微软Azure语音合成为mp3格式,这时,我们需要将mp3音频原创 2022-04-11 10:49:52 · 6047 阅读 · 0 评论 -
Python利用微软Azure免费的语音合成TTS源码分享
我敢保证,用过微软的语音合成后,你就会发现这是世界上最好的语音合成软件。99.99%接近人声自然流程。语调也非常自然,结合其独特的sml标记语言,合成过程中可控制主播声色和音调,以及停顿等各种的内容。再多的介绍,自己可以百度去了解,本文讲解如何使用免费的方法合成语言输出成MP3格式的音频文件。本文最后会贴出源代码,代码需要使用Python环境,这里会详细介绍。源码在最后,使用方法见最后。源码是Python脚本,不需要去微软官方注册id 不用绑定卡,微软官方的演示:https://azure.mi原创 2022-04-09 17:32:23 · 4673 阅读 · 3 评论 -
Python控制AI虚拟主播说话聊天源码分享
Python是非常简单以用的脚本语言,本次我们将介绍如何实用Python控制一个AI虚拟主播说话聊天。通过分析目前市场上可用的虚拟主播软件,发现Motionface是一个简单可用的虚拟主播软件,它提供简单的http接口,是实时响应的,不像其他虚拟主播软件(baidu,xunfei等)需要很高的算力才能使用。订阅专栏,我将免费向您提供具体的方案。我们先看看Motionface的效果:本次使用的是雷电模拟器,雷电模拟器是一个在PC电脑运行的安卓模拟器,因为Motionface是安卓软件,用安原创 2022-04-08 11:08:58 · 5504 阅读 · 0 评论 -
抖音虚拟主播进行直播无人值守直播(2:无人直播互动源码)
抖音无人直播原创 2022-03-20 11:30:10 · 14141 阅读 · 0 评论 -
抖音虚拟主播进行直播无人值守直播(1:项目展望与演示)
自从FB公司All IN 元宇宙后,怎么个互联网都不好了!现在一切都卷的不行,连老罗还清的债务准备新的创业项目打算从元宇宙开始。我们小白板砖的coder只能做一些力所能及的事情。 对于元宇宙在当前应用,我觉得是从一个虚拟主播开始,它能进行互动,能展示出动作形态。做出对应的反应。从一个函数输入输出的这种的思维来说,它需要输入东西由哪些呢?首先它要能听,它要能看,它要能闻, 它要能触摸。输出的呢,它要能说,会笑,会做动作,由一定人类智慧的思维。 展望是美好的,结合现在可行的技术方案来...原创 2022-03-18 20:39:53 · 3254 阅读 · 0 评论 -
抖音直播间弹幕解析:点赞,评论,送礼,进入提示等(3:protobuf中proto文件的编写)
前面两个章节中讲了 怎么样抓包,怎么样用protobuf编译出py然后生成对应的消息。这里将讲proto文件如何编译。要了解 proto如何编写,需要先了解为什么抖音要用protobuf协议,以及protobuf由什么优势和特点。协议缓冲区(Protobuf)是Google开发的与语言无关的数据序列化格式。Protobuf之所以出色,原因如下:数据量低:Protobuf使用二进制格式,该格式比JSON等其他格式更紧凑。 持久性:Protobuf序列化是向后兼容的。这意味着即使接口在...原创 2023-12-27 20:28:06 · 3327 阅读 · 0 评论 -
抖音直播间弹幕解析:点赞,评论,送礼,进入提示等(2:解析protobuf代码)
抖音直播间弹幕解析:点赞,评论,送礼,进入提示等(1:概叙)抖音直播间数据抓取打印效果演示上一章中说了弹幕解析需要了解的知识点以及环境的搭建,本章中深入到代码中去,了解项目的架构和原理以及protobuf 解析实战代码。现在说一下项目的思路吧:1. 谷歌浏览器打开live直播间2. mitmproxy 捕获live.douyin.com http请求并保存响应为指定目录下文件3. watchdog监控步骤2指定目录下文件变化后反序列化文件(application/protobuf格式)原创 2023-12-27 20:27:51 · 4409 阅读 · 0 评论 -
抖音直播间弹幕解析:点赞,评论,送礼,进入提示等(1:概叙)
抖音直播时,如需要抓取到直播间的数据,你需要了解如下几个知识点:本文会指导准本好环境,了解整体的技术路线。本文为原创内容,转载需联系我,我同意后才能转载。抓取分析后的打印效果1:抓包。为了方便抓包,我们使用谷歌浏览器看直播。也就是抓取抖音 web直播内容。现在抓包工具特别多,但是为了让我们的Python程序处理抓包的数据,那么我们使用的抓包工具就不能乱选。目前我选的抓包工具:mitmproxy。mitmproxy还有两个关联组件,一个是mitmdump,它是mitmpro.原创 2023-12-27 20:27:01 · 5890 阅读 · 1 评论