- 博客(145)
- 收藏
- 关注
原创 详细解析Ubuntu22 部署Kaldi大模型
包含Kaldi的核心源代码,提供了实现语音识别所需的基础功能,例如声学建模、特征提取、解码器等。包含与Kaldi相关的工具和第三方依赖项。这些工具可以用于数据预处理、特征提取、模型训练等。例如,sph2pipe工具用于处理SPH音频格式,sox工具用于音频格式转换和处理:包含一些示例和教程,用于演示如何使用Kaldi构建语音识别系统。这些示例通常包括数据准备、特征提取、模型训练和解码等步骤,帮助用户理解和使用Kaldi。:包含用于构建 Kaldi 的 CMake 脚本和相关文件。
2024-06-11 10:27:21
1060
原创 《Python数字信号处理应用》学习笔记——第二章 谐波
之后会了解完整的FFT,它能处理复数信号(见7.9节),将rfft的结果赋值给hs,这是一个NumPy复数数值,表示的是波形中各个频率元素的振幅和相位差。和三角波一样,方波也只含有奇数谐波,这也就是其频谱中在300Hz、500Hz和700Hz这样的值处有尖峰的原因。同样 7700Hz的信号也无法与2300Hz的信号区分,9900Hz的信号无法与100Hz的区分。以5000Hz折叠,就会出现在-2100Hz,但是它在0Hz处被再次折叠,从而回到2100Hz。2. frac序列介于0~1,其频率是给定的。
2024-05-21 17:39:03
1281
原创 《Python数字信号处理应用》学习笔记——第一章 声音和信号
代表随着时间变化的量。声音源于空气压力的改变。声音信号代表的是空气压力随着时间的变化。是测量上述变化并产生表示所测声音的电信号的设备。传声器和扬声器都被称为换能器(transducer)。
2024-05-20 10:30:41
1139
原创 使用 OpenVINO 部署ChatGLM3-6B 模型
这是指定虚拟环境目录的名称。这个目录将会被创建在你运行这个命令的当前目录下,并且包含了Python解释器、标准库以及安装包的副本。2.英特尔的CPU,包括个人电脑CPU 和服务器CPU。这是一个选项,告诉Python解释器以模块的方式运行随后的参数。这是Python标准库中的一个模块,用于创建轻量级的虚拟环境。- OpenVINO IR 模型所在目录的路径。- OpenVINO IR 模型所在目录的路径。- 模型所在目录的路径(绝对路径);- 输出标记的最大大小。- 保存模型的路径。- 运行推理的设备。
2024-05-15 16:17:32
951
原创 《语音识别模式、算法设计与实践》——第二章 必知必会的数学基础知识——基本函数的用法
以数据驱动为主的模式识别问题都在做参数预估,这里的参数就是指函数的参数。
2024-05-07 09:29:46
907
原创 ubuntu开机自动使用screen执行执行脚本
screen是一个功能强大的终端多路复用器,允许用户在单个终端窗口中运行多个终端会话,即使断开连接后,会话中的程序仍然可以继续运行。
2024-04-15 11:42:10
1694
原创 开机自动实现ssh远程连接(内网穿透)
在公网IP服务器段,使用netstat -pantu命令检查8899是否开启,检查内网服务器使用netstat -pantu命令检查是否已经成功开启了向8.8.8.8服务器的ssh隧道。在本地计算机,使用ssh远程转发,实现将本地服务,映射到云端服务器指定端口,实现内网穿透功能,即我们可以通过云端服务器的公网ip,将流量转发到内网服务器的端口。实现目标:将【内网服务器】9999端口的服务,转发到【公网服务器】8899端口。公网服务器: 我的云服务器,即拥有公网IP地址的服务器地址为8.8.8.8;
2024-04-14 15:46:18
554
原创 ubuntu22 设置开机自动运行程序
是 Ubuntu 22.04 的默认启动系统和服务管理器。你可以创建一个 my_service.service。将/path/to/your/script.py替换为你要执行程序的路径。执行后,打开新的shell,输入下列命令,检查9999端口是否开启了侦听。当看到了127.0.0.1:9999这一行内容,说明以上程序成功执行。文件来定义你的服务,并将其放置在 /etc/systemd/system/验证方式,与上面程序运行的验证方式一致,此处省略。这将在系统启动时自动启动你的服务。
2024-04-11 16:34:42
1315
原创 ubuntu中 输入python后python3不能调用
命令设置为指向 Python 3 解释器,并为其分配一个优先级(在这个例子中是 10)。(如果有多个候选项(例如,Python 2 和 Python 3),链接以指向 Python 3。如果你的系统上有 Python 3,你可以更新。会使用具有最高优先级的候选项作为默认值。
2024-04-11 14:44:04
351
原创 ubuntu22 安装cuda和nvidia显卡驱动
这是一个本地的DEB包安装选项。DEB是Debian及其衍生版本(如Ubuntu)的软件包格式。选择这个选项,您会下载一个DEB文件,该文件包含了CUDA工具包和相关驱动程序。您可以使用dpkg命令或任何图形化的包管理器在本地安装这个文件。:这是一个网络安装选项,它允许您通过APT(Advanced Package Tool)包管理器从NVIDIA的官方仓库下载和安装CUDA。选择这个选项,您会得到一个deb包,该包包含了NVIDIA的仓库信息。安装这个包后,您可以通过apt-get命令安装CUDA。
2024-04-10 16:01:38
1320
转载 Ubuntu20.04重启禁止内核升级的解决方案
如果您已经安装了自动更新功能,则系统将自动下载和安装可用的更新,这可能导致系统在不经意间被重启,若使用的软件依赖于特定版本的内核,那么当系统自动更新到新的内核版本时,可能会出现兼容性问题。请注意,禁用自动更新可能会导致你的系统变得不安全,因为你需要手动安装重要的安全补丁。在禁用自动更新之前,请确保你明白其中的风险。` 以禁用自动更新。例如,如果你的内核版本是 `5.4.0-42-generic`,你需要锁定所有与此版本相关的软件包。要禁止特定的内核版本更新,你可以使用 `apt-mark` 命令将其固定。
2024-04-10 14:49:17
319
原创 《语音识别模式、算法设计与实践》——第二章 必知必会的数学基础知识——概率与统计
语音识别中,一监督为主的机器学习算法,都是基于已知数据的训练和学习,其中最根本的就是统计语音数据的概率和特征,从而实现语音的自动分类。
2024-04-08 12:16:42
412
1
原创 《语音识别模式、算法设计与实践》——第二章 必知必会的数学基础知识——向量与矩阵
随着机器学习算法的发展,语音识别中几乎所有的模型和算法都是建立在数学的基础之上,数学最大的作用是将具体问题抽象成公式或数字化表示,便于计算机实现自动化运算。本章介绍的数学知识主要服务于语音识别的常见模型表示语音数据——向量、矩阵揭示数据之间关系——概率、统计寻找语音数据之间的规律,从而对新数据预测——函数神经网络中求导方式和建模思想——梯度下降法、数列的特性。
2024-04-08 11:39:06
913
原创 《语音识别模式、算法设计与实践》——第一章 语音识别概述
语音识别是让机器具备自动接收和分析人类的语音,并最终输出对应文本的过程。将输入语音转化为文字的输出提前规定好该系统可以接收的语音输入形式,比如单个词、命令短语和连续语音。对应的文本输出形式,可以直接翻译出来的对应文本,也可以是经过编码的特殊字符,比如组成发音的基本单位——音素。由此可知,系统的输入和输出不同,决定了语音识别的任务是多种多样的。核心模块包括:A. 接收输入语音的麦克风设备B. 负责自动分析语音信号的程序C. 完成语音到文字的翻译程序D. 将最终语音到文字的翻译程序。
2024-04-03 11:44:35
1293
原创 kivy运行时的错误1:WARNING: running xinput against an Xwayland server. See the xinput man page for details.
将/etc/gdm3/custom.conf里面的WaylandEnable的值改为false,本身就是false的,把前面注释去掉。这里我使用的geany,你也可以使用别的工具如:vi、leafpad等。打开/etc/X11/xorg.conf.d/40-libinput.conf。
2023-09-13 16:11:57
637
原创 building cffi for arm64-v8a报错及找不到‘setuptools_rust‘模块
kivy buildozer编译过程中报错处理
2023-09-08 16:45:24
195
1
原创 XCamera:Android 优化的相机小部件
链接:https://pan.baidu.com/s/1ll3xpQn7mmPPBgGWV79qMA提取码:1111--来自百度网盘超级会员V7的分享它显示一个“拍摄按钮”,用户可以按下该按钮来拍照在Android上,它使用原生API来拍摄高质量的照片,包括自动对焦、高分辨率等功能。它包括强制横向模式的方法。在 Android 上,拍照时通常需要切换到横向模式:您可以通过调用轻松完成此操作,然后将方向恢复到之前的方向。在 Android 上,分辨率属性。
2023-09-04 10:41:24
209
原创 CameraBase
版本 1.8.0 中的更改:现在有 2 种不同的 Gstreamer 实现:一种使用 Gi/Gst,适用于 Python 2+3 和 Gstreamer 1.0,另一种使用 PyGST 仅适用于 Python 2 + Gstreamer 0.10。尝试向相机请求的分辨率。如果相机不支持该分辨率,则可能会引发协商错误。具体的相机类必须实现初始化和帧捕获到可以上传到 GPU 的缓冲区。如果未指定尺寸,则默认为相机图像的分辨率。#每次更新相机纹理时触发。#相机捕获的分辨率(宽度、高度)#返回最新拍摄的相机纹理。
2023-09-04 10:19:59
77
原创 Kivy Camera
该Camera小部件用于捕获和显示来自相机的视频。创建小部件后,小部件内的纹理将自动更新。创建对象后,相机纹理不会立即更新。相机初始化是异步的,因此在创建请求的纹理之前可能会有延迟。调用相机时使用的首选分辨率。resilution是 一个列表属性的参数,并且默认为 [-1, -1]。默认情况下,使用系统上找到的第一个摄像头。play是 一个布尔值属性的参数,并且默认为 False。根据实现的不同,相机可能不尊重此属性。使用的相机索引,从0开始。并且默认为 -1 以允许自动选择。
2023-09-04 10:02:21
235
原创 附录 A:使用 adb
您还可以以无线方式连接设备使用abd(具体方法,搜索引擎自行搜索),但这似乎不适用于 WSL。现在启动您的应用程序。是安装Android Studio。它会继续记录,直到终止。
2023-08-29 15:54:34
111
原创 Android应用权限
Android 限制对许多功能的访问。应用程序必须声明它所需的权限。有两种不同的声明:清单和用户。用户权限是清单权限的子集。一般来说,您必须研究您的应用程序所需的权限。抵制盲目猜测的诱惑。注意:从 Android API 33 开始,共享存储权限的名称发生了变化。
2023-08-29 15:27:50
131
原创 Android-for-Python——Webview-example(Webview示例)
Android-for-Python——Webview-example(Webview示例)
2023-08-29 10:19:06
182
原创 Android-for-Python——shared_storage_example(共享存储示例)
Android-for-Python——shared_storage_example(共享存储示例)
2023-08-29 10:10:21
68
原创 Android-for-Python——Common-Gestures-Example(常见手势示例)
Android-for-Python——Common-Gestures-Example(常见手势示例)
2023-08-29 10:04:34
61
原创 Android-for-Python——Multi-Service-Example(多服务示例)
Android-for-Python——Multi-Service-Example(多服务示例)
2023-08-29 09:59:32
71
原创 Android-for-Python——c4k_tflite_example(c4k_tflite示例)
使用 Tensoflow Lite 对图像流中的对象进行分类,分类后的对象在预览中被装箱并标记。在一些常用平台上可用。此示例基于Tensorflow Lite 对象检测示例。此示例是在COCO 数据集上进行训练的,该数据集包含美国房屋中常见的 1000 个物体。例如椅子、人、杯子等。它表现出误报,墙上的图片被分类为电视。原始的 Google 示例依赖于 numpy 和 opencv。
2023-08-29 09:55:03
61
原创 Android-for-Python——c4k_mlkit_example(c4k-mlkit示例)
Android-for-Python——c4k_mlkit_example(c4k-mlkit示例)
2023-08-29 09:46:32
76
原创 Android-for-Python——c4k_opencv_example(c4k_opencv示例)
Android-for-Python——c4k_opencv_example(c4k_opencv示例)
2023-08-29 09:42:12
83
原创 Android-for-Python——c4k_qr_example(c4k_qr示例)
Android-for-Python——c4k_qr_example(c4a_qr示例)
2023-08-29 09:32:51
76
原创 Android-for-Python-Camera4Kivy Photo Example(c4kivy照片功能)
四个屏幕显示相机方向、宽高比和图像捕获。在移动设备上,旋转设备即可查看不同的布局。在桌面上更改窗口大小,将窗口从横向更改为纵向,以模拟旋转移动设备。可在大多数常用平台上使用。该示例演示了预览窗口小部件布局:方向、纵横比和信箱处理。还可以在相机、图像捕捉和屏幕截图之间切换。仅在 Android 上,它演示了带有音频捕获、捏合/展开缩放以及点击焦点/曝光的视频。
2023-08-28 17:15:36
143
原创 Android-for-Python——record-audio-example(录音-音频-示例)
Android-for-Python——record-audio-example(录音-音频-示例)
2023-08-28 16:54:26
107
原创 Android-for-Python——BroadcastReceiver-examples(广播接收示例)
Android-for-Python——BroadcastReceiver-examples(广播接收示例)
2023-08-28 16:36:17
115
tts文字转语音测试结果
2024-06-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅