语言大模型说话

import os
import time
from vosk import Model, KaldiRecognizer
import pyaudio
import json
import pyautogui
import pygetwindow as gw
from pynput.keyboard import Controller, Key


#检测模型路径,加载模型
model_path = "vosk-model-cn-0.22"
if not os.path.exists(model_path):
    print(f"模型路径不存在:{model_path}")
    exit(1)

#模型加载与语言识别
model = Model(model_path)
recognizer = KaldiRecognizer(model, 16000)

#初始化音流
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=16000,
                input=True,
                frames_per_buffer=8192)

keyword = Controller()  # pynput 键盘控制器



print("开始语言输入,请讲话...")


try:
    while True:
        data = stream.read(4096,exception_on_overflow=False)
        if recognizer.AcceptWaveform(data):
            result = json.loads(recognizer.Result())
            text = result.get('text', '')
            print("识别结果:", text)
            # if text:...
        else:
            partial = json.loads(recognizer.PartialResult())
            partial_text = partial.get('partial', '')
            if partial_text:
                print("部分收别结果:",partial_text)
except KeyboardInterrupt:
    print("停止录音")

#清理资源
stream.stop_stream()
stream.close()
p.terminate()

流程

                                  语言大模型
1.第一步安装库pip install vosk pyaudio pyautogui pygetwindow pynput -i https://pypi.tuna.tsinghua.edu.cn/simple
2.#检测模型路径,加载模型
3.#模型加载与语言识别
4.#初始化音流
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

万能小贤哥

感谢大捞

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值