【Python ASR 】模型对比 whisper 和 funasr

模型

语音识别,带时间戳输出,非实时

多种语音理解能力,涵盖了自动语音识别(ASR)、语言识别(LID)、情感识别(SER)以及音频事件检测(AED)。

Whisper是OpenAI于2022年12月发布的语音处理系统

whisper-large-v3进行了微调,提高中文识别能力,以及进行了Lora微调,得到标点能力提升的Belle-whisper-large-v3-zh-punct

差异比较大的几段结果

视频URL讯飞paraformer-zh与讯飞相似度SenseVoiceSmall与讯飞相似度Belle-whisper-large-v3-zh-punct与讯飞相似度whisper-large-v3-turbo与讯飞相似度
URL英国的申请本身讨厌就讨厌在这里,啊虽然说我们拿offer看上去没有那么难,但是呢他还是会在最后一个环节上卡我们英国硕士申请的,首先呢我们要看一下我们自己的学校是否在他的认可名单里面,比如说UC啊他们认可的中国大学的名单,第二步呢就是要看一下自己的均分和自己未来想申请的这个专业或者是专业所在的学院的均分是否达到要求,如果说他给的是一个83~85这样的一个区间的话,我们够了83可以申,但但是等到申完了之后,我们会有一个最终的均分成绩,如果说掉的特别厉害的话,这样的话其实是非常危险的,因为我们那个时候时间太晚了,没有一些可以挣扎的余地了。英国的申请本身讨厌就讨厌在这里啊,虽然说我们拿offer看上去没有那么难,但是呢他还是会在最后一个环节上卡,我们英国硕士申请的。首先呢我们要看一下我们自己的学校是否在他的认可名单里面,比如说UCL他们认可的中国大学的名单。第二步呢就是要看一下自己的均分和自己未来想申请的这个专业或者是专业所在的学院的均分是否达到要求。如果说他给的是一个八十三到八十五这样的一个区间的话,我们够了八十三可以申。但是等到申完了之后,我们会有一个最终的均分成绩。如果说掉的特别厉害的话,这样的话其实是非常危险的。因为我们那个时候时间太晚了,没有一些可以挣扎的余地了。92.28英国的申请本身讨厌就讨厌在这里啊,虽然说我们拿offer看上去没有那么难,但是呢它还是会在最后一个环节上卡我们英国硕士申请的。首先呢我们要看一下我们自己的学校是否在他的认可名单里面,比如说UCL他们认可的中国大学的名单。第二步呢就是要看一下自己的均分和自己未来想申请的这个专业或者是专业所在的学院的均分是否达到要求。如果说他给的是1个83到85这样的一个区间的话,我们够了83可以申,但是等到申完了之后,我们会有一个最终的均分成绩。如果说掉的特别厉害的话,这样的话其实是非常危险的。因为我们那个时候时间太晚了,没有一些可以挣扎的余地了。95.54英国的申请本身讨厌就讨厌在这里。虽然说我们拿offer看上去没有那么难,但是呢,它还是会在最后一个环节上卡我们。英国硕士申请的首先呢,我们要看一下我们自己的学校是否在它的认可名单里面,比如说UCL他们认可的中国大学的名单。第二步呢就是要看一下自己的均分和自己未来想申请的这个专业或者是专业所在的学院的均分是否达到要求,如果说它给的是一个八十三到八十五。这样的一个区间的话,我们够了八十三,可以升。但是等到升完了之后,我们会有一个最终的均分成绩。如果说掉得特别厉害的话,这样的话,其实是非常危险的,因为我们那个时候时间太晚了,没有一些可以挣扎的余地了。89.09英国的申请本身讨厌就讨厌在这里虽然说我们拿offer看上去没有那么难但是呢他还是会在最后一个环节上卡我们, 英国硕士申请的首先呢我们要看一下一下我们自己的学校是否在他的认可名单里面比如说UCL他们认可的中国大学的名单第二步呢就是要看一下自己的军分和自己未来想申请的这个专业或者是专业所在的学院, 那么军分是否达到要求如果说他给的是一个83到85这样的一个区间的话我们够了83可以升但是等到升完了之后我们会有一个最终的军分成绩如果说掉的特别厉害的话这样的话其实是非常危险的因为我们那个时候时间太晚了没有一些可以挣扎的余地了88.48
URL北京上海现在AP考试全部都被取消了,广州深圳是可以正常考的,这个对于不能考的小孩来讲,就是一种天大的不公平。对于美国大学来看,同样的条件下你有考试并且有高分,那我肯定希望优先录你,啊你现在连考试机会都没有了,就相当于到手的offer飞了。昨天还是前天晚上的时候,北京四中高二年级的一个家长发了一条微博,代表高二年级的全体家长,恳请学校给孩子们一次考AP的机会,很快之后又被删掉了。就像北京上海还是属于流水高地,这帮孩子没有AP的加成的话,他们在录取上到底是一个什么样的结果,我们希望不要太糟糕。北京、上海现在AP考试全部都被取消了。广州深圳是可以正常考的。这个对于不能考的小孩来讲,就是一种天大的不公平。对于美国大学来看,同样的条件下,你有考试,并且有高分。那我肯定希望优先录你啊,你现在连考试机会都没有了,就相当于到手的offer费用。昨天还是前天晚上的时候,北京四中高二年级的一个家长发了一条微博,代表高二年级的全体家长,恳请学校给孩子们一次考AP的机会,很快之后又被删掉了。就像北京、上海还是属于留学高地,这帮孩子没有AP的家成的话,他们在录取上到底是一个什么样的结果?我们希望不要太糟糕。94.02🎼北京、上海现在AP考试全部都被取消了,广州深圳是可以正常考的这个对于不能考的小孩来讲,就是一种天大的不公平。对于美国大学来看,同样的条件下,你有考试并且有高分,那我肯定希望优先录你啊。你现在连考试机会都没有了,就相当于到手的offer费。昨天还是前天晚上的时候,北京四中高二年级的一个家长发了一条微博,代表高二年级的全体家长恳请学校给孩子们一次考AP的机会,很快之后又被删掉了。像北京上海还是属于留高。这帮孩子没有AP的加成的话,他们在录取上到底是一个什么样的结果,我们希望不要太糟糕。😊93.93北京上海现在AP考试全部都被取消了。广州深圳是可以正常考的。这个对于不能考的小孩来讲就是一种天大的不公平。对于美国大学来看,同样的条件下,你有考试并且有高分,那我肯定希望优先录你啊,你现在连考试机会都没有了,就相当于到手的offer飞了。昨天还是前天晚上的时候,北京四中高二年级的一个家长发了一条微博,代表高二年级的全体家长,恳请学校给孩子们一次考AP的机会,很快之后又被删掉了。就像北京上海还是属于留学高地。这帮孩子没有AP的加成的话,他们在录取上到底是一个什么样的结果?我们希望不要太糟糕。95.95北sovysheungkongshenpushihaiqiaobeijuqiao, Guangzo Shenzhen shikei zhengchang kao de, 这个对于不能考的小孩来讲就是一种天大的不公平, 对于美国大学来看, 同样的条件下你有考试并且有高分, 那我肯定希望优先录你呀, 你现在连考试机会都没有了, 就相当于到手的offer飞了, 昨天还是前天晚上的时候, 北京四中高二年级的一个家长发了一条微博, 代表高二年级的全体家长, 恳请学校给孩子们一次考AP的机会, 很快之后又被删掉了, 就像北京上海还是属于流水高地, 这帮孩子没有AP的加成的话, 他们在录取上到底是一个什么样的结果, 我们希望不要太糟糕63.17
URLAP被取消的消息一出,对于很多申请生影响是特别巨大的,那你没有机会考试,你这个offer可能会废掉,那这种情况下部队的思路有哪些呢?如果是十二年级你已经拿到了英国的condition的offer,抓紧给学校去写邮件,陈述一下目前的客观条件,并不是我们不想去满足,是因为我们没有机会去满足,那对于十一年级的学生来讲,呢现在非常重要的是托福sat赶紧去刷分,还有就是要在文书这样的一些可以展现你个人优势的项目上面多打磨一下,提高你的软实力软背景。Ap被取消的消息溢出,对于很多申请生影响是特别巨大的那你没有机会考试,你这个offer可能会废掉。那这种情况下,工队的思路有哪些呢?如果是十二年级,你已经拿到了英国的conditional offer,抓紧给学校去写邮件。陈述一下,目前的客观条件并不是我们不想去满足,是因为我们没有机会去满足。那对于十一年级的学生来讲呢,现在非常重要的是托福IAT赶紧去刷分。我还有就是要在文书这样的一些可以展现你个人优势的项目上面多打磨一下,提高你的软实力软背景。90.22AP被取消的消息一出,对于很多申请生影响是特别巨大的那你没有机会考试,你这个offer可能会飞掉题。那这种情况下啊,队的思路有哪些呢?如果是1二年级,你已经拿到了英国的conditionaloffer,抓紧给学校去写邮件,陈述一下目前的客观条件,并不是我们不想去满足,是因为我们没有机会去满足。那对于11年级的学生来讲呢,现在非常重要的是托福IATT赶紧去刷分。我还有就是要在文书。这样的一些可以展现你个人优势的项目上面,多打磨一下,提高你的软实力软背景。89.91被取消的消息一出,对于很多申请生,影响是特别巨大的。那你没有机会考试,这个offer可能会飞掉。那这种情况下,对的思路有哪些呢?如果是十二年级,你已经拿到了英国的肯定性的offer,抓紧给学校去写邮件,陈述一下目前的客观条件,并不是我们不想去满足,是因为我们没有机会去满足。那对于十一年级的学生来讲呢,现在非常重要的是托福ICT赶紧去刷分,还有就是要在文书这样的一些可以展现你个人优势的项目上面�,多打磨一下,提高你的软实力。准备酒。85.97ostic2, 乾杯酒1.36
URL是有哪些学校的GPA特别难搞,啊行,我跟大家盘一盘吧也刚好避个坑。那第一个所以说必优吧它处于波士顿的核心地带,常年都会在这个 Final最难的几所美国的大学的排行榜上榜上有名,还有呢就是像这个 MIT申请的时候难度也就特别高,考试难度拿GP的难度也非常高。还有呢就是像林斯顿,虽然说很多藤校会有GPA Information,但是呢普林斯顿在这一点上卡得很严,给我们的GPA一点活路都不留。还有呢就是像普渡大学工科相关的专业学起来难度也比较大,还有就是哈维姆德它其实是一个科学和工程专业的强校,录取难度也很高,读下来拿高GPA的难度也很。老是哪些学校的GPA特别难拿行,我跟大家盘一盘吧,也刚好避一个坑。那第一个说一说BU吧,它处于波士顿的核心地带,常年都会在这个final最难的几所美国大学的排行榜上榜上有名。还有呢就是像这个MIT申请的时候,难度也就特别高。考试难度拿GP的难度也非常高。还有呢就是像普林斯顿,虽然说很多藤校会有GPA inflation,但是呢普林斯顿在这一点上卡的很严,给我们的GPA一点活路都不留。还有呢就是像普渡大学工科相关的专业学起来难度也比较大。还有就是哈维姆德,它其实是一个科学和工程专业的强校,录取难度也很高,读下来拿高GP的难度也很高。88.85有哪些学校的GPAA特别难拿。行,我跟大家盘一盘吧,也刚好避个坑。那第一个所以说BU吧,它处于波士顿的核心地带,常年都会在这个final最难的几所美国大学的排行榜上榜上有名。还有呢就是像这个MIT申请的时候难度也就特别高,考试难度拿GPAA的难度也非常高。还有呢就是像林斯顿,虽然说很多藤校会有GPAA inflation,但是呢普林斯顿在这一点上卡的很严,给我们的GPAA1点活路都不留。还有呢就是像普渡大学工科相关的专业学起来难度也比较大。还有就是哈雷姆德,它其实是一个科学和工程专业的强校,录取难度也很高,读下来拿高GPAA的难度也很高。89.34是有哪些学校的GPA特别难吗?我跟大家盘一盘,也刚好避个坑。那第一个就是说,BU吧,它处于波士顿的核心地带,常年都会在这个Final最难的几所美国大学的排行榜上,榜上有名。还有呢就是像这个MIT,申请的时候难度也就特别高,考试难度,拿GPA的难度也非常高。还有呢就是像普林斯顿,虽然说很多藤校会有GPAinflation,但是呢普林斯顿在这一点上卡得很严,给我们的GPA一点活路都不留。还有呢就是像普度大学。工科相关的专业学起来难度也比较大。还有就是哈维姆德,它其实是一个科学和工程专业的强校,录取难度也很高读下来,拿高GP的难度也很高。87.36-, -, -, -, -, -, -, -, -, -, -, -, -, E.1.12
URLNow I have all new aspects,今天辛苦了,嗯好勒,那我们回见那它是黄的吗?我觉得他给人感受太拖沓了,这个面试坦白来讲我觉得听了是非常累的,他给了我很多关于他工作内容的描述,但是每一个都非常的不具体,你在不断挖细节的时候你到底在挖什么?我希望他跟我分享一下案例,因为案例它代表一种结果,而申请追求的是一种结果,他明显会觉得啊我每本特别熟,但是他其实每本的案例做的是非常有限的,我们希望跟他聊的其实就是你能不能帮我带好学生,他好像并不能给我这样的嗯对于他工作能力的判定的信心,你在挑选这个同事的时候,你倾向于选择什么样的人,说话条理且具体,做事也是一样,还有就是有结果的。嗯Now i have a new vesitle le is like a bribritish.今天辛苦了。嗯,好嘞,那我们回见那是黄了吗?我觉得他给人感受太拖沓了这个面试。坦白来讲,我觉得听的是非常累的,给了我很多关于他工作内容的描述,但是每一个都非常的不具体。你在不断挖细节的时候,你到底在挖什么?我希望他跟我分享一下案例,因为案例他代表一种结果,而申请追求的是一种结果。他明显会觉得啊我每本特别熟,但是他其实每本案例做的是非常有限的。我们希望跟他聊的,其实就是嗯你能不能帮我带好学生,他好像并不能给我这样的。嗯,对于他工作能力的判定的信心,你在挑选这个同事的时候,你倾向于选择什么样的人说话条理,且具体做事也是一样。还有就是有结果嗯。82.24nNow I have a new whos like a今天辛苦了。嗯,好嘞,我们回家他是黄了吗?我觉得他给人感受太拖沓了。这个面试坦白来讲,我觉得听的是非常累的,给了我很多关于他工作内容的描述,但是每一个都非常的不具体,你在不断挖细节的时候,你到底在挖什么,我希望他跟我分享一下案例,因为案例他代表一种结果,而申请追求的是一种结果,他明显会觉得我每本特别熟,但是他其实每本案例做的是非常有限的。我们希望跟他聊的其实就是嗯你能不能帮我带好学生,他好像并不能给我这样的,嗯,对于他工作能力的判定的信心。你在挑选这个同事的时候,你现在选的什么样的人,说话调理且具体,做事也是一样。还有就是有结果。嗯。😊85.33今天辛苦了,好嘞,那我们回家。那是黄了吗?我觉得他给人感受太拖沓了。这个面试,坦白来讲,我觉得听了是非常累的,给了我很多关于他工作内容的描述,但是每一个都非常的不具体。你在不断挖细节的时候,你到底在挖什么?我希望他跟我分享一下案例,因为案例它代表一种结果,而申请追求的是一种结果,他明显会觉得我没本特别熟,但是他其实没本案例做的是非常有限的。我们希望跟他聊的。其实就是你能不能帮我带好学生,他好像并不能给我这样的对于他工作能力的判定的信心。你在挑选这个同事的时候,你心想选择什么样的人?说话,调理且具体,做事也是一样,还有就是有结果的。81.82transplanted you biblesubiter this like a p sobriety, 成功啦, 好嘞, 现在往回些, 这个面是坦白来讲,我都听得 cease忍醒, 给多关于她工作内容的描述, 但其地目前都非常地不具体, 你在括多挖细节 집, tanwij� Bitcoin, i, 其实就是你能不能帮我带好学生, 他好像并不能给我这样的, 对他工作能力的判定的信心, 你在挑选这个同事的时候, 你心想选择什么样的人, 说话条理且具体, 做事也是一样, 还有就是有结果的33
URL北京贵的国际学校从这个幼儿园就开始上上到高中毕业到底要花多少钱,挺震惊的,德威鼎石整体上下来有370多万,顺义京西358,悦城326,还还有像这个清华附稻香湖全上下来的话也得接近290万,而且这只算学费别的都不算,有一所学校我觉得挺不值得我学生的出口,其实并不像投入的资金一样让人觉得亮眼,无论是哪这样会被人骂。北京贵的国际学校,从这个幼儿园就开始上上到高中毕业,到底要花多少钱?挺震惊的。德威秉石整体上下来有三百七十多万。顺义。京西三百五十八月城三百二十六,还有像这个清华附稻香湖全上下来的话,也得接近两百九十万,而且这只算学费别的都不算。有一所学校,我觉得挺不值的。学生的出口其实并不像投入的资金一样,让人觉得亮眼是哪?这样会被人骂骂。76.22北京贵的国际学校从这个幼儿园就开始上,上到高中毕业,到底要花多少钱,挺震惊的。德威顶实整体上下来有370多万,顺意精昔358,跃城326。还有像这个清华富稻香湖全上下来的话也得接近290万,而且这只算学费,别的都不算有一所学校我觉得挺不值的。学生的出口其实并不像投入的资金一样,让人觉得亮眼。这样会被人骂。85.26北京贵的国际学校,从这个幼儿园就开始上,上到高中毕业,到底要花多少钱,挺震惊的。德威顶时整体上下来有三百七十多万,顺义京西三百五十八,粤城三百二十六,还有像这个清华富道香湖全上下来的话,也得接近两百九十万,而且这只算学费,别的都不算。有一所学校我觉得挺不值的,学生的出口其实并不像投入的资金一样,让人觉得亮眼,那是哪意思?这样会被人骂吧。75.74北-Korea, 从 yu-er-yuan-to ka-shang, Shang-dao-gao-zhong-bi, Dao-di-yao-hua-dua-qian, Pin-zhen-jing-de, De-wei, Ding-shi, Zheng-ti-shang-xia-la-yau-370-dua-wan, Shun-yi-jing-xi, 358, Yue-cheng-326, Hai-you-xiang-zhi-gao-fu-dao-xiang-hu, Qián-shang-xia-lai-de-hua, Ye-de-dai-dian-jin-liang-bai-jiu-shi-wan, And this is only for tuition, The rest are not, I think one school is not worth it, 学生2.81

因为之前是使用讯飞的,所以这里的相似度均与讯飞对比,只是做个参考。

我认为Paraformer-zh质量比较高,支持长音频,有标点符号、以及对中文支持好。比较符合我需要的训练数据。
其次为SenseVoiceSmall,比Paraformer-zh多了一些情感,增加了一些额外的表情符号和情感的文字。更适合面向客户端。
最后openaiBelle-whisper-large-v3-zh-punctwhisper-large-v3-turbo质量比较不稳定,每次生成的结果都不同,并且和chatgpt一样,容易一本正经的乱说…
Paraformer-zh每次生成的结果都是一致的,稳定性很好。

最后

还是国内的模型更适合中国宝宝,Paraformer-zh体验很好。
在本地跑模型也遇到了不少坑,查阅了不少资料,后续会出文章记录。
使用funasr实现本地离线音频转文本。

相关网站

<think>好的,我现在需要处理用户关于`fun_asr.py`文件的查询。用户提到的是Open-LLM-VTuber-main项目中的这个文件。首先,我要确认这个文件的具体内容用途。 由于我无法直接访问外部代码库或文件系统,我需要基于常见的项目结构ASR(自动语音识别)模块的典型功能来推断。一般来说,ASR相关的Python文件可能包含语音转文本的功能,比如使用预训练的模型来处理音频输入,转换为文字输出。常见的库可能包括FunASRWhisper或DeepSpeech等。 接下来,我应该考虑`fun_asr.py`可能的组成部分。通常,这样的文件会初始化ASR模型,配置音频输入源(如麦克风或文件),实时或批量处理音频流,并将结果传递给其他模块,比如自然语言处理或虚拟主播的响应生成。还可能包含错误处理、日志记录以及参数配置的部分。 用户可能需要了解这个文件在项目中的作用,比如它是如何集成到整个VTuber系统中的,或者具体的API调用方式。此外,可能的依赖项配置参数也是用户关心的点。例如,是否支持不同的模型大小,如何处理不同语言的音频输入,或者性能优化措施如多线程处理。 在回答时,我需要保持结构清晰,分点说明内容用途,并建议用户查阅项目文档或源码以获取详细信息。同时,生成的相关问题应围绕ASR模块的扩展,如模型选择、实时处理优化、错误处理策略以及与其他模块的集成等。 需要确保使用正确的中文表述,避免技术术语使用不当。同时,按照用户的要求,所有行内数学表达式用`$...$`格式,独立公式用`$$...$$`,但在这个问题中可能涉及较少数学内容,但如果有模型相关的公式,比如声学模型的概率计算,需要正确应用格式。不过当前问题更多是关于代码文件的功能,可能不需要数学公式,但需保持警惕。 最后,检查是否符合系统级指令,特别是引用标识的添加,但根据用户提供的参考,似乎没有需要引用的来源,因此可能不需要添加。但需注意用户提供的参考站内引用部分是否有相关内容,但在此案例中用户只是询问文件内容,暂时没有引用来源,所以可能无需添加脚注。 总结回答结构:先说明文件可能的用途,如ASR功能实现,再分点描述内容,如模型初始化、音频处理流程、结果传递等,最后给出相关问题建议。</think>### 关于 Open-LLM-VTuber-main 项目中 `fun_asr.py` 文件的内容与用途 根据命名常见项目结构推断,`fun_asr.py` 可能是 **自动语音识别(ASR)** 模块的核心实现文件,用于将用户的语音输入实时转换为文本,支持后续的自然语言处理(如LLM生成回复)。以下是其可能的内容与用途分析: #### 1. **核心功能** - **语音转文本**:调用预训练的ASR模型(例如阿里云开源的 `FunASR`[^1] 或 `Whisper`),对输入的音频流进行实时或离线识别。 - **音频处理**:可能包含音频预处理逻辑(如降噪、分帧、傅里叶变换)特征提取(如MFCC)。 - **模型加载与配置**:初始化ASR模型,设置采样率、语言类型、模型路径等参数。 #### 2. **代码结构推测** ```python # 示例代码(仅供参考) from funasr import AutoModel class ASRProcessor: def __init__(self, model_path="funasr-large"): self.model = AutoModel(model=model_path) def process_audio(self, audio_stream): """接收音频流,返回识别文本""" text_result = self.model.generate(audio_stream) return text_result ``` #### 3. **项目中的角色** - **输入接口**:接收来自麦克风或音频文件的原始数据。 - **输出接口**:将文本传递给LLM(如ChatGPT)生成虚拟主播的回应。 - **性能优化**:可能涉及多线程、流式处理以降低延迟。 #### 4. **依赖项** - 可能依赖 `funasr` 库、`PyAudio`(音频采集)、`numpy`(信号处理)等。 #### 5. **典型配置参数** - 模型类型(`small`/`medium`/`large`) - 是否启用标点恢复 - 音频采样率(如16kHz) ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_pengliang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值