自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 LLM RAG|攻克切片难题

今日AI资讯今天主要针对Langchain的文档切分中4个难点进行展开。

2024-03-26 22:18:20 2143

原创 本地部署|马斯克旗下xAI开源的Grok-1

今日AI资讯今天主要了解一下Grok-1模型规格、本地部署需要有哪些储备、本地部署的步骤以及部署过程中FAQ。

2024-03-26 22:13:11 3328 1

原创 TTS文本合成语音|Sambert微调

语音合成(Text-to-Speech, TTS)是指将输入文字合成为对应语音信号的功能,即赋予计算机“说”的能力,是人机交互中重要的一环。现代语音合成在2016年随着WaveNet的出现步入了深度学习合成时代,此时语音合成的效果已经表现出了比拟真人的水准。一个语音合成系统通常由两部分组成,分别是语言分析部分和声学系统部分,也被称为前端部分和后端部分。语言分析:根据输入的文字信息进行分析,生成对应的语言学特征(梅尔频谱),想好该怎么读;声学系统:根据语音分析部分提供的语音学特征,生成对应的音频,实现。

2024-03-26 22:09:12 1208

原创 开源大模型训练及推理所需显卡成本必读:也看大模型参数与显卡大小的大致映射策略

随着各厂商相继发布大型模型,排行榜变化频繁,新旧交替,呈现出一片繁荣景象。有些技术爱好者也开始心痒难耐,萌生了构建一个庞大模型并进行训练的想法。每天都能看到各个厂家推出内测版本,这让人不禁思考:为何不在本地环境尝试一番呢?然而,当前手头仅有一块性能有限的老破小GPU显卡,这就引发了一个问题:如何在这样的条件下成功运行模型?

2023-09-01 18:23:06 20122 5

原创 FFmpeg处理音频视频

FFmpeg是一个开源的跨平台音视频处理工具和多媒体框架。它可以用于处理音频、视频、字幕等多媒体数据,支持多种音视频格式的转码、编辑、解码、编码和流媒体传输等操作。FFmpeg是由Fabrice Bellard在2000年创建的,并由全球社区持续维护和改进。视频转码:将视频从一种格式转换为另一种格式,例如将MP4转换为MKV或WebM。音频转码:将音频从一种格式转换为另一种格式,例如将WAV转换为MP3或AAC。视频剪辑和合并:对视频进行剪辑、裁剪和合并,实现视频编辑功能。

2023-08-21 21:26:01 735 1

原创 GrammarGPT:基于监督微调的中文语法纠错开源LLMs探索

语法错误纠正(grammar Error Correction, GEC)旨在不改变句子的意思,自动纠正不符合语法的句子。在此之前研究汉语语法纠错(CGEC)主要是来自国外汉语学习者的错误,很明显这是不对的。因此,本次研究转向了母语人士的语法错误,这更加微妙和具有挑战性。以往对GEC的研究主要采用Seq2edit和Seq2seq两种方法,并在各种GEC上取得了令人印象深刻的性能基准。随着LLMs的出现,有人对闭源LLMs(如ChatGPT)的性能进行了评估,并透露了其出色的错误检测和纠正能力。

2023-08-21 21:21:19 994 1

原创 Ubuntu20.04安装nvidia显卡驱动/CUDA/CUDNN

一、NVIDIA显卡驱动安装方式有哪些?二、安装NVIDIA三、安装CUDA四、安装CUDNN

2023-08-15 17:08:20 16182 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除