- 博客(17)
- 资源 (6)
- 收藏
- 关注
原创 pip使用清华源,阿里云,中科大源等镜像源安装python库
国内常用Python镜像源汇总:清华、阿里云、中科大、华为云和腾讯云等镜像地址,可加速pip安装。使用时在pip install命令后添加 -i {镜像地址} 参数即可,如安装torch库示例所示。这些镜像源能有效解决国外源下载慢的问题,建议收藏备用。
2025-12-23 10:31:35
143
转载 在colab中加载任意在线(链接)数据集
本文介绍使用CurlWget浏览器插件直接在Google Colab中加载数据集的方法,避免传统方式需先下载到本地再上传的低效流程。该插件通过捕获浏览器下载链接,生成wget命令,用户只需在Colab单元格粘贴命令即可快速下载数据。具体步骤包括:安装插件、取消实际下载获取链接、复制wget命令到Colab执行。这种方法显著提升了数据加载效率,尤其适用于处理大型公开数据集.
2025-12-10 17:37:34
25
原创 Python爬虫爬取微博话题评论(2025新版)
本文介绍了使用Selenium爬取微博评论的方法。首先需安装chromedriver并配置本地路径,通过扫码登录解决反爬问题,参数可调节加载数量、等待时间和容错机制。代码自动遍历指定话题URL,提取用户名、评论内容、时间和地区信息,最终保存为CSV文件。该方法有效规避微博反爬机制,实现稳定数据采集。
2025-12-10 16:45:25
297
原创 使用SGLang部署Qwen3 Reranker系列模型
在使用SGLang部署Qwen3 Reranker系列模型时,由于模型架构差异会出现API不兼容问题。本文将基于生成式架构的Qwen3ForCausalLM转换为二分类模型Qwen3ForSequenceClassification,通过提取yes,no token的权重向量构建新的分类器,最终使用classify接口实现模型部署。该方法借鉴了VLLM的解决思路,成功实现了SGLang部署Qwen3 Reranker,同时保持了效果和原始输出的一致性。
2025-12-09 16:59:32
339
原创 使用vLLM部署Qwen3 Reranker系列模型
VLLM部署Qwen3 重排模型时会出现不支持Score、rerank API错误,原因是vllm 目前没有办法允许单个架构同时支持嵌入和重排,解决方法是将( Qwen3ForCausalLM)模型转换为序列分类架构(Qwen3ForSequenceClassification),提取yes和no token的权重差异作为分类器向量。通过修改模型架构并替换分类头,可实现与原始模型相同的评分功能,从而兼容VLLM的Score API。转换后的模型能正确计算文本相关性得分,同时保持与原始模型相同的概率输出结果。
2025-12-09 11:59:29
1164
原创 AI环境音频(场景音效)合成技术详解
在AI生成音频领域。主要涉及文本到语音(TTS)、语音克隆、音乐生成、环境音效合成等子任务。近年来,AI场景音频合成技术快速发展,当前主流方法涵盖基于音效库匹配、GAN、Diffusion和大语言模型(如AudioGen)等多种技术路线。最新进展包括Google V2A、Diff-Foley等视频到音频模型,以及索尼开源的MMAudio多模态模型,通过跨模态联合训练实现音画同步。这些技术在虚拟现实、游戏开发等领域具有广泛应用前景,推动着音频生成技术向更自然、更智能的方向发展。
2025-12-03 11:28:16
772
原创 文本转语音(TTS,Text-to-Speech)技术详解
本文概述了语音合成技术的发展历程,从早期拼接式合成和HMM方法,到近年来基于深度学习的模型演进。重点介绍了WaveNet(2016)的因果卷积和膨胀卷积结构、Tacotron(2017)的编码器-解码器架构、FastSpeech(2019)的非自回归并行化设计、VITS(2021)融合VAE/GAN/Flow的混合模型,以及最新的Bark(2023)和SoundStorm(2023)多任务音频生成系统。这些技术在生成质量、速度和多样性方面不断突破,使语音合成从机械拼接发展到具有情感表达的自然语音生成。
2025-12-02 10:21:02
807
原创 深度学习中的音频表示方法(附代码)(波形图、频谱图、梅尔谱图、梅尔倒谱)
本文介绍了四种音频表示方法:波形图(Waveform)直接显示振幅随时间变化;频谱图(Spectrogram)通过STFT转换到时频域;梅尔谱图(Mel Spectrogram)将频率压缩到接近人耳感知的Mel刻度;梅尔倒谱(MFCC)对梅尔谱图进行DCT变换提取共振峰特征。每种方法各有优劣:波形图信息完整但难以建模,频谱图易建模但维度高,梅尔谱图接近人耳感知但会丢失信息,MFCC计算高效但无法还原音频。文中提供了Python代码示例展示如何用librosa库生成这些音频可视化图形。
2025-12-01 17:15:42
450
原创 线性回归,逻辑回归详解 (附python代码)
线性回归是一个或多个自变量与因变量之间的关系模型,它通过找到一条直线来拟合数据。逻辑回归是线性回归的拓展,可以解决分类问题。
2023-12-19 18:35:56
1230
1
原创 近邻算法 KNN 详解(附python代码)
KNN算法即近邻算法(Nearest neighbour algorithm),它通过预测点周围邻居点的信息来对该点进行分析,它在给定数据集中找到与新数据点最接近的K个邻居,并基于这些邻居的属性来预测新数据点的类别或值。
2023-12-18 15:07:12
1529
1
原创 Android实现与PHP后端的交互(数据传输,文件传输)(超详细/附源码)
本篇文章将详细介绍Android与PHP的交互,实际上就是利用http进行通信的过程,通过Get方法和Post方法,实现数据传输,文件传输,博主在真机上进行了实测,并附上了源码的链接。
2023-05-04 13:18:48
2204
2
原创 HBuider X运行不了php,运行显示“浏览器运行尚不支持此种类型文件”
HBuider X运行不了php,运行显示“浏览器运行尚不支持此种类型文件”,HBuilder X不支持php运行
2022-12-07 19:43:21
5257
6
原创 Android实现直播功能(全过程,超详细/附源码)
Android直播作为一个很普遍的功能,在各大APP中都有嵌入,本篇文章将介绍如何实现直播功能,以及博主的一些心得,对于具体的涉及视频编解码的问题,我们不用自己去做,作为应用的开发者,我们只需要调用相应的框架即可实现直播功能。。
2022-04-02 22:05:04
7917
原创 阿里云服务器宝塔面板的安装
最近申请了一个阿里云服务器,想学习一下云服务器网站的搭建,用宝塔面板的话能很方便的安装各种应用,部署自己的网站。如果在购买服务器的时候已经勾上了宝塔面板的选项,那就可以直接使用,如果没有,就需要更改一下配置打开阿里云服务器的控制台点击实例(如果实例正在运行,要停止运行)点击三个圆点选项点击更换操作系统点击镜像市场,从镜像市场获取更多选择搜索宝塔,选择相应的宝塔面板,点击使用确认订单完成宝塔面板的安装,使用的时候可以先通过xshell,输入bt,输入14,把外网面板地址复制到浏览
2022-03-31 18:30:06
479
原创 android Socket文件传输(readFully)
最近写的项目里要用到文件传输的功能,因此我查找了很多相关的博文,查找到的文章都大同小异。但是这些内容仅限于一些小文件,比如一个几百K到的txt文档,但是我们实际需要传输的数据量远大于这个数,解决不了实际问题。因此这篇博文将用readfully方法实现较大文件的传输,当然这个也有一定的局限性,只适用一些较大的文件,大约在100M以内,对于更大的文件,涉及断点续传的问题,本篇文章没有展现。
2021-09-02 17:36:34
1791
2
原创 java.lang.NullPointerException: Attempt to invoke virtual method.....
java.lang.NullPointerException: Attempt to invoke virtual method...这是很多人常出现的异常报错,这篇文章将详细讲解各种情况以及如何找出出错的位置方便我们快速解决
2021-08-22 23:42:28
53769
8
原创 用c语言实现一个简单的输入法联想功能
用c语言实现一个简单的输入法联想功能手机输入法的联想功能十分常见,通过c语言同样可以实现一个简单的输入法联想功能。首先读取一个文字量比较大的文件,通过线性表对汉字间的关系进行加权存储,再记录到总体的单链表里,并进行排序处理,在输入时将权值大的四个选项作为备选汉字,方便输入,并在最后可以导出输入的内容。我在这里设置了两个版本,版本0是精简推荐,考虑到成语为四字自成一体,版本1增加成语推荐,成语进行联想推荐,方便在输入时的多元化。我在这里读取一个名为"b.txt"的文本文件,用来计算权值,内容可自行添加
2020-12-10 15:51:02
4998
6
《哪吒2/哪吒之魔童闹海》影评数据集(含豆瓣,微博,猫眼)
2025-05-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅