声纳咸鱼の声学实验室-CSDN博客

原创各种聚类算法（原理+代码+对比分析）最全总结

序言还是要持续总结，持续积累。一、聚类的目标使同一类对象的相似度尽可能地大；不同类对象之间的相似度尽可能地小。二、聚类算法分类1.基于划分给定一个有N个元组或者纪录的数据集，分裂法将构造K个分组，每一个分组就代表一个聚类，K<N。特点：计算量大。很适合发现中小规模的数据库中小规模的数据库中的球状簇。算法：K-MEANS算法、K-MEDOIDS算法、CLARANS算法2....

2020-01-07 13:29:13 145964 38

原创基于bert的中文实体关系识别（实体关系抽取）项目开源

在清华大学开源的OpenNRE项目基础上实现中文实体关系识别github项目地址，点我文章目录一、中文关系抽取训练结果测试结果二、使用前准备三、注意事项一、中文关系抽取使用哈工大，BERT-wwm，中文bert，在20w中文人物关系数据上的准确率达到0.97训练结果=== Epoch 0 train ===100%|███████████████████████████████...

2019-12-11 17:23:33 13842 6

原创 Python 中文文本分析实战：jieba分词+自定义词典补充+停用词词库补充+词频统计

最近项目需要，实现文本的词频分析，折腾了几天才完成任务，有点成就感，最后整理总结一下这部分的内容，希望更多同僚受益。使用方法环境：Python3.6安装结巴：pip install jiaba下载停用词词典哈工大停用词词典构建补充词典userdict，后文详解运行文章最后面的完整代码先来认识jieba参考简介“结巴”中文分词：做最好的Python中...

2018-04-28 13:47:31 36391 18

原创 TensorFlow 技术框架解析 | 图文理解深度学习技术实现

最近项目需要，客户想上tensorflow，想把项目做的高大上一点，向我咨询tensorflow的相关问题和部署方案，我要假装自己很懂TF，之前一直在跟进tensorflow的技术进展，最近又做了很多功课，整理出以下内容，用这个ppt给客户讲解并加上TF的demo和tensorboard的可视化演示，客户十分满意，说这就是他们想看到的。先来认识一下TF的价值：TensorFlow...

2018-02-08 11:34:03 15457 1

原创手把手教你制作中英文词云 | python demo

以前做词云的时候网上看的python做词云的坑都很多，耗了很多时间才高清楚wordcloud制作词云的精髓和脉络，整理如下。1.词云生成wordcloud包的基本用法class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_hori...

2018-02-08 11:13:07 11207 3

原创从0开始搭建MySQL服务｜创建库、创建表、数据写入、查数据

MySQL服务搭建不算新知识，我今年开启新项目的时候需要数据存储记了这个笔记，记录了一下使用的全流程操作。

2025-01-09 14:39:35 392

原创生成式AI ｜ 2024年开源TTS方案精选

今年过完年之后的一年里TTS大火了一把，发展速度也是惊人地快。5月份调研整理了一下，表格中是我从各位维度综合评价筛选出来的三个可以直接部署商用的项目，合成效果都很不错，推理稳定。下面列出的几个项目也参与了我的调研，但是在功能、效果、代码完整度、代码专业度等各方面略胜一筹。

2024-12-12 19:47:26 1159

近两年来，大型AI模型的出现在很多领域替代了大量的人力。例如，视觉大模型已经能够完成大部分UI设计工作，而像ChatGPT这样的模型也在替代大量的前端开发工作。现在，甚至有很多to B服务也开始被AI agent所取代。这种趋势无疑给互联网行业的从业者带来了一定的压力，使我们不得不重新思考自己的价值定位。昨天下午领导找我谈话的时候我提到了我能在很短的时间里解决很多大模型问题的秘诀在于我活跃于各种社群，今天上班的路上脑子里突然冒出一点对社群的随想，记录一下。

2024-05-11 12:25:21 603 1

原创语音合成（TTS）& 声音生成（TTA）最新技术 - 2024- 附论文地址和代码地址

为了解决这个问题，我们提出了一种新颖的模型，通过纳入包括内容（时间戳）和风格（音高轮廓和能量轮廓）在内的附加条件作为文本的补充，增强现有预训练文本到音频模型的可控性。为了保持生成的多样性，我们采用了可训练的控制条件编码器，该编码器通过大型语言模型和可训练的 Fusion-Net 进行了增强，以编码和融合附加条件，同时保持预训练的文本到音频模型的权重冻结。在 AudioLDM 模型的基础上增加三种 Condition （时间、声调、能量）控制，引入了新的训练数据和评价指标，通过实验验证了方法的有效性。

2024-03-10 21:57:20 2179 1

原创【语音识别】- 几个主流模型 - 2024 - 附论文地址和源码地址

损失函数：同时使用CTC和AED的输出，可以提高识别率，但是由于AED本身是非流式的解码，在Wenet中，则没采用联合解码的方式，而是采用了先使用CTC解码，再用AED对CTC的Nbest结果进行Rescoring，这样即结合了两种模型的效果，又可以应用于流式场景。流式计算：标准的Fully self-attention会对依赖整个序列，不能进行流式计算，因此wenet采用了基于chunk的attention，将序列划分为多个固定大小的chunk，每个chunk内部的帧不会依赖于chunk右侧的帧。

2024-03-02 19:07:15 1939

原创【语音识别】- CTC损失计算的原理

文章目录1.符号定义与目标函数2.前向计算 αs(t)\alpha_s(t)αs(t)1) 问题分析2) 动态规划解题3.后向计算 βs(t)\beta_s(t)βs(t)4.正向传播5.反向传播CTC全称：Connectionist temporal classification，主要用于处理序列标注问题中的输入与输出标签的对齐问题。文章来源：点我1.符号定义与目标函数AAA: 序列标注任务中的标签所在字母表集合为 AAAA′A'A′: 扩展的字母表集合。CTC的softmax 输

2024-02-28 15:57:35 413

原创 GPT 的基础 - T（Transformer）

我们看到Transformer模型是GPT的基础，这篇博客梳理了一下Transformer的知识点。GPT也是在BERT的基础上发展起来的，只是OpenAI和google、百度走了不同的路线。

2024-02-27 22:34:26 835

原创 FrugalGPT：来看看穷人怎么用省钱的方式使用ChatGPT

论文题目：《FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance》论文下载：https://arxiv.org/abs/2305.05176Hung-yi Lee 课件整理。

2024-02-27 19:10:41 1080

原创【生成式AI】ChatGPT 原理解析（3/3）- ChatGPT来带的研究问题

Hung-yi Lee 课件整理。

2024-02-26 22:45:56 448

原创【生成式AI】ChatGPT 原理解析（2/3）- 预训练 Pre-train

预训练得到的模型我们叫自监督学习模型（Self-supervised Learning），也叫基石模型（foundation modle）。机器是怎么学习的ChatGPT里面的监督学习GPT-2GPT-3和GPT-3.5GPTChatGPT支持多语言ChatGPT里面的自监督学习

2024-02-26 21:32:51 2315

原创【生成式AI】ChatGPT原理解析（1/3）- 对ChatGPT的常见误解

Hung-yi Lee 课件整理。ChatGPT的几个误解解释。

2024-02-26 19:09:51 932

原创生成式 AI - Diffusion 模型的数学原理（5）

这个问题之前就有人提出来了，这篇文章发现如果取概率最大的句子和词汇，那么输出的结果会是不断重复的句子，机器就会不断地跳帧，讲重复的话，虽然做sampling机器会说一些奇怪的话，和跳帧比起来sample的结果更好，为什么呢？我们来看看人写的句子吧，橙色的线代表的是人写的句子，右边是人写的一篇文章，用我们的语言模型来计算人写的每一个单词的概率，发现人写出来的文章用字遣词并不是选概率最大的词汇。李教授找助教做实验验证了，如果像论文里一样加噪声会生成小女孩头像这样正常的图片，把噪声去掉就只会产生一张黄色的图片。

2024-02-25 23:29:03 1091

原创 leetcode初级算法（python）- 字符串

1.反转字符串常规算法pythonic 算法2.整数反转数学法字符串法3.字符串中的第一个唯一字符pythonic算法哈希算法4.有效的字母异位词常规算法进阶算法5.最长公共前缀

2024-02-25 15:36:48 255

原创 leetcode初级算法（python）- 数组

1.从排序数组中删除重复项2.买卖股票最佳时机23.旋转数组运行颠倒列表法整体移动元素块法4.存在重复运行包含判断法排序比较判断法运行集合判断法5.只出现一次的数字6.两个数组的交集27.移动零8.两数之和9.旋转图像

2024-02-25 01:04:30 272

原创 leetcode经典题库（简单）

在leetcode上刷了几个和数组相关的简单题，记录在这里。1.两数之和2.反转链表3.合并两个有序列表4.合并两个有序链表5.删除有序数组中的重复项6.从数组中移除元素7. 搜索指定数值在数组中的插入位置8. 数组最后一位加一9. 合并两个有序数组

2024-02-20 21:37:45 537

原创生成式 AI - Diffusion 模型的数学原理（4）

来自论文《 Denoising Diffusion Probabilistic Model》（DDPM）论文链接： https://arxiv.org/abs/2006.11239Hung-yi Lee 课件整理。

2024-02-18 21:16:55 1096 2

原创生成式 AI - Diffusion 模型的数学原理（3）

来自论文《 Denoising Diffusion Probabilistic Model》（DDPM）论文链接： https://arxiv.org/abs/2006.11239Hung-yi Lee 课件整理。

2024-02-18 17:15:12 1105

原创生成式 AI - Diffusion 模型的数学原理（2）

来自论文《 Denoising Diffusion Probabilistic Model》（DDPM）论文链接： https://arxiv.org/abs/2006.11239Hung-yi Lee 课件整理。

2024-02-18 11:21:04 987

原创生成式 AI - Diffusion 模型（DDPM）原理解析（1）

简单地介绍diffusion model 的基本概念，diffusion model有很多不同的变形，现在比较成功的使用diffusion model实现的图像生成的系统，比如阿里、Google的系统基本上都是用差不多的方法来作为他们的diffusion model。

2024-02-17 22:12:09 1505

原创关于管理方法的总结

参加工作到现在7年了，在公司带过团队，包括应届生、实习生、外驻、还有比我年长的，但是别人问起我管理方法的时候我不知道怎么回答，最近读了彼得·德鲁克的书有一些观点十分认同，用自己的语言表达出来：

2024-02-16 18:06:54 495

原创牛津大学海外学习：14天的知识与文化之旅

而在牛津大学自然历史博物馆，我则有幸触摸到了那些之前只在教科书上见过的标本和化石，仿佛与古老的历史建立了一种神秘的联系。当地的人们非常友好，每次跑步时，我们都会互相打招呼、微笑，这让我深切体会到了牛津人的热情与友善。这些都给我留下了深刻的印象，让我对这片土地有了更多的了解。这次的海外学习经验，不仅让我在学术上有了长足的进步，更让我对于这片古老的土地有了更加深刻的了解。最难忘的是，在一次晚宴上，我与其他学员共同盛装出席，在牛津大学花园内欣赏那些有着400年历史的珍稀植物，仿佛进入了一个知识的天堂。

2023-10-10 22:03:37 936

原创雅思学习看这些就够了

2.《雅思王听力》3、4、5章1倍速听写，并标记已掌握单词；11章单词熟悉一遍；《keith视频课》（B站免费，特别有亲和力的前雅思考官）Simon视频课听了一节，整体了解一下，买了配套书。1.《何琼听力》B站上找资源，6节课，看了一半；《Simon视频课》（B站免费，前雅思考官）《何琼雅思听力视频课》B站，大概是6节课。1.《雅思真经538考点词》熟悉了一遍；《刘洪波雅思第一课》视频课，一个多小时。《雅思哥app》练习（会员有特权）《雅思王听力》单词听写，特别有效。2.《雅思真经总纲》练习了一遍。

2023-10-10 21:31:46 547

原创羽毛球中级提高班课后总结

2023.3.28第一课。

2023-05-21 00:24:39 778

原创羽毛球学习经验总结

羽毛球技巧

2023-02-02 19:20:17 656 1

原创羽毛球混双基本站位和战术

羽毛球混双

2023-02-02 19:15:28 888

原创 linux终端下载文件报错： Connection refused

下载数据报错：443: Connection refusedDNS被污染了，需要手动在host文件里面添加要访问网站的IP地址，以跳过DNS解析。

2022-12-08 14:54:23 2805

转载报错 syntax error near unexpected token `(‘

问题的发现写代码的肯定少不了和 shell 接触，今天执行一个 shell 脚本时发现报错了，报错内容如下：syntax error near unexpected token `('脚本内容排查了很多遍都没有找到原因，执行的方式为 sh xx.sh然后使用 source xx.sh 执行和 bash xx.sh执行都是 ok 的。知识的了解source 执行命令是直接执行命令，不创建子 shellsh 创建子 shell。子 shell 里面的变量父 shell 无法使用，对环境变量的修

2021-11-24 13:58:40 1805

原创投资组合报告-马科维茨模型

数据模型与决策课程的一个作业，做的还不错，分享一下。

2021-11-18 23:15:14 1191

原创私募股权投资-沃尔玛案例分析

在人们眼中，美国沃尔玛零售连锁集团就像一个商业神话。1955年《财富》杂志开始评选500强时，它还根本不存在。如今，已经数次在美国《财富》杂志评出的全球500强企业中名列第二位。2001和2002年，沃尔玛集团领导人的财富终于超过了比尔·盖茨，荣登榜首。作为公司的创始人，山姆·沃尔顿，他不仅创立了沃尔玛，还成为了沃尔玛的精神支柱，他留下的沃尔玛哲学是每个商家都奉若珍宝的经营宝典。甚至他最大、最老的对手哈里·康宁汉也这样评价他：“山姆可称得上本世纪最伟大的企业家。他所建立起来的沃尔玛企业文化是一切成功的关键

2021-11-05 13:49:08 1434

原创三大会计表报术语通俗理解

2021-10-13 20:24:06 298

原创 Couple Learning 模型代码开源 | DCASE | 声音事件监测 | 半监督

欢迎访问，点赞https://github.com/Toshiba-RDC/dcase20_task4

2021-10-11 16:57:18 955

原创 google 语音处理方向近期paper | 2021.8.8

@inproceedings{50574,title = {Less Is More: Investigating the Role of Label Context in RNN-T},author = {Rohit Prabhavalkar and Yanzhang (Ryan) He and David Johannes Rybach and Sean Campbell and Arun Narayanan and Trevor Deatrick Strohman and Tara N Saina

2021-08-08 18:52:55 615

转载关于ISI、SCI、EI、IEEE、Elsevier、Springer的理解

1、关于会议组织者、出版商、科研工作者的关系会议组织者：可能是某个学校；也可能是某个组织；他们为学术/经济利益举办会议，从科研工作者处收文章，收注册费；然后将论文集扔给出版商；出版商：具备一定声望，比如Elsevier/IEEE/Springer，他们旗下有一些会议论文的项目，比如Elsevier的Procedia（新推出的），IEEE的Conference Program，Springer的Lecture Notes系列；这些会议项目的共同特点是：1.拿论文的版权；2.向会议组织者收取出版费用（

2021-07-28 14:50:07 2141

原创整理 | 计算机听觉领域可以考虑发哪些期刊会议

主要基于同行评议，并参考CCF列表、SCI、EI、SSCI、C刊、中文核心等文章目录音频类可投稿期刊会议（领域关联度：最重要）（一）CCF列表（二）非CCF列表但同行认可人工智能类可投稿期刊会议（领域关联度：较重要）中文相关可投稿期刊会议（领域关联度：较重要）音频类可投稿期刊会议（领域关联度：最重要）（一）CCF列表IEEE/ACM Transactions on Audio, Speech, andLanguage Processing（TASLP，CCF-B类期刊，SCI）IEEE Inter

2021-07-26 16:09:03 1200 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

图计算、复杂网络、TigerGraph产品用例（TigerGraph 用例介绍 Rick Wu）

哈工大停用词词典

软件需求分析-用例分析

区块链 分析报告

音频转化大师

空空如也

区块链分析报告