学习ml的小菜鸡-CSDN博客

原创 LoRA论文精读（上） Low-Rank Adaptation of Large Language Models

本篇博客针对LoRA: Low-Rank Adaptation of Large Language Models的提出背景和算法原理做了非常清晰简明的讲解，适用于想要快速了解一下LoRA底层方法的学习者。对于原文的实验和未来工作等部分的详细介绍在https://blog.csdn.net/weixin_72032564/article/details/143834458中，如有兴趣，可以再进一步阅读。

2024-12-07 19:57:34 1914

原创可解释性机器学习入门：SHAP方法

随着机器学习特别是深度学习的应用越来越广泛，其“黑箱”特性（即模型内部复杂的决策机制难以理解）带来了信任、伦理、法律和安全等方面的挑战，因此可解释性变得至关重要，本篇博客对其做了相关讲解并结合实战重点介绍了SHAP这种模型无关的解释方法，希望能对大家有所帮助。

2024-12-05 21:08:06 6945 2

原创 LoRA论文精读（下） Low-Rank Adaptation of Large Language Models

现在网上对LoRA的解读文章大多非常粗暴地粘贴了原文内容、实验结果以及翻译了实验结论，对于怎么得出结论的以及一些背景知识都没有很细的讲解，本篇博客针对LoRA: Low-Rank Adaptation of Large Language Models原文的第五节实验部分，第七节理解低秩更新以及Future Work部分进行了详细解读，并顺带总结了之后LoRA的各种变体以及LoRA在NLP（如命名实体识别等）和CV（如Stable Diffusion）领域的具体应用。

2024-11-20 10:49:51 1193

原创文本向量化-词嵌入方法系列2：动态词嵌入（ELMo+BERT+XLNet）

本文主要介绍了分散式文本表示中的三种动态词嵌入方法：ELMo、BERT和XLNet，介绍了每种模型的结构特点以及它们之间的对比。

2024-11-09 15:19:22 1156

原创文本向量化-词嵌入方法系列1：静态词嵌入(Word2Vec+GloVe)

本文主要介绍了分散式文本表示中的两种静态词嵌入方法：Word2Vec和GloVe，描述了它们的计算词向量的过程并对两者进行了对比。

2024-11-08 21:24:32 1577

原创 Financial distress prediction（企业财务困境预测）-论文精选

在入门金融风险预测时，通过各种渠道查阅学习了很多文献，花了不少精力。在这里做一个简短的总结博客，主要关注公司财务困境预测，这种预测能帮助投资者更好地了解企业，并允许银行和其他金融机构建立预警系统，避免风险传播。希望能帮助大家节省时间，快速了解这一领域，后续将持续更新，如有不足，欢迎批评指正。

2024-10-25 14:33:10 1034

原创 NER-命名实体识别序列生成方法

序列生成方法是将NER任务视为一个序列生成的过程，输入为原始文本，输出为相应的实体标签序列或者加上标签后的原文本序列，它与序列标注的方法的一大区别是它更灵活，不要求输出序列与输入序列的长度严格相同。

2024-10-23 10:28:33 1528

原创中英文检测/语言识别分类的实用方法介绍

我在实习和写课程大作业的过程中都遇到过这样的问题，一个网站要支持多语言，有的时候就需要分语言训练模型，所以第一步就是识别用户输入的语言类型，然后再把inputted_sentence传给对应语言的工作流。但是感觉网上没有特别全面的方法介绍，因此我自己总结了以下两方面的方法分享给大家：（1）通过Unicode范围安装比例自己写一个简单函数（2）直接调用别人写好的工具包(langdetect,langid,fastText等)。

2024-10-15 08:29:46 1270

原创 Python爬虫快速入门（Requests+BeautifulSoup+Scrapy）

爬虫是重要的数据获取方式，下面主要介绍3种常用的Python库：Requests，BeautifulSoup和Scrapy，教你轻松入门Python爬虫

2024-10-13 12:55:33 1385 1

原创 ACL2023-NER相关论文解读：SplitNER

今天要讲的这篇文章是发表在ACL2023会议上的Split-NER，文章题目如下，主要就是用pipeline方法先进行span detection再进行classification，两步操作都采用了QA的方式向模型进行提问，兼顾平衡了effective（train faster）和efficient（perform better），启示是以后对于复杂的NLP任务都可以采用先分解成several different sub-tasks，然后分别微调LLM解决。

2024-10-11 10:45:36 961