自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(126)
  • 收藏
  • 关注

原创 什么是关系抽取?

本文详细介绍了关系抽取的概念及原理,并给出了基于规则匹配的关系抽取python实例。

2025-03-15 14:37:17 253

原创 <论文>MiniCPM:利用可扩展训练策略揭示小型语言模型的潜力

本文介绍了论文​《MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies》的主要研究内容。

2025-03-09 23:41:48 516 1

原创 机器学习模型可解释性工具——SHAP

本文介绍了机器学习可解释性工具SHAP的原理、概念及python用法。

2025-02-28 10:05:47 328

原创 SMOTE过采样算法

本文详细介绍了SMOTE过采样的概念、原理及python实现。

2025-02-20 17:02:58 427

原创 数据结构中的邻接表

本文详细介绍了邻接表的概念、原理及python实现。

2025-02-17 16:55:43 932

原创 python实战(十七)——基于对比学习的跨语言文本对齐

本文基于kaggle的开源数据集进行了跨语言文本对齐的python实践。

2025-02-17 14:59:55 631

原创 什么是元学习?

本文详细介绍了元学习的概念、原理。

2025-02-15 12:17:23 649

原创 数据结构中的邻接矩阵

本文详细介绍了邻接矩阵的概念、原理及python实现方式。

2025-02-13 16:28:50 613

原创 <论文>通过频率分解MoE来增强时序预测能力

本文详细介绍了论文《FreqMoE: Enhancing Time Series Forecasting through Frequency Decomposition Mixture of Experts》的研究内容及核心创新点。

2025-02-13 09:51:05 1154

原创 python实战(十六)——基于LSTM的股价预测

本文基于特斯拉股价数据集展示了使用LSTM进行时序预测的python建模过程。

2025-02-09 09:33:49 964

原创 <论文>DeepSeek-R1:通过强化学习激励大语言模型的推理能力(深度思考)

本文详细介绍了论文​《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning | Papers With Code》的主要研究内容及创新点。

2025-02-07 18:30:48 2846 2

原创 DeepSeek中用到的Grouped-Query Attention技术是什么来头?

本文详细介绍了Grouped-Query Attention的概念、原理以及python实现。

2025-02-07 13:54:22 821

原创 DeepSeek中的Multi-head Latent Attention技术

本文详细介绍了DeepSeek大模型所用到的多头隐注意力机制的概念、核心原理及python实现。

2025-02-06 14:27:22 2359

原创 什么是图神经网络?

本文详细介绍了图神经网络GNN的概念及python实现。

2025-02-06 13:13:43 1353

原创 什么是门控循环单元?

本文详细介绍了门控循环单元GRU的基本概念及核心算法,并给出了python实现的示例。

2025-02-01 10:30:50 1553

原创 什么是长短期记忆网络?

本文详细介绍了LSTM的概念、原理及python实现。

2025-01-29 18:01:38 1100

原创 什么是循环神经网络?

本文详细介绍了RNN的概念、原理及python实现方式。

2025-01-28 13:04:59 709

原创 什么是卷积神经网络?

本文详细介绍了卷积神经网络的概念、原理及python实现。

2025-01-27 11:30:01 1409

原创 算法中的时间复杂度和空间复杂度

本文详细介绍了时间复杂度和空间复杂度的概念及常见类型。

2025-01-23 18:07:24 1096

原创 <论文>大模型可以在手机上运行?

本文介绍了论文​《MiniCPM-V: A GPT-4V Level MLLM on Your Phone》的核心内容。

2025-01-23 16:11:05 860

原创 python实战(十五)——中文手写体数字图像CNN分类

本文基于汉字手写体数字图像进行了CNN分类实战。

2025-01-22 20:07:24 830 4

原创 <论文>用于大语言模型去偏的因果奖励机制

本文介绍了论文​《Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment》的主要研究内容。

2025-01-22 17:50:07 1242

原创 大模型后训练——DPO直接偏好优化

本文介绍了大模型优化方法——DPO,即直接偏好优化的概念及python实现。

2025-01-21 15:25:47 1517

原创 大模型旋转位置编码RoPE

本文介绍了大模型领域的旋转位置编码RoPE。

2025-01-17 12:50:33 596

原创 <论文>谷歌的时序大模型TimesFM

本文介绍谷歌团队发表于2023年的论文《译文:受自然语言处理(NLP)中大型语言模型最新进展的启发,我们设计了一种用于预测的时间序列基础模型,其在各种公共数据集上的开箱即用零样本性能接近于每个单独数据集的最先进监督预测模型的准确性。我们的模型基于预训练一个带有输入分片的解码器风格注意力模型,使用一个包含真实世界和合成数据集的大型时间序列语料库。在一组多样化的先前未见过的预测数据集上的实验表明,该模型可以在不同领域、预测范围和时间粒度上产生准确的零样本预测。

2025-01-17 11:47:26 843

原创 <论文>如何将RAG和时序大模型相结合?

本文介绍了论文​《Retrieval Augmented Time Series Forecasting》及其提出的RAG增强方法。

2025-01-15 17:58:43 815

原创 python实战(十四)——Bert-BiLSTM-CRF命名实体识别

本文使用人民日报BIO标注数据集进行了基于Bert-BiLSTM-CRF的命名实体识别建模实践。

2025-01-15 17:54:11 2462 2

原创 <论文>时序大模型如何应用于金融领域?

本文简要介绍了论文​《Financial Fine-tuning a Large Time Series Model》。

2025-01-13 16:59:41 843

原创 <论文>LoRA是什么?

本文介绍了论文​《LoRA: Low-Rank Adaptation of Large Language Models》的主要研究内容,并介绍了LoRA技术的基本思路。

2025-01-12 10:15:13 486

原创 什么是知识图谱?

本文详细介绍了知识图谱的概念、应用场景及构建方式。

2025-01-10 13:48:58 1010

原创 什么是命名实体识别?

本文介绍了命名实体识别的基本概念及基于规则的命名实体识别python实现。

2025-01-08 18:40:46 626

原创 <论文>什么是胶囊神经网络?

本文简要介绍了​论文《Dynamic Routing Between Capsules》及其提出的胶囊神经网络核心要点。

2025-01-08 15:38:40 1247 1

原创 <论文>大模型也能做时间序列预测?

本文介绍了​论文《UnderstandingDifferentDesignChoicesinTrainingLargeTimeSeriesModels》的核心研究内容。

2025-01-07 16:49:55 880

原创 python实战(十三)——基于Bert+HDBSCAN的微博热搜数据挖掘

本文使用微博热搜词条数据,展示了文本数据分析及python无监督文本挖掘的过程。

2025-01-07 09:36:47 2069

原创 <论文>语言模型能进行少样本学习?看看GPT3的答案

本文介绍了GPT3模型的核心创新点。

2025-01-04 13:15:47 935

原创 <论文>聊聊初代LLaMA

本文介绍了论文《LLaMA: Open and Efficient Foundation Language Models》及其提出的初代LLaMA模型核心要点。

2025-01-03 20:54:07 1126

原创 神经网络的初始化方式都有哪些?

本文详细介绍了几种常见且有效的神经网络权重初始化方法。

2025-01-02 10:27:08 1322

原创 <论文>双语预训练模型GLM-130B

本文简要介绍了​论文《GLM-130B: An Open Bilingual Pre-trained Model》及其提出的模型GLM-130B核心要点。

2025-01-01 17:28:11 765

原创 python实战(十二)——如何进行新词发现?

本文详细介绍了新词发现的概念和原理,并给出了python进行微博热搜词条新词发现的实例。

2024-12-30 20:14:06 1340

原创 <论文>通过知识蒸馏的方式来压缩大模型

本文介绍了论文​《DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter》的主要工作。

2024-12-28 17:45:59 923

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除