ppp33
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
36、数学基础与高级TensorFlow应用
本文介绍了机器学习所需的数学基础和概率知识,包括矩阵运算中的奇异值分解、范数、行列式,以及概率理论中的随机变量、条件概率和贝叶斯规则。同时,详细讲解了如何使用TensorFlow的可视化工具TensorBoard对词嵌入进行可视化,并探讨了数学与概率知识在神经网络训练、风险评估等机器学习场景中的应用。通过掌握这些知识,可以更好地理解和优化模型,提高机器学习系统的性能和可靠性。原创 2025-09-02 07:38:01 · 47 阅读 · 0 评论 -
35、图像字幕生成与评估指标
本文深入探讨了图像字幕生成技术,包括其评估指标(如METEOR、CIDEr、BLEU等)、模型评估方法以及实际生成字幕的步骤。同时,还介绍了与之相关的数学基础和矩阵操作,如标量、向量、矩阵和张量的概念及其运算。文章还扩展了图像字幕生成在不同领域的应用,分析了评估指标的选择与权衡,并提出了模型优化与改进方向。通过理论与实践结合,旨在帮助读者更好地理解和应用图像字幕生成技术。原创 2025-09-01 13:20:54 · 76 阅读 · 0 评论 -
34、基于Transformer的图像描述生成:从模型实现到结果评估
本文详细介绍了基于Transformer的图像描述生成模型的实现、训练和评估过程。从自定义Keras层开始,逐步构建了Transformer解码器模型,并使用该模型进行图像描述生成。通过训练和验证,观察到模型性能在一定程度上得到了提升。同时,介绍了多种评估生成文本质量的指标(如BLEU、ROUGE、METEOR和CIDEr),并分析了它们的优缺点。最后,提出了模型优化建议,以进一步提高性能。原创 2025-08-31 11:27:42 · 69 阅读 · 0 评论 -
33、基于Transformer的图像字幕生成
本博客详细介绍了基于Transformer的图像字幕生成流程,涵盖了数据预处理、分词处理、TensorFlow数据管道构建、预训练视觉Transformer(ViT)模型的应用、基于文本的解码器设计与实现,以及模型的训练与推理过程。通过结合ViT和解码器Transformer,实现了一个端到端的图像字幕生成系统。原创 2025-08-30 13:43:46 · 65 阅读 · 0 评论 -
32、基于Transformer的问答与图像字幕生成
本博客详细介绍了基于Transformer的两种应用:一是基于BERT的问答系统,涵盖模型构建、训练、评估及实际应用;二是基于视觉Transformer和文本Transformer解码器的图像字幕生成系统,包括数据准备、处理、模型实现、训练及评估。通过这些技术,展示了Transformer在自然语言处理和计算机视觉领域的强大能力。原创 2025-08-29 11:13:26 · 43 阅读 · 0 评论 -
31、使用BERT进行问答任务的详细指南
本文详细介绍了如何使用BERT进行问答任务,涵盖了BERT的预训练任务原理、数据集的准备、分词器的实现、模型的定义与训练流程,以及最终的模型评估与预测方法。通过结合Hugging Face的transformers库和SQUAD数据集,展示了从数据处理到模型微调的完整实现过程,适用于希望了解BERT在问答领域应用的开发者和研究人员。原创 2025-08-28 11:05:29 · 130 阅读 · 0 评论 -
30、深入了解Transformer与BERT模型
本博客深入探讨了Transformer和BERT模型的核心原理与应用。首先介绍了Transformer模型的核心技术——自注意力机制,详细解析了查询、键和值在生成亲和矩阵和注意力输出中的作用,并讨论了嵌入层、残差连接和层归一化等关键技术。随后聚焦BERT模型,概述其作为双向编码器的特性,详细解析了其输入处理方式、适用任务以及预训练机制,包括掩码语言模型(MLM)和下一句预测(NSP)。最后总结了BERT的优势与应用场景,并展望了未来模型的发展方向。通过本博客,读者可以全面理解Transformer与BERT原创 2025-08-27 11:48:03 · 38 阅读 · 0 评论 -
29、机器翻译与序列到序列学习:从BLEU评分到聊天机器人
本文深入探讨了机器翻译与序列到序列学习的核心概念和技术应用。从BLEU评分的计算原理出发,介绍了如何通过深度GRU提升神经机器翻译(NMT)的性能,并详细解析了注意力机制的可视化方法。文章还讨论了NMT的推理流程,以及序列到序列模型在聊天机器人中的应用,包括其训练、数据来源和评估方式(如图灵测试)。此外,全面介绍了Transformer模型的架构及其在处理序列数据中的优势,并进一步讲解了BERT模型的原理、优势及其在问答任务中的使用方法。这些内容为理解和应用现代自然语言处理技术提供了坚实的基础。原创 2025-08-26 15:47:45 · 82 阅读 · 0 评论 -
28、序列到序列学习——神经机器翻译
本文详细介绍了序列到序列学习在神经机器翻译中的应用,涵盖了解码器中的GRU层设计、注意力机制的引入与计算方式、模型实现细节以及训练流程。同时,还讲解了BLEU指标的原理与作用,并给出了模型优化、应用与部署的相关建议。通过注意力机制,解码器能够更有效地利用编码器的状态信息,从而提升翻译质量。文章内容适合对神经机器翻译感兴趣的读者学习与实践。原创 2025-08-25 14:50:34 · 42 阅读 · 0 评论 -
27、序列到序列学习——神经机器翻译(上)
本博客详细介绍了基于门控循环单元(GRU)的神经机器翻译(NMT)模型的构建与实现过程。内容涵盖了模型的基础概念、数据准备步骤、编码器与解码器的设计、完整模型的构建、模型编译与训练,以及翻译预测的具体实现。此外,还提供了代码示例和操作流程,帮助读者从零开始实现一个端到端的神经机器翻译系统。原创 2025-08-24 11:30:29 · 94 阅读 · 0 评论 -
26、LSTM文本生成与序列到序列学习:从基础到神经机器翻译
本博文介绍了LSTM在文本生成中的应用以及序列到序列学习在神经机器翻译中的实现。内容涵盖词向量的选择、LSTM模型的优化方法、机器翻译的历史演进(从基于规则的翻译到统计机器翻译,再到神经机器翻译),以及NMT系统的架构和工作原理。此外,还详细描述了构建神经机器翻译系统的步骤,包括数据准备、模型定义、训练、评估指标(如BLEU分数)、注意力机制的可视化以及推理过程。最后,还探讨了Seq2Seq模型在聊天机器人中的应用。原创 2025-08-23 13:31:11 · 41 阅读 · 0 评论 -
25、长短期记忆网络(LSTM)在文本生成中的应用与优化
本文探讨了长短期记忆网络(LSTM)及其变体在文本生成任务中的应用与优化。文章对比了标准 LSTM、门控循环单元(GRUs)和带窥视孔的 LSTM 在文本生成中的表现,并通过困惑度作为评估指标分析模型性能。此外,文章介绍了改进文本生成质量的方法,如束搜索技术以及使用 Word2vec 嵌入层替代传统的 n-元组方法。实验结果表明,结合 Word2vec 的 LSTM 模型在生成文本的流畅性和语义合理性方面表现最佳。文章还讨论了 LSTM 在智能写作辅助、聊天机器人和机器翻译等实际场景中的应用,并展望了未来可原创 2025-08-22 14:14:06 · 61 阅读 · 0 评论 -
24、LSTM在文本生成中的应用
本文详细介绍了如何使用长短期记忆网络(LSTM)进行文本生成,涵盖了从数据准备、模型定义、训练到推理和生成文本的完整流程。文中提供了具体的代码实现,并深入分析了关键步骤和常见问题的解决方法,最后展望了文本生成技术的未来发展方向。原创 2025-08-21 14:56:58 · 62 阅读 · 0 评论 -
23、长短期记忆网络(LSTM)的理解与文本生成应用
本文详细介绍了长短期记忆网络(LSTM)的基本原理及其在文本生成中的应用。文章解析了LSTM的结构,包括细胞状态、输入门、遗忘门和输出门的作用,并讨论了LSTM的变体如GRU和带窥视孔连接的LSTM。此外,文章还通过一个实际案例展示了如何使用LSTM生成新的民间故事,包括数据准备、数据管道构建、模型实现以及使用束搜索优化生成结果的方法。最后,文章比较了不同LSTM变体的性能,并探讨了使用词生成文本的优势。原创 2025-08-20 14:59:58 · 62 阅读 · 0 评论 -
22、长短期记忆网络(LSTM)全解析
本文详细解析了长短期记忆网络(LSTM),包括其与标准RNN的差异、如何解决梯度消失问题、提升性能的方法(如贪心采样、束搜索、使用词向量和双向LSTM)、以及LSTM的变体(如带窥视孔连接的LSTM和GRU)。通过对比分析,展示了LSTM在处理长期依赖和序列建模中的优势,并为不同场景下的应用提供了多种选择。原创 2025-08-19 11:12:14 · 73 阅读 · 0 评论 -
21、循环神经网络与长短期记忆网络详解
本文详细介绍了循环神经网络(RNN)和长短期记忆网络(LSTM)的基本原理、结构特点、训练问题及其解决方案。RNN适合处理序列数据,但在训练中存在梯度消失和梯度爆炸的问题,而LSTM通过引入门控机制有效缓解了这些问题,能够更好地捕捉长期依赖关系。文章还探讨了RNN和LSTM的多种应用场景、性能优化技巧以及常见变体,如GRU和双向LSTM。通过对比RNN与LSTM的差异,帮助读者理解在不同任务中如何选择合适的模型。原创 2025-08-18 09:57:55 · 56 阅读 · 0 评论 -
20、基于字符和词嵌入的命名实体识别模型
本博客探讨了一种改进的命名实体识别(NER)模型,该模型结合了字符和词嵌入技术,以提高基础RNN模型的性能。文章首先评估了基础RNN模型的表现,验证准确率约为78-79%,测试准确率约为77%。随后,通过引入字符级嵌入和卷积操作,构建了一个更复杂的NER模型,并展示了其验证准确率提升了约2%,测试准确率提升了约1%。博客详细介绍了模型的构建、训练、评估流程,并提供了代码实现和改进建议,旨在帮助读者更好地理解和应用多尺度嵌入在NER任务中的优势。原创 2025-08-17 10:27:18 · 50 阅读 · 0 评论 -
19、基于RNN的命名实体识别(NER)模型构建与训练
本文详细介绍了如何构建和训练一个基于循环神经网络(RNN)的命名实体识别(NER)模型。内容涵盖数据预处理、超参数设置、模型定义、评估指标选择、类别不平衡问题处理以及模型训练与评估的完整流程。通过集成TextVectorization层、设计宏平均准确率指标以及应用样本权重策略,解决了NER任务中的关键挑战。适合对NLP和深度学习模型应用感兴趣的读者。原创 2025-08-16 16:39:05 · 55 阅读 · 0 评论 -
18、循环神经网络(RNN)的应用与命名实体识别
本博客详细介绍了循环神经网络(RNN)的不同类型及其在多种任务中的应用,重点探讨了如何使用RNN进行命名实体识别(NER)。内容涵盖了RNN的基本类型(一对一、一对多、多对一、多对多),NER任务的数据加载、分析与处理流程,以及使用TensorFlow/Keras构建、训练和评估RNN模型的完整步骤。同时,博客还讨论了处理类别不平衡、选择合适的RNN结构和超参数调优等关键问题,并提供了完整的代码示例和数据分析流程。适用于希望深入了解RNN及其在自然语言处理中应用的开发者和研究人员。原创 2025-08-15 10:32:29 · 43 阅读 · 0 评论 -
17、循环神经网络(RNN)详解
本文详细介绍了循环神经网络(RNN)的基本原理及其在处理序列数据中的应用。文章首先对比了RNN与传统前馈神经网络的差异,强调了RNN通过状态变量和参数共享对序列数据建模的优势。随后深入解析了RNN的内部计算机制,并讨论了训练RNN时使用的BPTT(时间反向传播)算法及其优化方法TBPTT,同时分析了梯度消失和梯度爆炸问题。文章还介绍了RNN在命名实体识别(NER)任务中的应用,包括结合字符嵌入和标记嵌入的NER模型实现方法,并给出了相应的Python代码示例。最后总结了RNN的应用分类及其未来发展方向。原创 2025-08-14 16:09:29 · 42 阅读 · 0 评论 -
16、基于卷积神经网络的句子分类
本文详细介绍了一种基于卷积神经网络(CNN)的句子分类方法。从数据预处理开始,包括分词、序列填充,到CNN模型的构建、训练和评估,每一步都进行了技术解析。文章还探讨了卷积操作和时间池化操作的原理,并通过实际代码展示了如何使用TensorFlow 2实现该模型。最后,文章总结了关键技术要点,并提出了优化建议以及未来的拓展方向。通过该方法,句子分类任务在测试数据上达到了接近88%的准确率,为自然语言处理任务提供了一种高效的解决方案。原创 2025-08-13 12:21:27 · 53 阅读 · 0 评论 -
15、卷积神经网络在图像与句子分类中的应用
本文介绍了卷积神经网络(CNN)在图像分类和句子分类中的应用。通过使用Fashion MNIST数据集,详细展示了图像分类任务中的数据处理、模型构建、训练和评估流程。同时,还探讨了CNN在句子分类任务中的背景、数据转换方法以及模型设计。最后,总结了两类任务的异同,并提出了优化策略和未来发展方向。原创 2025-08-12 12:15:28 · 37 阅读 · 0 评论 -
14、卷积神经网络在句子分类中的应用
本文详细介绍了卷积神经网络(CNN)的基本组成和原理,并探讨了其在图像分类和自然语言处理中的应用,尤其是在句子分类任务中的实现方法。文章从CNN的结构(卷积层、池化层和全连接层)入手,解析了其在保留空间信息、特征提取和全局组合方面的优势。同时,还提供了技术细节和实际应用示例,帮助读者全面了解CNN的工作机制及其在不同领域的广泛应用。原创 2025-08-11 14:53:02 · 39 阅读 · 0 评论 -
13、高级词向量算法与文档分类实战
本文探讨了自然语言处理(NLP)中的高级词向量算法,包括ELMo、Swivel嵌入和Transformer模型,并通过BBC新闻文章数据集详细演示了如何将词嵌入扩展为文档嵌入以实现文档分类。同时,文章还介绍了卷积神经网络(CNN)在图像和文本分类中的应用,展示了使用TensorFlow构建和训练CNN模型的具体步骤。通过这些技术,可以更好地处理自然语言数据,提高文本分类的准确性。原创 2025-08-10 11:01:01 · 62 阅读 · 0 评论 -
12、高级词向量算法:GloVe、ELMo及其他技术解析
本博客详细解析了高级词向量技术,包括GloVe模型的训练与评估、ELMo的上下文相关词嵌入机制以及FastText的子词信息应用。通过代码示例和模型输出,展示了这些技术如何提升自然语言处理任务中的词表示效果,帮助开发者选择适合的词嵌入方法。原创 2025-08-09 14:00:23 · 104 阅读 · 0 评论 -
11、高级词向量算法:GloVe与ELMo详解
本文详细解析了两种高级词向量算法——GloVe和ELMo。首先回顾了词向量的基本评估方法和Word2vec的核心思想,然后介绍了GloVe如何结合全局统计信息优化词嵌入,并通过共现矩阵弥补局部上下文方法的不足。接着,深入探讨了ELMo基于双向语言模型的上下文相关表示及其在文档分类中的应用。最后,对比了不同算法的特点,并给出了根据任务需求选择合适算法的指导方案。原创 2025-08-08 11:50:53 · 71 阅读 · 0 评论 -
10、Word2vec:学习词嵌入的Skip - Gram与CBOW算法实现
本文详细介绍了Word2vec中经典的Skip-Gram和CBOW算法的实现过程。通过数据处理、模型定义、训练与评估等步骤,分别展示了两种算法的具体实现,并对它们的特点和适用场景进行了对比分析。文章还探讨了模型优化的方向,帮助读者更好地理解和应用这两种重要的词嵌入技术。原创 2025-08-07 15:19:17 · 107 阅读 · 0 评论 -
9、基于TensorFlow实现Skip-Gram算法学习词嵌入
本文详细介绍了如何使用TensorFlow实现Skip-Gram算法进行词嵌入学习。内容涵盖了Skip-Gram算法原理、数据下载与预处理、Skip-Grams生成、负采样策略、模型构建与训练、模型评估与可视化等步骤。通过本博客,读者可以了解词嵌入的基本概念以及如何使用TensorFlow构建完整的词向量学习系统,为后续的自然语言处理任务提供基础。原创 2025-08-06 11:56:34 · 48 阅读 · 0 评论 -
8、词表示学习:从经典方法到Word2vec算法
本文详细介绍了词表示学习的发展历程,从经典的独热编码、TF-IDF和共现矩阵方法到开创性的Word2vec算法。重点解析了Word2vec中的跳跃-图(Skip-gram)和连续词袋(CBOW)两种模型的原理、数据准备过程及其实现方式。通过直观示例和代码实现,帮助读者深入理解词嵌入技术的工作机制及其在自然语言处理中的重要应用,如文本分类、情感分析、信息检索和机器翻译等。原创 2025-08-05 15:11:54 · 49 阅读 · 0 评论 -
7、利用Keras与Word2vec构建和训练神经网络
本文介绍了如何使用Keras构建神经网络模型并利用Word2vec技术进行词向量学习。内容涵盖了Keras的三种模型构建API(Sequential、Functional、Sub-classing),并通过MNIST数据集实现了数字分类任务。此外,还探讨了词表示的经典方法(如独热编码和TF-IDF)及其局限性,详细解析了Word2vec的两种核心算法(CBOW和Skip-Gram),并展示了如何训练Word2vec模型以及分析其结果,包括词向量的可视化和语义相似度计算。原创 2025-08-04 10:00:25 · 52 阅读 · 0 评论 -
6、TensorFlow基础操作与神经网络相关知识详解
本文详细介绍了TensorFlow的基础操作和神经网络相关知识,涵盖了数据预处理、变量定义、输出和操作定义等内容,并通过示例代码展示了如何使用TensorFlow进行神经网络的构建与训练。同时,对常用操作进行了总结对比,并给出了实际应用建议,帮助开发者更好地掌握TensorFlow的使用方法。原创 2025-08-03 14:35:47 · 50 阅读 · 0 评论 -
5、深入理解 TensorFlow 2:架构、对比与数据输入
本文深入解析了 TensorFlow 2 的架构设计及其与 TensorFlow 1 的区别,详细介绍了 TensorFlow 的图执行机制、任务执行与参数更新过程,并通过类比帮助读者更好地理解其运行原理。同时,文章还探讨了多种数据输入方式及其适用场景,重点分析了 tf.data API 的性能优化方法和数据管道构建流程,为不同规模的深度学习任务提供了实践建议。原创 2025-08-02 09:52:02 · 42 阅读 · 0 评论 -
4、自然语言处理与TensorFlow 2入门指南
本博客是一篇关于自然语言处理与TensorFlow 2的入门指南,涵盖了环境搭建、TensorFlow 2的基本概念和使用方法、计算图的构建、变量与张量的操作等内容。同时对比了TensorFlow 1与TensorFlow 2的差异,并介绍了TensorFlow 2的重要组件如数据管道、神经网络操作和Keras的使用。适合初学者快速入门TensorFlow 2并应用于自然语言处理领域。原创 2025-08-01 15:02:18 · 100 阅读 · 0 评论 -
3、自然语言处理中的深度学习:从传统到现代的变革
本博客深入探讨了深度学习在自然语言处理(NLP)中的应用及其对传统方法的变革。文章首先分析了传统NLP方法的弊端,如信息损失的预处理、繁重的特征工程和对外部资源的依赖,接着详细介绍了深度学习的优势及其发展历程,包括深度神经网络的结构、梯度消失问题的突破以及快速发展的关键节点。随后,博客以情感分析为例,展示了神经网络在NLP任务中的具体实现,并介绍了相关技术工具的使用与安装方法。最后,文章对不同深度学习模型进行了对比分析,并展望了未来NLP领域的发展方向。原创 2025-07-31 13:46:34 · 62 阅读 · 0 评论 -
2、自然语言处理入门
本博客介绍了自然语言处理(NLP)的基本概念、主要任务及其传统和深度学习方法。内容涵盖了NLP的挑战性问题,如语音转文本、语义理解、文本生成和机器翻译等,同时详细解析了NLP任务的分类体系。博客还对比了传统NLP方法和深度学习方法的优劣,重点介绍了深度学习在NLP领域的广泛应用,如循环神经网络(RNN)、长短期记忆网络(LSTM)和Transformer模型等。此外,博客提供了使用TensorFlow等工具进行NLP开发的示例,帮助读者更好地理解NLP的实际应用。原创 2025-07-30 12:11:22 · 69 阅读 · 0 评论 -
1、基于TensorFlow的自然语言处理技术全解析
本文全面解析了基于TensorFlow的自然语言处理(NLP)技术,从传统NLP方法与深度学习的对比入手,详细介绍了深度学习在NLP中的应用,包括各种深度学习模型如全连接神经网络、卷积神经网络(CNN)、循环神经网络(RNN)、Transformer架构等。文章还涵盖了词嵌入技术(如Word2vec、GloVe、ELMo)及其在NLP任务中的应用,如句子分类、命名实体识别和神经机器翻译。通过实际的代码示例,帮助读者快速上手构建和训练深度学习模型。最后,文章总结了当前技术并展望了NLP领域的未来发展趋势。原创 2025-07-29 13:02:39 · 52 阅读 · 0 评论
分享