![](https://img-blog.csdnimg.cn/20190918140213434.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
深度学习
文章平均质量分 67
分享人工智能相关模型实现及技术原理,包括NLP、机器视觉等
Trisyp
及时总结,套路套路套路!!!
展开
-
Tensorflow笔记(二):激活函数、优化器等、神经网络模型实现(商品销量预测)
Tensorflow笔记(二):常用函数2、激活函数、优化器等、神经网络模型实现(商品销量预测)原创 2024-03-14 16:04:11 · 677 阅读 · 0 评论 -
Tensorflow笔记(一):常用函数、张量操作、神经网络模型实现(鸢尾花分类)
Tensorflow笔记(一):常用函数、张量操作、神经网络模型实现(鸢尾花分类)原创 2024-03-14 11:01:47 · 521 阅读 · 0 评论 -
transformer学习总结
Decoder block与第二个Multi-Head Attention变化不大,主要的区别在于其中Self-Attention的K、V矩阵不是使用上一个Decoder block的输出计算的,而是使用Encoder的编码信息矩阵C计算的。翻译到单词i+1的时候需要通过Mask(掩盖)操作遮盖住i+1之后的单词。第一个Encoder block的输入为句子单词的表示向量矩阵,后续Encoder block的输入是前一个Encoder block的输出,最后一个Encoder block输出的矩阵就是。原创 2024-02-21 09:24:55 · 904 阅读 · 0 评论 -
文本相似度计算——Simhash算法(python实现)
互联网网页存在着大量重复内容,必须有一套高效的去重算法,否则爬虫将做非常多的无用功,工作时效性无法得到保证,更重要的是用户体验也不好。业界关于文本指纹去重的算法众多,如 k-shingle 算法、google 提出的simhash 算法、Minhash 算法、百度top k 最长句子签名算法等等,本文主要介绍simhash算法以及python应用.simhash 与传统hash 的区别传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法原创 2021-02-04 08:49:04 · 9430 阅读 · 3 评论 -
Transformer模型详解(图解史上最完整版)
Transformer模型详解转载 2023-02-24 15:47:50 · 2055 阅读 · 0 评论 -
[干货]深入浅出LSTM及其Python代码实现
博主讲的非常清晰,一看就懂的那种,本文仅贴LSTM讲解部分,想从头看的直接点击链接看原文。原文地址:https://zhuanlan.zhihu.com/p/1044750163. 长短时间记忆网络(LSTM)3.1 LSTM与RNN的关系长短期记忆(Long Short Term Memory,LSTM)网络是一种特殊的RNN模型,其特殊的结构设计使得它可以避免长期依赖问题,记住很早时刻的信息是LSTM的默认行为,而不需要专门为此付出很大代价。普通的RNN模型中,其重复神经网络模块的链转载 2021-09-06 15:48:34 · 2596 阅读 · 0 评论 -
NLP应用(一)--tokenization
假设给定一个文本,S=”I love you,you love him”,下面讲述第一阶段的文本处理过程。1. Tokenization(text to words)将该文本拆分成一个词“token”列表,得到L=[“I”, “love”, “you”, “,” ,”you”, “love”, “him”]2. Count word Frequencies假如上面的句子已经加入词典,则词典列表如下: Key(word) Value(frequency)原创 2021-02-26 16:33:02 · 588 阅读 · 0 评论 -
NLP综述非常好的一篇文章-万字长文带你解读NLP深度学习的各类模型
自然语言处理(英语:Natural Language Process,简称NLP)是计算机科学、信息工程以及人工智能的子领域,专注于人机语言交互,探讨如何处理和运用自然语言。自然语言处理的研究,最早可以说开始于图灵测试,经历了以规则为基础的研究方法,流行于现在基于统计学的模型和方法,从早期的传统机器学习方法,基于高维稀疏特征的训练方式,到现在主流的深度学习方法,使用基于神经网络的低维稠密向量特征训练模型。最近几年,随着深度学习以及相关技术的发展,NLP领域的研究取得一个又一个突破,研究者设计各种模型和方法,转载 2020-07-13 19:46:20 · 2319 阅读 · 0 评论 -
百度LAC分词
百度LAC分词原创 2023-02-23 16:51:14 · 655 阅读 · 0 评论 -
NLP应用(二)--Embedding
NLP应用(一)--tokenization(https://blog.csdn.net/Trisyp/article/details/114138818)1. one-hot encoding首先,根据上篇内容我们知道,单词可以利用one-hot encoding进行编码,假设编码如下: Key(word) Value(index) One-hot encoding love 1原创 2021-02-28 17:58:35 · 468 阅读 · 1 评论 -
‘access denied (“java.io.FilePermission“...... “IKAnalyzer.cfg.xml“ “read“(elasticsearch很容易踩到的坑)
出现的错如下:access_control_exception', 'access denied ("java.io.FilePermission" “C:\Program%20Files\ElasticSearch\elasticsearch-7.8.1\plugins\ik\config\IKAnalyzer.cfg.xml” “read”)刚开始碰到这个问题就立马去更改文件夹权限,然后发现完全不起作用,直到看到网上有人说是文件夹路径中存在空格才明白,然后就把elasticsearch-7.8.1这个原创 2020-08-15 18:37:34 · 2541 阅读 · 3 评论 -
关键词抽取总结非常好的一篇文章-如何做好文本关键词提取?从三种算法说起
在自然语言处理领域,处理海量的文本文件最关键的是要把用户最关心的问题提取出来。而无论是对于长文本还是短文本,往往可以通过几个关键词窥探整个文本的主题思想。与此同时,不管是基于文本的推荐还是基于文本的搜索,对于文本关键词的依赖也很大,关键词提取的准确程度直接关系到推荐系统或者搜索系统的最终效果。因此,关键词提取在文本挖掘领域是一个很重要的部分。关于文本的关键词提取方法分为有监督、半监督和无监督三种:1 有监督的关键词抽取算法它是建关键词抽取算法看作是二分类问题,判断文档中的词或者短语是或者不是关转载 2020-07-23 09:04:17 · 2363 阅读 · 0 评论 -
NLP应用(三)--RNNs
RNN就是这样的模型,不需要固定输入和输出的长度原创 2023-02-01 10:47:36 · 147 阅读 · 0 评论 -
Yolov5训练自己的数据集(详细完整版)
Yolov5训练自己的数据集,目标检测转载 2023-05-09 15:35:11 · 209 阅读 · 0 评论 -
人工智能的未来-读后笔记(经典语录)
读完人工智能之美一书后,觉得非常有启发的语录如下:1. 关注内在思想,而不是外在行为2. 有了合适的大框架,细节才会有意义、可操控。3. 不同的大脑皮层区域有着一个相同的、强大的通用算法,如果将这些区域按照合适的层级结构连接起来并输入信息流,它就能学会了解周围的环境4. 大脑不需要“计算”问题的答案,它只是从记忆中取出答案。整个大脑皮层就是一个记忆系统,根本不是计算机。它不会计算问题的答案,而是用存储的记忆来解决问题,作出反应。5. 你可以强迫自己去改变,但必须集中注意力,因为稍一走神,你又会落原创 2020-10-21 19:23:09 · 997 阅读 · 0 评论