算法/机器学习/数据挖掘/区块链
文章平均质量分 90
黑夜路人
既然决定远行,便只顾风雨兼程。
展开
-
【原创】实现ChatGPT中Transformer模型之Encoder-Decoder
ChatGPT中比较核心的就是T,代表的Transformer模型,本文主要是系统的介绍基本Transformer的代码实现。原创 2023-07-17 17:26:10 · 3237 阅读 · 0 评论 -
【原创】实现ChatGPT中Transformer模型之输入处理
ChatGPT中比较核心的就是T,代表的Transformer模型,本文主要是系统的介绍基本Transformer的代码实现。原创 2023-07-17 17:19:44 · 2246 阅读 · 0 评论 -
【原创】实现GPT中Transformer模型之框架概念
ChatGPT中比较核心的就是T,代表的Transformer模型,本文主要是系统的介绍基本Transformer的代码实现。原创 2023-07-17 17:07:52 · 2680 阅读 · 0 评论 -
【原创】用 VisualGLM 进行AIGC多模识别和内容生成
通过本文快速了解类似于GPT-4一样的多模大语言模型VisualGLM的使用和基本工作原理原创 2023-06-04 15:28:22 · 2623 阅读 · 0 评论 -
【原创】理解ChatGPT之Transformer工作原理
本文主要是介绍了ChatGPT中Transformer模型的整个组成和每个组成模块的核心工作原理,特别重点介绍了多头自注意力(Multi-head attention)的计算过程,是一个能够比较深入理解Transformer原理的过程。原创 2023-04-26 01:33:27 · 2327 阅读 · 0 评论 -
【原创】理解ChatGPT之注意力机制和Transformer入门
本文了解一下ChatGPT中的核心机制Transformer,了解Transformer的发展历史,以及其中最核心的注意力机制的原理理解。原创 2023-04-26 00:54:10 · 2408 阅读 · 0 评论 -
【原创】理解ChatGPT之GPT工作原理
本文介绍ChatGPT的技术原理,主要了解GPT的总体训练过程和基本工作流程原创 2023-04-25 02:05:24 · 1926 阅读 · 0 评论 -
【原创】理解ChatGPT之机器学习入门
本文从ChatGPT的视角,通俗简单的介绍了机器学习的基本原理原创 2023-04-25 01:50:07 · 2432 阅读 · 0 评论 -
【原创】万字长文讲解AI绘画基本技术原理
本文概要介绍了在AIGC领域中AI绘画技术的基本技术原理,介绍了Diffusion Model(扩散模型)在AI画图(AI绘画)中的核心主导地位以及Stable Diffusion的主要技术组件和原理。原创 2023-04-12 23:54:49 · 4161 阅读 · 0 评论 -
【原创】AIGC之主流产品介绍
目前火热的AIGC到底是什么,目前赛道里主要哪些产品能够提供给我们使用原创 2023-03-29 19:36:27 · 6079 阅读 · 0 评论 -
【整理】金融量化交易技术资料
最近碰巧很多人聊到金融量化交易方面的技术方面的问题,抽空半天把一些主要量化交易技术做了梳理给感兴趣的技术伙伴做参考,希望对你有帮助。原创 2022-05-08 12:48:40 · 5949 阅读 · 2 评论 -
【原创】全文搜索引擎技术原理入门
本文是描述搜索引擎的核心工作原理的文档,从搜索引擎的 内容抓取(Spider)、分词(NLP)、索引构建(Index)、内容相关性(Document Rank)排序等几个方面进行介绍,希望能够提供系统性的学习和了解搜索引擎内部工作机制。原创 2021-11-19 03:18:51 · 3772 阅读 · 0 评论 -
【原创】支持模糊匹配站内全文检索的技术方案
【原创】支持模糊匹配的全文检索有哪些解决方案?作者:黑夜路人(heiyeluren)时间:2021/1/13全文检索/全文搜索的问题场景:比如说,有一个问题场景是这样的:在计算机课程培训体系中,现在有个需求是实现根据用户输入关键字,搜索课程名称和课程简介进行匹配度计算的场景的问题,初步数据量不大。大概是这样的:使用场景:【输入“mysql”关键字,可以匹配这些】:mysql引擎innodb介绍 (完全匹配)mysql介绍 (完全...原创 2021-01-13 18:52:00 · 3932 阅读 · 4 评论 -
[转]Google开源的C++库 Abseil 库
概述:Abseil已在Google历经十多年的开发,它的目的是为Google编程人员在各种项目上的工作需求提供支持,这些项目包括Protocol Buffers、gRPC和TensorFlow等。Google公开了其项目内部使用的一系列C++库,随后还会公开其Python库。Abseil已在Google历经十多年的开发,它的目的是为Google编程人员在各种项目上的工作需求提供支持,这些项目包括P...转载 2018-05-29 19:14:02 · 16105 阅读 · 1 评论 -
[转]Facebook的c++开源库folly介绍
揭秘Facebook官方底层C++函数FollyFacebook近日公布了其官方底层C++函数Folly,Folly(该缩略语表示Facebook开源代码库)其实是C++11组件库,这些组件在设计时着眼于实用性和高效率。Folly与Boost、当然还有std等组件库的关系是互为补充,而不是彼此竞争。实际上,只有当我们需要的东西既没有,也无法满足所需的性能要求时,我们才开始定义自己的组件。性能问题贯...转载 2018-05-29 19:04:30 · 4077 阅读 · 0 评论 -
[转]区块链代码快速学习实践
如何使用Python编写一个简单且安全的区块链数据库API?GitHub项目链接:https://github.com/adamchinkc/blockchain_database当我们讨论区块链时,我们总是把它与p2p网络联系起来,认为数据必须分散在网络上。这也会使人们担心区块链将会破坏数据的机密性。事实上,区块链本身的数据架构已经为保护数据免受未经授权操作提供了一个好的解决方案,并且考虑到服务转载 2018-01-15 16:00:04 · 5740 阅读 · 0 评论 -
[转]区块链主流开源技术体系介绍
区块链技术如今是非常火热,不仅让金融家和创投家趋之若鹜,如今已经在多个领域遍地播种。作为拥有锐利触角的创业家们,是否也想将区块链集成到你们现有的应用中去,而作为IT技术工程师的你,是否也是跃跃欲试,想基于区块链来练一下手,以免日后被新技术淘汰?不过,区块链涉及如密码学和P2P等多种技术,区块链的技术门派众多,新鲜概念层出不穷;而另一方面,区块链技术的发展在全球范围内还都尚处在早期阶段,各种技术方案和应用场景等还需要进一步地探索和完善,导致很多人想运用区块链,都找不到突破口,应该学习哪些知识和技术呢,应该用什转载 2018-01-15 15:50:54 · 7445 阅读 · 0 评论 -
[转]一文看懂区块链架构设计 - 从概念到底层技术
区块链作为一种架构设计的实现,与基础语言或平台等差别较大。区块链是加密货币背后的技术,是当下与VR虚拟现实等比肩的热门技术之一,本身不是新技术,类似Ajax,可以说它是一种技术架构,所以我们从架构设计的角度谈谈区块链的技术实现。无论你擅长什么编程语言,都能够参考这种设计去实现一款区块链产品。与此同时,梳理与之相关的知识图谱和体系,帮助大家系统的去学习研究。转载 2018-01-15 14:35:28 · 9385 阅读 · 0 评论 -
[转]机器学习算法库:liblinear/LibShortText
SVM原理简介:最大间隔分类器SVM是一种二类分类模型,其求解目标在于确定一个分类的超平面,以最大化特征空间上的间隔。分类超平面的确定只取决于少数的样本信息,这些关键的样本被称之为支持向量Support Vector,这也是SVM—支持向量机名称的由来。首先我们举一个二维空间的小例子,并假设样本是线性可分的,这样我们就可以在二维空间里划一条直线(高维空间的超平面在二维空间表现为直线),完全分开所有转载 2015-03-12 18:15:35 · 6496 阅读 · 0 评论 -
[转]机器学习工具:scikit-learn/Weka
开源机器学习工具scikit-learn入门Scikit-Learn是基于python的机器学习模块,基于BSD开源许可证。这个项目最早由DavidCournapeau 在2007 年发起的,目前也是由社区自愿者进行维护。Scikit-Learn的官方网站是http://scikit-learn.org/stable/,在上面可以找到相关的Scikit-Learn的资源,模块下载,文档,例程等等。转载 2015-03-12 18:28:06 · 5566 阅读 · 0 评论 -
【原创】机器学习算法之:决策树
决策树(Decision Tree)是一种十分常用的有监督学习的聚类方法,在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系,本文讲述在机器学习领域“决策树”算法的原理机制。原创 2015-07-21 20:12:43 · 5131 阅读 · 0 评论 -
[转]几种最短路径算法的比较
几种最短路径算法的比较转载 2016-10-21 14:11:45 · 4010 阅读 · 1 评论 -
[转]关于寻路算法的一些思考
关于寻路算法的一些思考转载 2016-10-21 14:19:08 · 10482 阅读 · 0 评论 -
[转]最短路径算法—Dijkstra(迪杰斯特拉)算法分析与实现
最短路径算法—Dijkstra(迪杰斯特拉)算法分析与实现转载 2016-10-21 14:28:23 · 4934 阅读 · 0 评论 -
[转]文本相似性算法:simhash/minhash/余弦算法
文本相似性中文本去重的常规做法,经常运营在数据挖掘等领域,主要有包括适合标题的minhash算法,适合文本内容的 simhash、余弦算法等转载 2016-10-21 14:54:41 · 10492 阅读 · 0 评论 -
[转]TF-IDF与余弦相似性的应用
TF-IDF中如何提取关键字,计算文档相似性等相关内容。转载 2016-10-21 15:15:04 · 3562 阅读 · 0 评论 -
[转]贝叶斯推断及其互联网应用
关于贝叶斯推断算法在垃圾邮件过滤、拼写检查等领域的应用转载 2016-10-21 15:19:26 · 4113 阅读 · 0 评论 -
[转]朴素贝叶斯分类器的应用
生活中很多场合需要用到分类,比如新闻分类、病人分类等等。本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。转载 2016-10-21 15:22:55 · 5366 阅读 · 0 评论 -
[转]OKapi BM25 算法
BM25(Best Match25)是在信息检索系统中根据提出的query对document进行评分的算法。It is based on the probabilistic retrieval framework developed in the 1970s and 1980s by Stephen E. Robertson, Karen Spärck Jones, and others.BM25转载 2017-02-18 17:56:25 · 11227 阅读 · 0 评论 -
[转]TensorFlow深度学习,一篇文章就够了
Google不仅是大数据和云计算的领导者,在机器学习和深度学习上也有很好的实践和积累,在2015年年底开源了内部使用的深度学习框架TensorFlow。转载 2017-02-15 10:27:57 · 5219 阅读 · 0 评论 -
[转] 文本相似性算法Simhash原理及实践
大规模海量相似性文档的计算局部敏感hash算法simhash的基本原理和实践转载 2017-04-08 18:53:28 · 16838 阅读 · 0 评论 -
[转]机器学习中距离和相似性度量分类体系
在机器学习以及很多应用场景里面各种相似性、分类相关的距离数学公式的原理转载 2017-04-08 19:02:48 · 12739 阅读 · 0 评论 -
[转]Facebook 开源的快速文本分类器 FastText
Facebook声称fastText比其他学习方法要快得多,能够训练模型“在使用标准多核CPU的情况下10分钟内处理超过10亿个词汇”,特别是与深度模型对比,fastText能将训练时间由数天缩短到几秒钟。转载 2017-03-16 22:21:37 · 13589 阅读 · 0 评论 -
[转] 介绍深度学习和长期记忆网络
机器学习和深度学习~转载 2017-09-07 12:32:57 · 8047 阅读 · 0 评论 -
[转]libsvm介绍及使用
支持向量机简介 支持向量机SVM是从线性可分情况下的最优分类面提出的。所谓最优分类,就是要求分类线不但能够将两类无错误的分开,而且两类之间的分类间隔最大,前者是保证经验风险最小(为0),而通过后面的讨论我们看到,使分类间隔最大实际上就是使得推广性中的置信范围最小。推广到高维空间,最优分类线就成为最优分类面。 支持向量机是利用分类间隔的思想进行训练的,它依赖于对数据的预处理,即,在更高维的空转载 2015-03-10 21:16:13 · 4977 阅读 · 0 评论