人工智能
天雨龙马
好好学习,天天思考!
展开
-
查找论文对应开源代码的神器(Papers with Code)
最近发现一个神奇的网站,这个网站在看论文找代码的时候提供很大的便利,分享给大家。Reddit用户rstoj做了一个网站,将ArXiv上的最新机器学习论文与GitHub上的代码(TensorFlow/PyTorch/MXNet /等)对应起来。你可以按标题关键词查询,也可以按流行程度、GitHub星星数排列“热门研究”。这个网站能让你跟上ML社区流行的最新动态。网站地址:https://pa...原创 2019-01-13 23:28:01 · 41824 阅读 · 23 评论 -
神经网络中epoch与iteration相等吗?
一般情况(大多数时候),神经网络中epoch与iteration是不相等的。batchsize:中文翻译为批大小(批尺寸)。在深度学习中,一般采用SGD训练,即每次训练在训练集中取batchsize个样本训练。iteration:中文翻译为迭代,1个iteration等于使用batchsize个样本训练一次;一个迭代 = 一个正向通过+一个反向通过。epoch:迭代次数,1个epoch等于...原创 2019-02-20 20:32:39 · 832 阅读 · 0 评论 -
softmax详解简单入门
1.softmax初探在机器学习尤其是深度学习中,softmax是个非常常用而且比较重要的函数,尤其在多分类的场景中使用广泛。他把一些输入映射为0-1之间的实数,并且归一化保证和为1,因此多分类的概率之和也刚好为1。首先我们简单来看看softmax是什么意思。顾名思义,softmax由两个单词组成,其中一个是max。对于max我们都很熟悉,比如有两个变量a,b。如果a>b,则max为a...转载 2019-03-05 10:06:18 · 1015 阅读 · 0 评论 -
TP/FN/FP/TN(符号含义)与confusion matrix
TP(True Positive):将正类预测为正类(的数目),真实为0,预测也为0;FN(False Negative):将正类预测为负类(的数目),真实为0,预测为1;FP(False Positive):将负类预测为正类(的数目), 真实为1,预测为0;TN(True Negative):将负类预测为负类(的数目),真实为1,预测也为1。假设有一个用来对猫(cats)、狗(d...转载 2019-03-16 16:53:37 · 3186 阅读 · 1 评论 -
推荐系统排序(Rank)评价指标总结
1.Mean Average Precision (MAP)AP=∑nij=1P(j).yi,j∑nij=1yi,j其中,yi,j:排序中第j个元素对于查询i是否是相关的;相关为1,不相关为0。P(j)=∑k:πi(k)≤πi(j)y(i,k)πi(j)其中,πi(j)为j的排序位置。例如,rank_no 是否相关1 12 03 ...转载 2019-06-18 14:16:48 · 2383 阅读 · 0 评论 -
Grid Search网格搜索
什么是Grid Search 网格搜索?Grid Search:一种调参手段;穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。其原理就像是在数组里找最大值。(为什么叫网格搜索?以有两个参数的模型为例,参数a有3种可能,参数b有4种可能,把所有可能性列出来,可以表示成一个3*4的表格,其中每个cell就是一个网格,循环过程就像是在每个网格里遍历、搜...转载 2019-06-18 15:59:14 · 556 阅读 · 0 评论 -
Pandas —— 处理缺失数据dropna( )和fillna( )
dropna( )对于Serial对象丢弃带有NAN的所有项In [152]: data=pd.Series([1,np.nan,5,np.nan])In [153]: dataOut[153]:0 1.01 NaN2 5.03 NaNdtype: float64In [154]: data.dropna()Out[154]:0 ...转载 2019-08-05 13:43:35 · 557 阅读 · 0 评论 -
Jupyter Notebook介绍、安装及使用教程
目录一、什么是Jupyter Notebook?1. 简介Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍简而言之,Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编...转载 2018-12-15 22:41:27 · 892 阅读 · 0 评论 -
jupyter notebook简单使用教程
1、jupyter notebook简介jupyter notebook是一个在线编辑器,可以在网页上编辑程序,在编辑的过程中,每次编辑一行代码就可以运行一行代码,运行的结果也可以显示在代码的下方,方便查看。当所有的程序编写和运行完毕之后,还可以直接把编辑和运行之后的所有信息保存在文件中。2、jupyter notebook启动在cmd环境下,输入命令:jupyter not...转载 2018-12-15 22:43:02 · 2125 阅读 · 0 评论 -
Jupyter Notebook打开任意文件夹
Jupyter Notebook打开任意文件夹废话不多说1.win+R 启动“运行”输入cmd 点确定图 12.输入cd /d xxxxxxx回车jupyter notebook回车在这里我想打开H:\机器学习入门图 23.等待一会,在浏览器中自动跳出图 3也可以复制图2中红框的内容,在浏览器中打开完成 ...转载 2018-12-15 22:34:40 · 935 阅读 · 0 评论 -
计算机顶级会议Rankings && 英文投稿的一点经验
1. 首先一定要注意杂志的发表范围, 超出范围的千万别投,要不就是浪费时间;另外,每个杂志都有他们的具体格式要求,一定要按照他们的要求把论文写好,免得浪费时间,前些时候,我的一个同事向一个著名的英文杂志投稿,由于格式问题,人家过两个星期就退回来了,而且说了很多难听的话,说投稿前首先就应该看清楚他们的格式要求;2. 论文写作一定要言简意赅,特别是摘要,引言和结论部分,特别是摘要和结论不能重复...转载 2018-12-11 23:37:36 · 5721 阅读 · 0 评论 -
AI顶级会议列表 & ACL相关
The First Class:tier-1的conferences, 其实基本上就是AI里面大家比较公认的top conference. 下面同分的按字母序排列:IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个领域就没几篇了,象machine learn...转载 2018-12-11 01:00:24 · 401 阅读 · 0 评论 -
上采样与下采样
通常所说的采样指的是下采样,也就是对信号的抽取。其实,上采样和下采样都是对数字信号进行重采,重采的采样率与原来获得该数字信号(比如从模拟信号采样而来)的采样率比较,大于原信号的称为上采样,小于的则称为下采样。上采样的实质也就是内插或插值。下采样的定义:对于一个样值序列间隔几个样值取样一次,这样得到新序列就是原序列的下采样。下采样就是抽取,是多速率信号处理中的基本内容之一。上采样是下采样的逆...原创 2018-12-15 23:31:05 · 45002 阅读 · 0 评论 -
概率矩阵分解(Probabilistic Matrix Factorization)
摘要很多现有的协同过滤的方法既不能处理非常大的数据集,也不能容易地应对有非常少的评价的用户。在这篇论文中,我们提出了概率矩阵分解(PMF)模型,它的规模与观察值的数目线性相关,并且更重要的是,它在非常大的、稀疏的和非常失衡的Netflix数据集上表现优异。我们更进一步地扩展PMF模型来包含一个适合的先验在模型参数中并且展示模型能力怎样可以被自动地控制。最后,我们引入一个有约束版本的PMF模型...翻译 2018-09-14 10:47:15 · 20392 阅读 · 10 评论 -
如何轻松愉快地理解条件随机场(CRF)?
理解条件随机场最好的办法就是用一个现实的例子来说明它。但是目前中文的条件随机场文章鲜有这样干的,可能写文章的人都是大牛,不屑于举例子吧。于是乎,我翻译了这篇文章。希望对其他伙伴有所帮助。原文在这里[http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/]想直接看英文的朋友可以直接点进去了。我在翻译...转载 2019-06-04 09:46:24 · 251 阅读 · 0 评论 -
机器学习模型评估之“留出法(hold-out)”
留出法(hold-out)直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另外一个作为测试集T,即D=S∪T,S∩T=0.在S上训练出模型后,用T来评估其测试误差,作为对泛化误差的评估需要注意的问题:1.训练/测试集的划分要尽可能的保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响2.在给定训练/测试集的样本比例后,仍然存在多种划分方式对初始数据集D进...转载 2019-03-31 10:59:56 · 4313 阅读 · 0 评论 -
机器学习?有无监督、弱监督、半监督、强化、多示例学习是什么
什么是机器学习?机器学习的定义有很多种,而且到目前为止也没有一个公认的定义,想要了解更多可以参考一下知乎https://www.zhihu.com/question/33892253的解答,有客观的回答,有深刻的幽默。在这里我从定义的角度来让大家浅显的了解一下什么叫做机器学习,机器学习的定义有许多,比如: “机器从原始的数据中提取模式的能力”(lan goodfellow)...转载 2019-03-10 18:53:14 · 2188 阅读 · 0 评论 -
机器学习与数据挖掘的区别(一点个人理解)
就机器学习与数据挖掘两者来说,个人认为两者从实际运用和内容上来说重叠部分较多,不好完全区分开来。机器学习,又可以理解为计算机学习、程序学习、模型学习,或者说是agent学习,即人们通过编程或其他方式创造出一个模型,然后训练该模型,使该模型具有通过学习增长知识的能力;数据挖掘,又可以理解为挖掘数据,在大量数据中发现和挖掘到的知识是我们想要获得的东西。机器学习更偏向于是一种手段或者方式,数据挖掘更...原创 2018-09-08 09:51:58 · 10223 阅读 · 5 评论 -
为什么需要知识图谱?什么是知识图谱?——KG的前世今生
标题的命名顺序可能让有的读者不太习惯。通常在介绍一个陌生事物的应用前,我们会给出其定义。之所以换个顺序,是为了不让读者一开始就接触比较冰冷生硬的概念刻板描述(后面我尽量用更具体、准确的例子来表达),另一方面也是为了通过现实生活中的例子自然的引入知识图谱的概念。希望通过这种方式加深读者的印象和理解。为了减轻读者理解的负担,我尽可能地避免引入过多的概念和技术细节,将其留到后续的文章进行介绍。言归正...转载 2018-09-12 11:01:15 · 510 阅读 · 0 评论 -
笔记:知识图谱的构建方式
一、知识图谱的逻辑结构 知识图谱在逻辑上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的Neo4j、Twitter的FlockDB、sones的GraphDB等。模式层构建在数据层之上,主要是通过本体库来规范数据层的一系列事...转载 2018-09-12 11:13:29 · 1829 阅读 · 0 评论 -
项目实战:如何构建知识图谱
实践了下怎么建一个简单的知识图谱,两个版本,一个从 0 开始(start from scratch),一个在 CN-DBpedia 基础上补充,把 MySQL,PostgreSQL,Neo4j 数据库都尝试了下。自己跌跌撞撞摸索可能踩坑了都不知道,欢迎讨论。1. CN-DBpedia 构建流程知识库可以分为两种类型,一种是以 Freebase,Yago2 为代表的 Curated KBs,...转载 2018-09-12 11:48:29 · 2070 阅读 · 0 评论 -
如何从零开始搭建知识图谱?
导读:从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。 对于读者,我们不要求有任何AI相关的背景知识。 目录: 概论 ...转载 2018-09-12 18:43:18 · 9006 阅读 · 5 评论 -
知识图谱综述
随着计算资源的廉价和语料知识资源的积累,知识图谱在各大企业逐步开始尝试使用。本文结合王昊奋和漆桂林老师的知识图谱课件以及复旦知识工厂课件,尝试对知识图谱做个综述。目录知识图谱与语义技术概述语义网典型知识库项目简介cyc:常识库Wordnet:词性消歧词库conceptnet:常识知识库freebase:Wikidata:Dbpedia:Yago:Babe...转载 2018-09-12 21:23:12 · 2381 阅读 · 0 评论 -
知识图谱概述
一、 知识图谱(Knowledge Graph,KG)与语义技术概述KG,2012谷歌提出,作用是能辅助搜索(从网页搜索到语义搜索,从文本链接到数据链接),辅助问答,辅助决策,辅助AI(常识推理);人的记忆偏重关联;知识表示方法:框架系统、产生式规则、描述逻辑;知识库形成:手工众包、格式转化、元组抽取、实体融合、链接预测、推理预测、语义嵌入二、 典型知识库系统简介C...转载 2018-09-12 21:33:04 · 277 阅读 · 0 评论 -
比官方更简洁的Tensorflow入门教程
声明:参考自Python TensorFlow Tutorial – Build a Neural Network,本文简化了文字部分 文中有很多到官方文档的链接,毕竟有些官方文档是中文的,而且写的很好。Tensorflow入门资源:付费tensorflow教程Tensorflow graphsTensorflow是基于graph的并行计算模型。关于graph的理解可以参考官方...转载 2019-03-25 15:46:01 · 114 阅读 · 0 评论 -
深入解析TensorFlow中滑动平均模型与代码实现
因为本人是自学深度学习的,有什么说的不对的地方望大神指出指数加权平均算法的原理TensorFlow中的滑动平均模型使用的是滑动平均(Moving Average)算法,又称为指数加权移动平均算法(exponenentially weighted average),这也是ExponentialMovingAverage()函数的名称由来。先来看一个简单的例子,这个例子来自吴恩达老师的Dee...转载 2019-03-29 10:38:44 · 156 阅读 · 0 评论 -
Laplace算子
背景简述在图像处理,我们知道经常把Laplace算子作为边缘检测之一,也是工程数学中常用的一种积分变换。本节主要介绍Laplacian 算子相关的知识。 基本理论首先,拉普拉斯算子是最简单的各向同性微分算子,它具有旋转不变性。一个二维图像函数的拉普拉斯变换是各向同性的二阶导数,定义为:用更加形象的图像来解释,假设我们有一张一维图形。下图(a)中灰度值的”跃升”表示边缘的存在.如...转载 2018-09-08 09:13:19 · 2113 阅读 · 0 评论