自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

腾云

不忘初心,方得始终。

  • 博客(10)
  • 资源 (22)
  • 收藏
  • 关注

原创 基于混淆矩阵计算多分类的准确率和召回率

定义TP-将正类预测为正类FN-将正类预测为负类FP-将负类预测位正类TN-将负类预测位负类准确率(正确率)=所有预测正确的样本/总的样本 (TP+TN)/总精确率= 将正类预测为正类 / 所有预测为正类 TP/(TP+FP)召回率 = 将正类预测为正类 / 所有正真的正类 TP/(TP+FN)多分类下计算应用多分类问题,把每个类别单独视为”正“,所有其它类型视为”负“,考虑...

2018-10-24 16:53:51 21061

原创 Pytorch求索(3):使用训练好的词向量

nn.EmbeddingPytorch自带Embedding模块,可以方便使用self.embed = nn.Embedding(vocab_size, embedding_dim)那么,如何使用已经训练好的词向量呢?词向量其实是模型的embedding层的权重,所以,如下方法便可以实现:self.embed = nn.Embedding(vocab_size, embedding_d...

2018-10-17 20:39:01 7934 8

原创 VIM插件: CTRLP[文件搜索]

ctrlp使用github: 原始kien/ctrlp, 使用的是国人改进版本 ctrlpvim/ctrlp.vim,使用的是k-vim集成<leader>-f 模糊搜索最近打开的文件(MRU)<leader>-p 模糊搜索当前目录及其子目录下的所有文件搜索框出来后, 输入关键字, 然后ctrl + j/k 进行上下选择ctrl + x 在当前窗口...

2018-10-12 12:41:01 8843

原创 Pytorch求索(2): Pytorch使用visdom进行可视化

Pytorch使用visdom进行可视化文章目录Pytorch使用visdom进行可视化visdom介绍visdom核心概念visdom安装与使用常用APIplot.scatterplot.lineplot.stemplot.heatmapplot.barplot.histogramplot.boxplotplot.surfplot.contourplot.quiverplot.imageplo...

2018-10-09 11:13:35 8501 1

原创 Pytorch求索(1):pytorch与Tensorboard的结合使用

pytorch与tensorboard结合使用TensorboardTensorboard一般都是作为tf的可视化工具,与tf深度集成,它能够展现tf的网络计算图,绘制图像生成的定量指标图以及附加数据等。此外,Tensorboard也是一个独立工具,只要保存的数据遵循一定的格式,Tensorboard就可以读取这些数据并进行可视化Tensorboard_loggerTensorboard_...

2018-10-09 09:39:14 6348

原创 大数据求索(4):Hive安装和使用

Hive安装和使用Hive环境搭建Hive下载wget https://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz解压tar -zxvf hive-1.1.00cdh5.7.0.tar.gz -C ~/APP/Hadoop环境配置系统环境变量配置(vim ~/.bash_profile)expor...

2018-10-05 22:11:07 1221

原创 算法学习笔记(一)

算法笔记(一)一 什么是正确的回答一个算法问题 回答一个算法问题,并不是一下子回答出来一个解决方案,而应该是和面试官探讨的过程,在探讨过程中逐渐选择一个最优方案对一组数据进行排序这组数据有什么样的特征?有没有包含大量重复的元素? 如果有,三路快排是否大部分数据距离它的正确位置很近?即是否近乎有序?插入排序最好取值范围是否有限?比如对学生成绩排序,这样计数排序更好...

2018-10-03 22:32:40 1107

原创 大数据求索(3):实战MapReduce

MapReduce 概述主要用于离线、海量数据运算WordCount编写下面这张经典图很好地说明了如何编写一个WordCount,也清楚说明了MapReduce的流程对于输入的一个文本(可以存放在HDFS上,可以非常非常大),先对文件进行拆分,假设这里一行一份,对于每一行,按空格进行切分,然后给每个单词赋初值为1,这里同一个map里有相同的单词,也是不会覆盖的,会保留两个(word, 1...

2018-10-02 21:53:56 1273

原创 大数据求索(2):yarn的配置与使用

yarn的架构1) Resourcemanager: RM整个集群同一时间提供服务的RM只有一个,负责集群资源的统一管理和调度处理来自客户端的请求,比如提交一个job,杀死一个job等监控NM,一旦某个NM挂了,那么该NM上运行的任务需要告诉AM来如何进行调度NodeManager:NM整个集群中可以有多个,负责结点自己本身的资源管理和使用定时向RM汇报结点自身的资源使用...

2018-10-02 20:29:55 1588

原创 简单的VIM配置(非开发)

搭建集群过程中,经常需要使用vim操作,但又不需要像使用vim做开发那样,使用大量插件,故记下简单配置,足够使用。配置如下:"----------------------------------------------------------------------------------- "外观 "colorscheme evening " 配置颜...

2018-10-01 21:55:21 1181

iclr_2019.pdf

Cynthia Dwork:算法公平性的进展 Leon Bottou:Learning Representations Using Causal Invariance Emily Shuckburgh:机器学习能否有助于地球健康的检查 Ian Goodfellow:对抗机器学习 Pierre-Yves Oudeyer:发展自主学习:人工智能,认知科学和教育技术 Zeynep Tufekci:虽然我们都担心机器学习的失败,但如果它成功了,潜伏着什么危险? Mirella Lapata:用神经模型学习自然语言界面 Noah Goodman:在上下文中学习语言

2019-05-11

40页 PPT,BMM夏令营《强化学习简明教程》下载

BMM (Brains, Minds, and Machines Summer Course)是一美国国家科学基金会资助的一个科学技术中心,致力于AI相关的跨学科研究。这是一个多机构合作的项目,总部设在麻省理工学院麦戈文大脑研究所(McGovern Institute for Brain Research at MIT),管理合伙人在哈佛大学(Harvard University)。 BMM 在2018夏令营,用到的《强化学习简明教程》

2018-09-21

246页《统计机器学习与凸优化》教程PPT下载

统计机器学习(Statistical Machine Learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。凸优化(convex optimization)是指一种比较特殊的优化,是指求取最小值的目标函数为凸函数的一类优化问题。两者都是现代机器学习研究和实践的重要理论基础。今天给大家带来的是由INRIA的Francis Bach主讲的246页《统计机器学习与凸优化》教程。 教程大纲: 介绍(Introduction) 凸优化的经典方法(Classical methods for convex optimization) 非光滑随机近似(Non-smooth stochastic approximation) 平滑的随机近似算法(Smooth stochastic approximation algorithms) 有限数据集(Finite data sets)

2018-09-21

微软剑桥研究院153页最新GAN教程(附代码)

ebastian Nowozin是微软剑桥研究院首席研究院,专注于无监督于表示学习。他在GAN领域做了大量的工作,同时也是著名的f-GAN的作者。 在训练 GAN 方面似乎有两三个阵营:第一个当然就是GAN的发明Ian Goodfellow以及他所供职的OpenAI和谷歌的一帮研究人员;第二个强大的阵营也就是以这篇教程作者Sebastian Nowozin 为代表的微软阵营;第三就是其他了。 此次教程主要有以下几个部分: 概率模型 GANs的几个示范应用 评价原则 GAN 模型 差异性与f-GAN 家族 基于积分概率度量(IPM)的GAN: MMD 基于积分概率度量(IPM)的GAN: Wasserstein GANs 问题与如何修正:模式崩溃(modecollapse)与不稳定性(Instability) 隐式模型 开放性研究问题

2018-09-11

中国中文信息学会发布《2018知识图谱发展报告》

中国中文信息学会发布《2018知识图谱发展报告》报告目录如下(文末附下载链接) 第一章 知识表示与建模 第二章 知识表示学习 第三章 实体识别与链接 第四章 实体关系学习 第五章 事件知识学习 第六章 知识存储与查询 第七章 知识推理 第八章 通用和领域知识图谱 第九章 语义集成 第十章 语义搜索 第十一章 基于知识的问答

2018-09-08

美团大脑: 知识图谱的建模方法及其应用

美团大脑:知识图谱的建模方法及其应用,美团AI平台部NLP中心负责人大众点评搜索智能中心负责人,。美团点评AI平台部NLP(自然语言处理)中心于2018年2月正式成立 • 愿景:用人工智能帮大家吃得更好,生活更好 • NLP (Natural Language Processing) :语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之 一,其核心是让机器像人类一样理解和使用语言

2018-09-05

清华-中国工程院知识智能联合实验室AMiner发布的《2018自然语言处理研究报告》

自然语言处理是人工智能的一个重要应用领域, 也是新一代计算机必须研究的课题。它 的主要目的是克服人机对话中的各种限制,使用户能用自己的语言与计算机对话。本研究报 告对自然语言进行了简单梳理,包括以下内容: 自然语言处理概念。 首先对自然语言处理进行定义,接着对自然语言的发展历程进行了 梳理,对我国自然语言处理现状进行了简单介绍,对自然语言处理业界情况进行介绍。 自然语言处理研究情况。 依据 2016 年中文信息学会发布的中文信息处理发展报告对自 然语言处理研究中的重要技术进行介绍。 自然语言处理领域专家介绍。 利用 AMiner 大数据对自然语言处理领域专家进行深入挖 掘,对国内外自然语言处理知名实验室及其主要负责人进行介绍。 自然语言处理的应用及趋势预测。 自然语言处理在现实生活中应用广泛,目前的应用集 中在语言学、数据处理、认知科学以及语言工程等领域,在介绍相关应用的基础上,对机器 翻译未来的发展趋势做出了相应的预测

2018-07-27

AI 顶级国际会议 IJCAI 斯坦福大学PH.D Aditya Grover报告深度生成模型Deep Generative Model

生成模型是图模型与概率编程语言中概率推理的核心范例,最近由于神经网络在参数化方面的改进、以及基于梯度随机优化方面的进展,使得可以对高维数据进行跨模态建模。 本教程的前半部分,将全面介绍深度生成模型,包括生成对抗网络、变分自编码器以及自回归模型。对于每一个模型,我们都将深入探讨各自的概率公式、学习算法、以及与其他模型的关系。后半部分将演示一组具有代表性的推理任务,展示深度生成网络在其中的应用。最后,我们将讨论堂前领域面临的挑战,并展望未来的研究方向。 目录 第一部分: 生成模型的动机,以及与判别模型的对比 生成模型的定义、特征、估计密度、模拟数据、学习表示 传统生成模型方法,以及深度网络在参数化方面的作用 基于学习算法的生成模型分类,基于相似点的学习和无相似点的学习 Likelihood-based学习实例 自回归模型 变分自编码器 第二部分: Likelihood-based学习实例(续) 规范化流模型 Likelihood-free 学习实例 生成对抗网络 深度生成模型的实例 半监督学习 模仿学习 对抗样本 压缩感知 关于生成模型未来研究的主要挑战和展望。

2018-07-25

机器学习之特征工程

机器学习之特征工程介绍,一步一步告诉你如何进行特征工程~

2018-05-02

美团点评技术团队算法技术

《2018美团点评技术年货(合辑)》过去的一年,美团点评作为全球领先的一站式生活服务互联网平台, 在吃喝玩乐住行等 200 多个品类,2800 多个城区县,服务了亿万消费 者、数百万商家,日订单数超过 2200 万,年度交易总额达到了 3600 亿。 2017 年 10 月最新一轮融资,300 亿美元的估值,也使我们进入全 球独角兽的最前列。

2018-04-19

阿里技术图册-开发篇

速度收藏!600页阿里技术全景图曝光,程序员看完都沸腾了。如果你不甘心一直在写增删改查,希望看到更广的技术世界,阿里技术团队重磅发布的《阿里技术参考图册》,总计 600 余页,现已开放下载,将为你呈现阿里技术全景,走进各个技术领域的世界。 此书邀请了阿里多个重要部门的研究员、资深技术专家、资深算法专家参与撰写。内容分为研发篇、算法篇两册,全面展示了在超大规模的企业级应用需求下,阿里全新升级的大中台、小前台的技术组织架构,以及各个技术领域的突破及创新。

2018-04-17

阿里技术参考图册-算法篇

速度收藏!600页阿里技术全景图曝光,程序员看完都沸腾了。如果你不甘心一直在写增删改查,希望看到更广的技术世界,阿里技术团队重磅发布的《阿里技术参考图册》,总计 600 余页,现已开放下载,将为你呈现阿里技术全景,走进各个技术领域的世界。此书邀请了阿里多个重要部门的研究员、资深技术专家、资深算法专家参与撰写。内容分为研发篇、算法篇两册,全面展示了在超大规模的企业级应用需求下,阿里全新升级的大中台、小前台的技术组织架构,以及各个技术领域的突破及创新。

2018-04-17

阿里巴巴Java开发手册(官方最新版)

阿里巴巴Java开发手册(官方最新版),终极版本,官方发布

2018-04-17

2014计算机考研复试c++笔试题

2014计算机考研复试c++笔试题,学长回忆总结版本,给考研的提供 参考

2018-04-11

东南大学计算机复试553C++教材 东南大学软院初试推荐c++教材

东南大学计算机复试553C++教材,包括《C++语言程序设计(第4版)》.(郑莉,董渊)以及课后习题答案,钱能-C++ 程序设计(第二版)以及课后习题答案

2018-04-11

最容易理解的LDA资料

LDA八卦,最容易理解LDA算法的介绍文章,包括详细的数学推导和过程!

2018-04-07

最优化与KKT条件(最好的最优化书籍)

最优化与KKT条件,最好的凸优化入门书籍,简短精炼,易于理解,对于学习深度学习打下基础具有很大的帮助!

2018-04-07

DeepLearning参考论文

DeepLearning参考论文,分类好打包下载,阅读原始论文可以更方便理解内容

2018-04-07

人脸识别数据集

包括ORL人脸库、Yale人脸库、AT&T人脸库及MIT人脸库。ORL人脸库中包括23*28的bmp格式的400幅人脸、92*112的bmp格式及pgm格式的各400幅人脸;Yale人脸库中包括100*100的bmp格式的15个人的人脸,每个人11幅图像;MIT人脸库中包括人脸20*20的bmp格式2706幅图及非人脸20*20的bmp格式4381幅图

2018-04-07

pytorch实现人脸识别包括人脸检测(opencv、dlib、CNN三种方法融合)人脸对齐和vgg-face人脸特征提取

博客地址:https://blog.csdn.net/wen_fei/article/details/80261047 人脸识别源代码,包括使用opencv、dlib和cnn实现的人脸检测、opencv实现的人脸对齐以及vgg-face的人脸特征提取等,最后余弦函数计算相似度,并提供flask部署代码,可以放在服务器上远程调用

2018-04-02

VGG-Face Pytorch版模型

博客地址:https://blog.csdn.net/wen_fei/article/details/80261047 VGG-Face模型Pytorch版本,使用Pytorch的torch.load(VGG_FACE_LOCATION)可直接读取,基于千万张人脸数据训练,

2018-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除