2018年10月_腾云丶

12月 11月 10月 09月 08月 07月 06月 05月

原创基于混淆矩阵计算多分类的准确率和召回率

定义TP-将正类预测为正类FN-将正类预测为负类FP-将负类预测位正类TN-将负类预测位负类准确率（正确率）=所有预测正确的样本/总的样本（TP+TN）/总精确率= 将正类预测为正类 / 所有预测为正类 TP/（TP+FP）召回率 = 将正类预测为正类 / 所有正真的正类 TP/（TP+FN）多分类下计算应用多分类问题，把每个类别单独视为”正“，所有其它类型视为”负“，考虑...

2018-10-24 16:53:51 21061

原创 Pytorch求索(3)：使用训练好的词向量

nn.EmbeddingPytorch自带Embedding模块，可以方便使用self.embed = nn.Embedding(vocab_size, embedding_dim)那么，如何使用已经训练好的词向量呢？词向量其实是模型的embedding层的权重，所以，如下方法便可以实现：self.embed = nn.Embedding(vocab_size, embedding_d...

2018-10-17 20:39:01 7934 8

原创 VIM插件: CTRLP[文件搜索]

ctrlp使用github: 原始kien/ctrlp, 使用的是国人改进版本 ctrlpvim/ctrlp.vim，使用的是k-vim集成<leader>-f 模糊搜索最近打开的文件(MRU)<leader>-p 模糊搜索当前目录及其子目录下的所有文件搜索框出来后, 输入关键字, 然后ctrl + j/k 进行上下选择ctrl + x 在当前窗口...

2018-10-12 12:41:01 8843

原创 Pytorch求索(2)： Pytorch使用visdom进行可视化

Pytorch使用visdom进行可视化文章目录Pytorch使用visdom进行可视化visdom介绍visdom核心概念visdom安装与使用常用APIplot.scatterplot.lineplot.stemplot.heatmapplot.barplot.histogramplot.boxplotplot.surfplot.contourplot.quiverplot.imageplo...

2018-10-09 11:13:35 8501 1

原创 Pytorch求索(1)：pytorch与Tensorboard的结合使用

pytorch与tensorboard结合使用TensorboardTensorboard一般都是作为tf的可视化工具，与tf深度集成，它能够展现tf的网络计算图，绘制图像生成的定量指标图以及附加数据等。此外，Tensorboard也是一个独立工具，只要保存的数据遵循一定的格式，Tensorboard就可以读取这些数据并进行可视化Tensorboard_loggerTensorboard_...

2018-10-09 09:39:14 6348

原创大数据求索(4)：Hive安装和使用

Hive安装和使用Hive环境搭建Hive下载wget https://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz解压tar -zxvf hive-1.1.00cdh5.7.0.tar.gz -C ~/APP/Hadoop环境配置系统环境变量配置(vim ~/.bash_profile)expor...

2018-10-05 22:11:07 1221

原创算法学习笔记（一）

算法笔记（一）一什么是正确的回答一个算法问题回答一个算法问题，并不是一下子回答出来一个解决方案，而应该是和面试官探讨的过程，在探讨过程中逐渐选择一个最优方案对一组数据进行排序这组数据有什么样的特征？有没有包含大量重复的元素？如果有，三路快排是否大部分数据距离它的正确位置很近？即是否近乎有序？插入排序最好取值范围是否有限？比如对学生成绩排序，这样计数排序更好...

2018-10-03 22:32:40 1107

原创大数据求索(3):实战MapReduce

MapReduce 概述主要用于离线、海量数据运算WordCount编写下面这张经典图很好地说明了如何编写一个WordCount，也清楚说明了MapReduce的流程对于输入的一个文本（可以存放在HDFS上，可以非常非常大），先对文件进行拆分，假设这里一行一份，对于每一行，按空格进行切分，然后给每个单词赋初值为1，这里同一个map里有相同的单词，也是不会覆盖的，会保留两个(word, 1...

2018-10-02 21:53:56 1273

原创大数据求索(2):yarn的配置与使用

yarn的架构1） Resourcemanager: RM整个集群同一时间提供服务的RM只有一个，负责集群资源的统一管理和调度处理来自客户端的请求，比如提交一个job，杀死一个job等监控NM，一旦某个NM挂了，那么该NM上运行的任务需要告诉AM来如何进行调度NodeManager：NM整个集群中可以有多个，负责结点自己本身的资源管理和使用定时向RM汇报结点自身的资源使用...

2018-10-02 20:29:55 1588

原创简单的VIM配置（非开发）

搭建集群过程中，经常需要使用vim操作，但又不需要像使用vim做开发那样，使用大量插件，故记下简单配置，足够使用。配置如下："----------------------------------------------------------------------------------- "外观 "colorscheme evening " 配置颜...

2018-10-01 21:55:21 1181

iclr_2019.pdf

Cynthia Dwork：算法公平性的进展 Leon Bottou：Learning Representations Using Causal Invariance Emily Shuckburgh：机器学习能否有助于地球健康的检查 Ian Goodfellow：对抗机器学习 Pierre-Yves Oudeyer：发展自主学习：人工智能，认知科学和教育技术 Zeynep Tufekci：虽然我们都担心机器学习的失败，但如果它成功了，潜伏着什么危险？ Mirella Lapata：用神经模型学习自然语言界面 Noah Goodman：在上下文中学习语言

2019-05-11

40页 PPT，BMM夏令营《强化学习简明教程》下载

BMM （Brains, Minds, and Machines Summer Course）是一美国国家科学基金会资助的一个科学技术中心，致力于AI相关的跨学科研究。这是一个多机构合作的项目，总部设在麻省理工学院麦戈文大脑研究所(McGovern Institute for Brain Research at MIT)，管理合伙人在哈佛大学(Harvard University)。 BMM 在2018夏令营，用到的《强化学习简明教程》

2018-09-21

246页《统计机器学习与凸优化》教程PPT下载

统计机器学习（Statistical Machine Learning）是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。凸优化（convex optimization）是指一种比较特殊的优化，是指求取最小值的目标函数为凸函数的一类优化问题。两者都是现代机器学习研究和实践的重要理论基础。今天给大家带来的是由INRIA的Francis Bach主讲的246页《统计机器学习与凸优化》教程。教程大纲：介绍（Introduction）凸优化的经典方法（Classical methods for convex optimization）非光滑随机近似（Non-smooth stochastic approximation）平滑的随机近似算法（Smooth stochastic approximation algorithms）有限数据集（Finite data sets）

2018-09-21

微软剑桥研究院153页最新GAN教程（附代码）

ebastian Nowozin是微软剑桥研究院首席研究院，专注于无监督于表示学习。他在GAN领域做了大量的工作，同时也是著名的f-GAN的作者。在训练 GAN 方面似乎有两三个阵营：第一个当然就是GAN的发明Ian Goodfellow以及他所供职的OpenAI和谷歌的一帮研究人员；第二个强大的阵营也就是以这篇教程作者Sebastian Nowozin 为代表的微软阵营；第三就是其他了。此次教程主要有以下几个部分：概率模型 GANs的几个示范应用评价原则 GAN 模型差异性与f-GAN 家族基于积分概率度量(IPM)的GAN: MMD 基于积分概率度量(IPM)的GAN: Wasserstein GANs 问题与如何修正：模式崩溃(modecollapse)与不稳定性（Instability）隐式模型开放性研究问题

2018-09-11

中国中文信息学会发布《2018知识图谱发展报告》

中国中文信息学会发布《2018知识图谱发展报告》报告目录如下（文末附下载链接）第一章知识表示与建模第二章知识表示学习第三章实体识别与链接第四章实体关系学习第五章事件知识学习第六章知识存储与查询第七章知识推理第八章通用和领域知识图谱第九章语义集成第十章语义搜索第十一章基于知识的问答

2018-09-08

美团大脑: 知识图谱的建模方法及其应用

美团大脑:知识图谱的建模方法及其应用，美团AI平台部NLP中心负责人大众点评搜索智能中心负责人，。美团点评AI平台部NLP（自然语言处理）中心于2018年2月正式成立 • 愿景：用人工智能帮大家吃得更好，生活更好 • NLP (Natural Language Processing) ：语言是人类智慧的结晶，自然语言处理是人工智能中最为困难的问题之一，其核心是让机器像人类一样理解和使用语言

2018-09-05

清华-中国工程院知识智能联合实验室AMiner发布的《2018自然语言处理研究报告》

自然语言处理是人工智能的一个重要应用领域，也是新一代计算机必须研究的课题。它的主要目的是克服人机对话中的各种限制，使用户能用自己的语言与计算机对话。本研究报告对自然语言进行了简单梳理，包括以下内容：自然语言处理概念。首先对自然语言处理进行定义，接着对自然语言的发展历程进行了梳理，对我国自然语言处理现状进行了简单介绍，对自然语言处理业界情况进行介绍。自然语言处理研究情况。依据 2016 年中文信息学会发布的中文信息处理发展报告对自然语言处理研究中的重要技术进行介绍。自然语言处理领域专家介绍。利用 AMiner 大数据对自然语言处理领域专家进行深入挖掘，对国内外自然语言处理知名实验室及其主要负责人进行介绍。自然语言处理的应用及趋势预测。自然语言处理在现实生活中应用广泛，目前的应用集中在语言学、数据处理、认知科学以及语言工程等领域，在介绍相关应用的基础上，对机器翻译未来的发展趋势做出了相应的预测

2018-07-27

AI 顶级国际会议 IJCAI 斯坦福大学PH.D Aditya Grover报告深度生成模型Deep Generative Model

生成模型是图模型与概率编程语言中概率推理的核心范例，最近由于神经网络在参数化方面的改进、以及基于梯度随机优化方面的进展，使得可以对高维数据进行跨模态建模。本教程的前半部分，将全面介绍深度生成模型，包括生成对抗网络、变分自编码器以及自回归模型。对于每一个模型，我们都将深入探讨各自的概率公式、学习算法、以及与其他模型的关系。后半部分将演示一组具有代表性的推理任务，展示深度生成网络在其中的应用。最后，我们将讨论堂前领域面临的挑战，并展望未来的研究方向。目录第一部分：生成模型的动机，以及与判别模型的对比生成模型的定义、特征、估计密度、模拟数据、学习表示传统生成模型方法，以及深度网络在参数化方面的作用基于学习算法的生成模型分类，基于相似点的学习和无相似点的学习 Likelihood-based学习实例自回归模型变分自编码器第二部分： Likelihood-based学习实例（续）规范化流模型 Likelihood-free 学习实例生成对抗网络深度生成模型的实例半监督学习模仿学习对抗样本压缩感知关于生成模型未来研究的主要挑战和展望。

2018-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

腾云

原创基于混淆矩阵计算多分类的准确率和召回率

原创 Pytorch求索(3)：使用训练好的词向量

原创 VIM插件: CTRLP[文件搜索]

原创 Pytorch求索(2)： Pytorch使用visdom进行可视化

原创 Pytorch求索(1)：pytorch与Tensorboard的结合使用

原创大数据求索(4)：Hive安装和使用

原创算法学习笔记（一）

原创大数据求索(3):实战MapReduce

原创大数据求索(2):yarn的配置与使用

原创简单的VIM配置（非开发）

iclr_2019.pdf

40页 PPT，BMM夏令营《强化学习简明教程》下载

246页《统计机器学习与凸优化》教程PPT下载

微软剑桥研究院153页最新GAN教程（附代码）

中国中文信息学会发布《2018知识图谱发展报告》

美团大脑: 知识图谱的建模方法及其应用

清华-中国工程院知识智能联合实验室AMiner发布的《2018自然语言处理研究报告》

AI 顶级国际会议 IJCAI 斯坦福大学PH.D Aditya Grover报告深度生成模型Deep Generative Model

机器学习之特征工程

美团点评技术团队算法技术

阿里技术图册-开发篇

阿里技术参考图册-算法篇

阿里巴巴Java开发手册(官方最新版)

2014计算机考研复试c++笔试题

东南大学计算机复试553C++教材东南大学软院初试推荐c++教材

最容易理解的LDA资料

最优化与KKT条件（最好的最优化书籍）

DeepLearning参考论文

人脸识别数据集

pytorch实现人脸识别包括人脸检测（opencv、dlib、CNN三种方法融合）人脸对齐和vgg-face人脸特征提取

VGG-Face Pytorch版模型

空空如也

iclr_2019.pdf

40页 PPT，BMM夏令营《强化学习简明教程》下载

246页《统计机器学习与凸优化》教程PPT下载

微软剑桥研究院153页最新GAN教程（附代码）

中国中文信息学会发布《2018知识图谱发展报告》

美团大脑: 知识图谱的建模方法及其应用

清华-中国工程院知识智能联合实验室AMiner发布的《2018自然语言处理研究报告》

AI 顶级国际会议 IJCAI 斯坦福大学PH.D Aditya Grover报告深度生成模型Deep Generative Model

机器学习之特征工程

美团点评技术团队算法技术

阿里技术图册-开发篇

阿里技术参考图册-算法篇

阿里巴巴Java开发手册(官方最新版)

2014计算机考研复试c++笔试题

东南大学计算机复试553C++教材 东南大学软院初试推荐c++教材

最容易理解的LDA资料

最优化与KKT条件（最好的最优化书籍）

DeepLearning参考论文

人脸识别数据集

pytorch实现人脸识别包括人脸检测（opencv、dlib、CNN三种方法融合）人脸对齐和vgg-face人脸特征提取

VGG-Face Pytorch版模型

空空如也

东南大学计算机复试553C++教材东南大学软院初试推荐c++教材