自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 机器学习 人工智能 博文链接汇总

[入门问题] [TensorFlow] [深度学习] [好玩儿的算法应用实例] [聊天机器人] [神经网络] [机器学习] [机器学习算法应用实例] [自然语言处理] [数据科学] [Python] [Java] [机器学习--初期的笔记] [路线] [软件安装] [面试] 入门问题简单粗暴地入门机器学习机

2017-05-13 23:41:07 14696 18

原创 如何自动生成文本摘要

学习资料: https://www.youtube.com/watch?v=ogrJaOIuBx4&list=PL2-dafEMk2A7YdKv4XfKpfbTH5z6rEEj3&index=19 代码: https://github.com/llSourcell/How_to_make_a_text_summarizer/blob/master/vocabulary-embedding.ip

2017-05-26 12:01:23 16662 8

原创 TensorFlow-9-词的向量表示

今日资料: https://www.tensorflow.org/tutorials/word2vec 中文版: http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/word2vec.html这一节是关于 word2vec 模型的,可以用来学习词的向量表达,也叫‘word embeddings’。之前写过一篇:word2vec

2017-05-19 23:02:08 8738 1

原创 从 0 到 1 走进 Kaggle

本文结构: - kaggle 是什么 - 如何参赛 - 解决问题一般步骤 - 进一步: - 如何探索数据 - 如何构造特征 - 提交结果kaggle 是什么?Kaggle 是一个数据科学竞赛的平台,很多公司会发布一些接近真实业务的问题,吸引爱好数据科学的人来一起解决。 https://www.kaggle.com/点击导航栏的 competitions 可以看到有很多

2017-05-18 11:47:20 7944 15

原创 机器学习的技术栈及应用实例脑洞

之前写了一篇入门级的学习列表: 简单粗暴地入门机器学习好多小伙伴觉得不太过瘾,今天补充一些脑洞!本文结构:机器学习技术栈职位项目实例1. 机器学习技术栈去知乎上可以搜到很多推荐的学习路线,问题就是太多了,我就先列出一些必需的知识和项目方向,学习还是要一步一步积累的。需要的基础技能:Various level of math, including probability, statistic

2017-05-14 01:15:54 7369 2

原创 简单粗暴地入门机器学习

有很多小伙伴问过我零基础要怎么入门机器学习或者人工智能,今天来提炼一下,方便志同道合的朋友们参考。记得我刚入此山洞准备修炼的时候,就 Google 了好多这类的问题,那时候觉得大家的建议好多呀,这条路看起来真长,那么多东西要学,那么多书要看,那么多有用的课程要学。现在我可以就自己走过的坑坑包包来推荐一条简单粗暴的路径。[step 1: 方向]在行动之前,先想好这几个最基本的问题,如果自己想不全都可以

2017-05-14 01:14:42 35920 14

原创 深度学习与自然语言处理 主要概念一览

CS224d-Day 1:要开始系统地学习 NLP 课程 cs224d,今天先来一个课程概览。 课程一共有16节,先对每一节中提到的模型,算法,工具有个总体的认识,知道都有什么,以及它们可以做些什么事情。简介:1. Intro to NLP and Deep Learning NLP:Natural Language Processing (自然语言处理)的目的,就是让计算机能‘懂得’人类对

2017-05-14 01:13:34 2454 1

原创 详解 TensorBoard-如何调参

什么是 TensorBoardTensorBoard 是 TensorFlow 上一个非常酷的功能,我们都知道神经网络很多时候就像是个黑盒子,里面到底是什么样,是什么样的结构,是怎么训练的,可能很难搞清楚,而 TensorBoard 的作用就是可以把复杂的神经网络训练过程给可视化,可以更好地理解,调试并优化程序。我们在建立神经网络模型解决问题时,例如想要用一个简单的 CNN 进行数字识别时,最想知道

2017-05-12 12:46:11 16736 4

原创 推荐系统

本文结构: 1. 推荐系统 2. 常用方法 1. 简介 2. 模型 cost, gradient 表达式 3. 代码实现 3. 应用实例参考: Coursera-Andrew Ng 的 Machine Learning Sirajology 的 Recommendation Systems - Learn Python for Data Science1. 推

2017-05-02 11:35:07 7607 9

原创 用ARIMA模型做需求预测

本文结构:时间序列分析?什么是ARIMA?ARIMA数学模型?input,output 是什么?怎么用?-代码实例常见问题?时间序列分析?时间序列,就是按时间顺序排列的,随时间变化的数据序列。 生活中各领域各行业太多时间序列的数据了,销售额,顾客数,访问量,股价,油价,GDP,气温。。。随机过程的特征有均值、方差、协方差等。 如果随机过程的特征随着时间变化,则此过程是非平稳的;相反

2017-05-02 11:33:16 10713 1

原创 了解 Sklearn 的数据集

学习资料:大家可以去莫烦的学习网站学到更多的知识。学习资料: 相关代码更多可用数据 网址今天来看 Sklearn 中的 data sets,很多而且有用,可以用来学习算法模型。eg: boston 房价, 糖尿病, 数字, Iris 花。也可以生成虚拟的数据,例如用来训练线性回归模型的数据,可以用函数来生成。例如,点击进入 boston 房价的数据,可以看到 sample 的总数,属性,以及

2017-05-02 11:32:16 8197

原创 Sklearn 快速入门

学习资料:大家可以去莫烦的学习网站学到更多的知识。本文结构:Sklearn 简介选择模型流程应用模型 Sklearn 简介Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.Sklearn 包含了很多种机器学习的方式:Classification 分类Regression 回归Clustering 非监督分类Dimensional

2017-05-02 11:31:16 6681 1

原创 决策树的python实现

本文结构:是什么?有什么算法?数学原理?编码实现算法?1. 是什么?简单地理解,就是根据一些 feature 进行分类,每个节点提一个问题,通过判断,将数据分为几类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶子上。2. 有什么算法?常用的几种决策树算法有ID3、C4.5、CART:ID3:选择信息熵增益最大的featur

2017-05-02 11:30:44 5092 2

原创 通过一个kaggle实例学习解决机器学习问题

之前写过一篇 一个框架解决几乎所有机器学习问题 但是没有具体的例子和代码,今天看到一个不错的 kaggle 上的 code Exploratory Tutorial - Titanic 来解析一下,源码可以直接点这个链接。在这篇文章中可以学到一个完整的运用机器学习解决分析问题的过程,它包括了解决问题的一般流程,描述性统计的常用方法,数据清洗的常用方法,如何由给定的普通变量启发式思考其他影响因素,sk

2017-05-02 11:29:12 11274

原创 机器学习算法应用中常用技巧-2

7. 降维-PCAn_components为降到多少维,用原数据fit后,再用transform转换成降维后的数据。from sklearn.decomposition import PCApca = PCA(n_components = 6)pca.fit(good_data)reduced_data = pca.transform(good_data)reduced_data = pd.

2017-05-02 11:28:35 2324

原创 机器学习算法应用中常用技巧-1

参考:Udacity ML纳米学位1. 取样数据量很大的时候,想要先选取少量数据来观察一下细节。indices = [100,200,300]# 把sample原来的序号去掉重新分配samples = pd.DataFrame(data.loc[indices], columns = data.keys()).reset_index(drop = True)print "Chosen sampl

2017-05-02 11:28:09 2534

原创 特征工程怎么做

在工业应用中,feature 比算法重要,数据比 feature 重要,有很多 kaggle 参赛者分享经验时也是说 feature engineering 很重要,今天来写一写特征工程相关的。本文结构Feature Engineering 是什么有什么用怎么用实际应用1. 是什么参考先用例子来直观地了解一下例如要分析声音,直接拿来数据,是什么都学不到的,需要进行 fourier 变换例如

2017-05-02 11:27:33 4979

原创 一个框架解决几乎所有机器学习问题

上周一个叫 Abhishek Thakur 的数据科学家,在他的 Linkedin 发表了一篇文章 Approaching (Almost) Any Machine Learning Problem,介绍他建立的一个自动的机器学习框架,几乎可以解决任何机器学习问题,项目很快也会发布出来。这篇文章迅速火遍 Kaggle,他参加过100多个数据科学相关的竞赛,积累了很多宝贵的经验,看他很幽默地说“写这样

2017-05-02 11:26:37 24790 13

原创 轻松看懂机器学习十大常用算法

通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。今天的算法如下: 决策树 随机森林算法 逻辑回归 SVM 朴素贝叶斯 K最近邻算法 K均值算法 Adaboos

2017-05-02 11:25:43 22938 23

原创 一个隐马尔科夫模型的应用实例:中文分词

什么问题用HMM解决现实生活中有这样一类随机现象,在已知现在情况的条件下,未来时刻的情况只与现在有关,而与遥远的过去并无直接关系。比如天气预测,如果我们知道“晴天,多云,雨天”之间的转换概率,那么如果今天是晴天,我们就可以推断出明天是各种天气的概率,接着后天的天气可以由明天的进行计算。这类问题可以用 Markov 模型来描述。进一步,如果我们并不知道今天的天气属于什么状况,我们只知道今明后三天的水藻

2017-05-02 11:22:01 2492 1

原创 TensorFlow-7-TensorBoard Embedding可视化

学习资料 https://www.tensorflow.org/get_started/summaries_and_tensorboard今天来看 TensorBoard 的一个内置的可视化工具 Embedding Projector, 是个交互式的可视化,可用来分析诸如 embeddings 的高维数据。 embedding projector 将从你的 checkpoint 文件中读取 em

2017-05-02 11:21:03 17960 9

原创 RNN的高级应用

本文结构:四个问题每个问题是什么应用什么模型模型效果CS224d-Day 11: Recursive neural networks – for different tasks (e.g. sentiment analysis) 课程链接 视频链接 课件链接四个问题这次课主要讲了标准的 Recursive neural networks 模型及其扩展模型在3个问题上的应用和效果,最

2017-05-02 11:20:03 2465 1

原创 用 Recursive Neural Networks 得到分析树

CS224d-Day 10: Recursive neural networks – for parsing 课程链接 视频链接 课件链接本文结构:Recursive NN 是什么Recursive Neural Networks 和 Recurrent Neural NetworksRecursive NN 可以用来做什么怎样做到的算法代码Recursive NN 是什么Re

2017-05-01 12:24:15 3129 2

原创 RNN与机器翻译

CS224d-Day 9: GRUs and LSTMs – for machine translation 视频链接 课件链接本文结构: - 机器翻译系统整体的认识 - 什么是 parallel corpora - 三个模块 - 各模块有什么难点RNN 模型 最简单的 RNN 模型扩展模型GRU:LSTM下面是video的笔记:1.机器翻译机器翻译是NLP问

2017-05-01 12:23:42 6535 2

原创 用 RNN 训练语言模型生成文本

本文结构:什么是 Language Model?怎么实现?怎么应用?cs224d Day 8: 项目2-用 RNN 建立 Language Model 生成文本 课程项目描述地址。什么是 Language Model?Language Model 是 NLP 的基础,是语音识别, 机器翻译等很多NLP任务的核心。参考:实际上是一个概率分布模型 P ,对于语言里的每一个字符串 S 给出一个概率

2017-05-01 12:23:03 8078 1

原创 用深度神经网络处理NER命名实体识别问题

本文结构:什么是命名实体识别(NER)怎么识别?cs224d Day 7: 项目2-用DNN处理NER问题 课程项目描述地址什么是NER?命名实体识别(NER)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,作为结构化信息提取的重要步骤。摘自BosonNLP怎么识别?先把解决问题的逻辑说一

2017-05-01 12:22:12 5830

原创 怎样做情感分析

本文结构:什么是情感分析?怎么分析,技术上如何实现?cs224d Day 7: 项目2-命名实体识别2016课程地址 项目描述地址什么是情感分析?就是要识别出用户对一件事一个物或一个人的看法、态度,比如一个电影的评论,一个商品的评价,一次体验的感想等等。根据对带有情感色彩的主观性文本进行分析,识别出用户的态度,是喜欢,讨厌,还是中立。在实际生活中有很多应用,例如通过对 Twitter 用户的

2017-05-01 12:21:31 2367

原创 word2vec 模型思想和代码实现

CS224d-Day 3:word2vec 有两个模型,CBOW 和 Skip-Gram,今天先讲 Skip-Gram 的算法和实现。课件: https://web.archive.org/web/20160311161826/http://cs224d.stanford.edu/lecture_notes/LectureNotes1.pdfSkip-Gram 能达到什么效果?比如词库里有这么一句

2017-05-01 12:20:58 1961

原创 深度学习的主要应用举例

参考资料今天简单说一下 Deep Leaning 在各领域应用的几个例子,可以轻松地看一下它是怎么用在 Computer Vision,Speech Recognition, Text Processing, Medical, Finance, Advertising 等领域的。Computer VisionImage Classification 图片识别例如下面这个网站:https://www.

2017-05-01 12:13:36 27708 1

原创 对比学习用 Keras 搭建 CNN RNN 等常用神经网络

参考: 各模型完整代码 周莫烦的教学网站 这个网站上有很多机器学习相关的教学视频,推荐上去学习学习。Keras 是一个兼容 Theano 和 Tensorflow 的神经网络高级包, 用他来组件一个神经网络更加快速, 几条语句就搞定了. 而且广泛的兼容性能使 Keras 在 Windows 和 MacOS 或者 Linux 上运行无阻碍.今天来对比学习一下用 Keras 搭建下面几个常用神经网

2017-05-01 12:00:56 8605

原创 CS224d-Day 5: RNN快速入门

CS224d-Day 5: 什么是RNN本文结构:1.什么是 RNN?和NN的区别?2.RNN 能做什么?为什么要用 RNN?3.RNN 怎么工作的?4.RNN 基本模型存在某些问题?5.GRU 和 LSTM 是什么?1.什么是 RNN?和NN的区别?RNN-(Recurrent Neural Networks):循环神经网络传统的神经网络模型,它是有向无环的,就是在隐藏层中各个神经元之

2017-05-01 11:59:58 1516

原创 图解RNN

参考视频RNN-Recurrent Neural Networks本文结构:什么是 Recurrent Neural Networks ? Recurrent Neural Networks 的优点和应用? 训练 Recurrent Neural Networks 的问题? 如何解决? 何时用 RNN 何时用前馈网络呢?什么是 Recurrent Neural Networks ?普通的前馈

2017-05-01 11:58:58 2577 1

原创 用 Tensorflow 建立 CNN

稍稍乱入的CNN,本文依然是学习周莫烦视频的笔记。还有 google 在 udacity 上的 CNN 教程。CNN(Convolutional Neural Networks) 卷积神经网络简单讲就是把一个图片的数据传递给CNN,原涂层是由RGB组成,然后CNN把它的厚度加厚,长宽变小,每做一层都这样被拉长,最后形成一个分类器:如果想要分成十类的话,那么就会有0到9这十个位置,这个数据属于哪一类就

2017-05-01 11:58:20 9168 3

原创 图解何为CNN

参考CNN - Convolutional Neural Networks是近些年在机器视觉领域很火的模型,最先由 Yan Lecun 提出。 如果想学细节可以看 Andrej Karpathy 的 cs231n 。How does it work?给一张图片,每个圆负责处理图片的一部分。 这些圆就组成了一个 filter。 filter 可以识别图片中是否存在指定的 pattern,以及在哪

2017-05-01 11:57:14 1130

原创 神经网络的前世

小长假来听听 NN 的故事吧。本文参考:[这个地址不错](https://www.youtube.com/watch?v=E2Mt_7qked0&index=7&list=PLjJh1vlSEYgvGod9wWiydumYl8hOXixNu ),深入浅出讲深度学习的,推荐感兴趣的朋友看一下。当你听到深度学习,你想到了什么? Deep Learning is about Neural Netwo

2017-05-01 11:56:25 1372

原创 什么是神经网络

本文结构:什么是神经网络什么是神经元神经网络的计算和训练代码实现1. 什么是神经网络神经网络就是按照一定规则将多个神经元连接起来的网络例如全连接(full connected, FC)神经网络,它的规则包括:有三种层:输入层,输出层,隐藏层。同一层的神经元之间没有连接。full connected的含义:第 N 层的每个神经元和第 N-1 层的所有神经元相连,第 N-1 层神经元的输

2017-05-01 11:55:42 1350

原创 神经网络 之 线性单元

本文结构:什么是线性单元有什么用代码实现1. 什么是线性单元线性单元和感知器的区别就是在激活函数:感知器的 f 是阶越函数:线性单元的激活函数是线性的:所以线性模型的公式如下:2. 有什么用感知器存在一个问题,就是遇到线性不可分的数据时,就可能无法收敛,所以要使用一个可导的线性函数来替代阶跃函数,即线性单元,这样就会收敛到一个最佳的近似上。3. 代码实现1. 继承Perceptron,初始化

2017-05-01 11:54:46 2316

原创 神经网络 之 感知器的概念和实现

本文结构:什么是感知器有什么用代码实现1. 什么是感知器如下图,这个神经网络中,每个圆圈都是一个神经元,神经元也叫做感知器只有一个隐藏层的神经网络就能拟合任何一个函数,但是它需要很多很多的神经元。 而深层网络用相对少的神经元就能拟合同样的函数,但是层数增加了,不太容易训练,需要大量的数据。 为了拟合一个函数,可以使用一个浅而宽的网络,也可以使用一个深而窄的网络,后者更节约资源。下图单挑出

2017-05-01 11:54:20 4473

原创 常用激活函数比较

本文结构:什么是激活函数为什么要用都有什么sigmoid ,ReLU, softmax 的比较如何选择1. 什么是激活函数如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function。2. 为什么要用如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合。 如果使用

2017-05-01 11:52:55 7189 2

原创 手写,纯享版反向传播算法公式推导

每次推导公式时,感觉整个世界都安静了下来!学神经网络,那么它的训练利器:反向传播算法,不能不会哦是不是看到这样的公式就头晕脑胀?下面拆解开来,其实就是一个很简单的链索反应呀: 链式求导法则推荐阅读 历史技术博文链接汇总 也许可以找到你想要的

2017-05-01 11:51:52 1654 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除