CodeCops-CSDN博客

原创深度机器学习的能力模型

简书首发，这里重发。请注意一下题目，我在这里谈论的范畴是深度机器学习，换句话说，线性回归（LR），逻辑回归（LR），支持向量机（SVM），K-Means，决策树（DT），随机森林（RT），主成分分析（PCA）等等机器学习并不在这个讨论之列，只有以仿真动物脑神经结构的卷积神经网络（CNN），循环神经网络（RNN），全连接神经网络（FCN）以及它们之间各种组合，变种在此讨论之列，这是个非常

2016-12-09 09:00:22 627

原创人工智能新解

首发在简书人工智能新解，这里重发。风口里的猪说，如今创业不谈人工智能如同当年创业一定要谈互联网一样。但是人工智能的引入成本高昂，不是谁都承担得起。你看，传统定义下的人工智能包含了计算机视觉，声音处理，传感器处理，自然语言处理，知识处理(知识表征，推理引擎，机器学习，专家系统等)，哪一个方面都是需要高超算法和软硬件人才，还要加上昂贵的运算力。而现在普遍认为机器学习的主力方向，深度学习，C

2016-12-09 08:58:25 411

翻译 Tensorflow之旅

第一部分第二部分第三部分第四部分第五部分这是我最近翻译的一篇论文。最近，我在照猫画虎一个基于CNN的文本分类器时候，然后卡在训练好模型之后的推断上，所以找一篇论文来翻译，顺便理顺一下思路，最先发在简书了，由于太长，这里只放链接了。

2016-12-09 08:56:12 453

转载文本数据的机器学习自动分类方法(下)

原文链接：http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data-part2编者按】：随着互联网技术的迅速发展与普及，如何对浩如烟海的数据进行分类、组织和管理，已经成为一个具有重要用途的研究课题。而在这些数据中，文本数据又是数量最大的一类。以统计理论为基础，利用机

2016-11-25 15:13:46 1001

转载文本数据的机器学习自动分类方法(上)

原文链接：http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data 编者按】：随着互联网技术的迅速发展与普及，如何对浩如烟海的数据进行分类、组织和管理，已经成为一个具有重要用途的研究课题。而在这些数据中，文本数据又是数量最大的一类。以统计理论为基础，利用机器学习算法

2016-11-25 15:06:30 1075

原创学习《Automatic Text Categorization by Unsupervised Learning》笔记

目前主流的文本分类都是通过一些预先定义好的打标数据来对新文本进行分类。而且，文本分类的精确程度，往往是取决于打标数据的多少和分类质量。这就有点鸡生蛋，蛋生鸡的味道了。要是我们话费巨量时间去打标数据，还需要机器干嘛。更多时候，我们的数据可能还很奇怪，打标的分类并不是均衡的，生成打标数据很有困难。这篇Ko Young Joong和Seo Jung Yun合写的文章正是针对这个困难，提出了一种他们认为比

2016-11-17 14:02:09 460

转载主流深度学习框架对比：看你最适合哪一款？

选自deeplearning4j.org机器之心编译作者：Aäron van den Oord、Heiga Zen、Sander Dieleman参与：吴攀、李亚洲目录Theano & EcosystemTorchTensorflowCaffeCNTKDSSTNESpeedDL4J: Why the JVM?DL4S: Deep Learning in Scal

2016-09-14 23:42:27 3426

原创对于新加坡寨卡病毒传播的预测（2016.9.9）

我希望能够通过收集到的公共信息和使用计算机分析来预测寨卡病毒未来在新加坡的传播和发展情况。本文只是我玩预测的一个练习，对于结果不负任何责任。

2016-09-09 10:09:55 697

翻译菲利普－泰特洛克的超预测速成课程（如何玩预测）

原文在这里：点击打开链接Philip Tetlock（菲利普泰特洛克）是超预测创始人，也是本课程的讲师。“如果简单的通过度量能够提高预测的结果和能力，那么为什么不把度量作为一种标准实践呢？这个问题的答案很大程度是在心理上让我们相信我们可以知道我们不知道的事物。几个世界以来，它阻碍了医学的进步。当医生承认他们的经验和判断对于病情的诊断是不可靠的时候，他们才转而使用科学实验，从而快速

2016-09-07 10:03:33 635

翻译菲利普－泰特洛克的超预测速成课程（目录）

原文链接：点击打开链接欢迎来到超预测速成课程，它服务于 GJOpen™ Forecasting Tournament.课程模块如何玩预测？预测计分的详细规则速成课程第一课：关于评估预测准确度的那些事第二课：那些不必要对立争论背后的思维第三课：反常的历史

2016-09-07 00:12:18 556

原创 2016-09-06 预测的艺术

预测从理论上不可能100%，除非有穿越时间的能力，但是可以无限接近正确的答案。因此，预测的度量往往在于单次预测的准确度和多次预测的准确度的稳定性。预测的准确度的实际意义并不大，因为在多次预测这种对于实际应用的场景下，预测的稳定性更能够凸显已有信息和预测结果之间的关联关系已经被揭示。所以，追求预测的稳定性要比单纯的追求预测的准确性更有实际价值。预测的行为要注重准确度的稳定，而预测的对象也

2016-09-06 23:23:02 381

原创 tensorflow的OS X构建机器学习环境

因为tensorflow的模型越来越丰富，发展越来越迅速，所以有必要搭建这样的实验环境。1. 首先需要把tensorflow的代码下载下来。git clone https://github.com/tensorflow/tensorflow2. 保证安装bazel和SWIG。brew install bazel swig3. 配置安装脚本，确认python版本和路径，是

2016-09-04 20:41:41 493

转载关于初学深度学习还没被说烂的事情

这是一篇在图灵机器人看到的文章，我觉得和我自己的感受高度相似，所以转载过来，不管你信不信，我不是拷贝和粘贴过来，而是一个字一个字的输入的，因为我觉得细细品味一遍是很有必要的，同时我也纠正了原文中的错字和一些我认为错误的术语。作者：头条号 / 图灵机器人链接：http://toutiao.com/a6324441583286862081/来源：头条号（今日头条旗下创作平台）著作权

2016-09-01 21:11:59 1234

原创 Django在OS X下的编程实战（四）－构建社交网站

Django的优势在于构建很多整套应用的数据模型，显示模版和响应事件能力，这一次我们来体会一下社交网站。如果大家看了之前的文章，就知道我们需要通过虾面的命令创建一个社交网站项目。在settings.py里面的INSTALLED_APPS部分增加account。source activate myenvmkdir bookmarksdjango-admin startproj

2016-08-31 13:35:50 662

原创 Django在OS X下的编程实战（三）－构建博客的高级功能

在之前的两篇文章Django在OS X下的编程实战（一）构建一个博客系统和Django在OS X下的编程实战（二）操作博客数据模型主要利用Django的应用模版很快的构建了一个博客系统，大部分都是使用的模版内生的功能。这一篇主要开始大规模定制模版，实现更高级和定制化的功能。使用电子邮件分享博客文章。根据各种博客的共同特征，这个功能要实现包涵了

2016-08-29 20:33:42 852

原创 MacbookPro OS X EI Captain下编译Chrome源代码

这是一个老话题了，但是我重新来出来是因为一个重要的原因。浏览器是互联网客户端的全部意义，在机器学习的大背景下，如果用机器去互联网冲浪，最好的办法就是改造一个浏览器，深度定制Chrome是一个最好的选择，毕竟tensorflow也是谷歌家的。

2016-08-28 21:08:51 793

原创 Django在OS X下的编程实战（二）操作博客数据模型

第一篇最后想略过的部分，被很多人追着问，我反复解释还不如写出来。顺着上次的博客系统和数据模型继续写。这一篇的主题就是针对数据模型进行操作。

2016-08-26 21:12:11 1065

转载如何自学成为“数据挖掘”的高手

对比我自己过去两年的学习和实践，我自己觉得不一定要全部看完入门，完全可以在某一个方向上面深入，包括一些数学知识，也是遇到了就去看，所以一些看上去很简单的算法和饮用，可能要花很长时间才能读通。可是，你第二次再遇到类似的算法，你就会很快领会。如果你是菜鸟：1.读书学习：a.《Introduction to Data Mining》，这本书很浅显易懂，没有复杂高深的公式，很合适入门的

2016-08-26 21:02:37 656

原创 Django在OS X下的编程实战（一）构建一个博客系统

废话少说，直奔主题，你要做事之前需要有一台电脑，最好是Linux或者OS X，因为我在Macbook pro下工作，所以至少这里的命令都在OS X下运行通过的。所有代码都是单独一行方便你拷贝。Python代码会有>>>的提示，除此之前，没有特别提示都是在命令行窗口进行，这里也不去关心你的系统权限问题，su或者sudo的事情，请自行搞定。

2016-08-25 15:09:04 1314

转载在Jupyter Notebook里面写Python代码和数学公式

一篇干货，但是排版很差，我先转过来，然后慢慢完善。

2016-08-22 10:27:19 25247 1

原创机器学习（二）－一个最简单的线性分类模拟人脑神经工作

机器学习和传统算法不同的关键在于，传统算法依靠固定的算法来处理数据，因此，算法对于数据而言，逻辑是固定的。机器学习的做法是算法是框架，需要训练数据形成逻辑，再通过逻辑去识别，判定和预测新的，或者测试数据。这里的框架算法构成是模拟人脑的神经系统，分成输入（树突），神经处理（神经细胞），输出（轴突终端）。

2016-08-21 22:07:54 1782

原创机器学习（一）－基本概念，学习过程和工具

写在前面的话：从2014年到现在，从大数据到机器学习，从技术到算法，从软件到硬件，两年多的时间，我对于计算机行业，或者说信息产业面临的一个重大转折－人工智能的认识，也是越来越清晰。因此，我觉得有必要梳理自己的机器学习过程，既是反思也是积累，也希望在这个过程中有一些新东西。本着这个原则，我用我自己的话把有关机器学习的知识，经验，技能和感悟，写在这里。有任何不当之处，敬请指正。

2016-08-21 00:17:25 1011

机器学习只有配合人脑才能快速投入实战