图解AI-CSDN博客

原创 [机器学习库]机器学习库Sklearn详解

原文:http://scikit-learn.org/stable/modules/linear_model.html#logistic-regression章节1. 广义线性模型 2. 线性与二次判别分析 3. 核岭回归 4. 支持向量机 5. 随机梯度下降

2017-03-16 17:33:44 6208 3

翻译 [机器学习]基于python的机器学习库Sklearn-01

英文原文:http://scikit-learn.org/stable/modules/linear_model.html#logistic-regression1.1 广义线性模型以下介绍的方法均是用于求解回归问题,其目标值预计是输入值的一个线性组合.用数学语言表示: 假设y是预测值,则有: 在本节中,称向量:为系数. 若要讲通用的线性模型用于分类问题,可以参考Logistic回归1.

2017-03-16 16:49:08 4910 2

在现今的推荐技术和算法中，最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题.1. 什么是推荐算法推荐算法最早在1992年就提出来了，但是火起来实际上是最近这些年的事情，因为互联网的爆发，有了更大的数据量可以供我们使用，推荐算法才有了很大的用武之地。最开始，所以我们在网上找资料，都是进yahoo，然后分门别类的点进去，找到你想要的东西，这是一个人工

2017-03-15 22:04:17 12924 6

原创 [深度学习]人工神经网络中激励函数作用详解

前言业余时间,看了关于深度学习方面的知识,对人工神经网络中激励函数存在疑惑,查阅资料,总结给大家,一起学习.激励函数作用不使用激励函数的话，神经网络的每层都只是做线性变换，多层输入叠加后也还是线性变换。因为线性模型的表达能力不够，激励函数可以引入非线性因素。其实很多时候我们更想直观的了解激励函数的是如何引入非线性因素的。通俗的理解就是因为, 现实并没有我们想象的那么美好, 它是残酷

2017-03-15 16:16:50 13009 5

翻译 [机器学习实战]使用 scikit-learn 预测用户流失

客户流失“流失率”是描述客户离开或停止支付产品或服务费率的业务术语。这在许多企业中是一个关键的数字，因为通常情况下，获取新客户的成本比保留现有成本（在某些情况下，贵5到20倍）。因此，了解保持客户参与度是非常宝贵的，因为它是开发保留策略和推出旨在阻止客户走出门的运营实践的合理基础。因此，公司越来越感兴趣开发更好的流失检测技术，导致许多人寻求数据挖掘和机器学习以获得新的和创造性的方法。这是一篇关于使用

2017-03-14 22:19:08 14480 15

原创 [机器学习]基于TextBlob简单文本情感分析

该文章介绍如何使用TextBlob创建自己的文本分类系统。如果已经安装TextBlob,需要更新则需要运行：$ pip install -U textblob nltk如果第一次安装TextBlob，你可能需要下载必要的NLTK语料库。命令：$ curl https://raw.github.com/sloria/TextBlob/master/download_corpora.py | pyt

2017-03-14 21:18:23 21904 9

原创 [机器学习篇]机器学习知识总结篇

1、机器学习的数学基础1 - 数学分析机器学习的一般方法和横向比较数学是有用的：以SVD为例机器学习的角度看数学复习数学分析直观解释常数e 导数/梯度随机梯度下降 Taylor展式的落地应用 gini系数凸函数 Jensen不等式组合数与信息熵的关系2、机器学习的数学基础2 - 概率论与贝叶斯先验概率论基础

2017-03-08 22:36:48 11757 11

原创 [机器学习篇]基于Python机器学习常用库

Python常用的机器学习库Python在科学计算中用途广泛：计算机视觉、人工智能、数学、天文等。它同样适用于机器学习也是意料之中的事。这篇文章就列举并描述Python的最有用的机器学习工具和库。这个列表中，我们不要求这些库是用Python写的，只要有Python接口就够了。我们的目的不是列出Python中所有机器学习库(搜索“机器学习”时Python包索引(PyPI)返回了139个结果)，

2017-03-07 16:53:37 9090 6

转载 [机器学习]机器学习之Python之NumPy数学库的介绍

NumPy-快速处理数据¶标准安装的Python中用列表(list)保存一组值，可以用来当作数组使用，不过由于列表的元素可以是任何对象，因此列表中所保存的是对象的指针。这样为了保存一个简单的[1,2,3]，需要有3个指针和三个整数对象。对于数值运算来说这种结构显然比较浪费内存和CPU计算时间。此外Python还提供了一个array模块，array对象和列表不同，它直接保存数值，和C语言的一维数组

2017-03-02 17:40:03 6075

转载 [机器学习篇]基于Scikit learn库中KNN,SVM算法的笔迹识别

前言这里介绍，如何运用Scikit learn库中的KNN，SVM算法进行笔迹识别。数据说明：数据共有785列，第一列为label，剩下的784列数据存储的是灰度图像(0~255)的像素值 28*28=784安装scikit learn库看了很多安装教程，都没有安装成功。最后参考了官方网站的安装文档，只需要一步步照着做下来就能成功安装scikit learn 安装文档函数介绍

2017-03-02 13:10:38 7628 2

原创 [详解机器学习篇]详解回归基础方法之最小二乘法曲线拟合

前言总结下回归算法中用到最多和最常用的方法:最小二乘法最小二乘法官方解释最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。通过这段描述可以看出来，最小二

2017-03-02 12:43:27 9386 1

原创 [js模块规范]总结JS模块规范CommonJS,AMD,CMD区别

前言1.CommonJS规范 CommonJS就是为JS的表现来制定规范，因为js没有模块的功能所以CommonJS应运而生，它希望js可以在任何地方运行，不只是浏览器中。 CommonJS能有一定的影响力，我觉得绝对离不开Node的人气，不过喔，Node，CommonJS，浏览器甚至是W3C之间有什么关系呢，我找到了个贴切的图：|—————浏览器—– ——————|

2017-02-28 17:11:07 5000 1

原创 [详解机器学习]机器学习之认知篇

前言接下来时间给大家系统讲讲,机器学习-深度学习–大数据分析相关知识,为了自己系统学习,同时也分享给大家一起学习! 主要内容 1.机器学习的种类 2.机器学习的任务分类 3.机器学习的方法 4.机器学习模型汇总1.机器学习的种类这里给大家介绍一下机器学习的种类,主要是根据处理的数据种类不同,可以把机器学习分为:1.1 监督学习1)官方解释监督学习就是分类，通过已

2017-02-28 13:13:59 6309 6

原创 [机器学习]详解分类算法--决策树算法

前言算法的有趣之处在于解决问题,否则仅仅立足于理论,便毫无乐趣可言; 不过算法的另一特点就是容易吓唬人,又是公式又是图标啥的,如果一个人数学理论知识过硬,静下心来看,都是可以容易理解的,纸老虎一个,不过这里的算法主要指的应用型算法;但是那些证明和研究算法理论堪称大牛. 现在给大家介绍一下分类算法中最常用的一种算法–决策树算法决策树原理决策树（decision tree）是一

2017-02-18 20:30:54 6356 2

原创 [机器学习]利用KNN算法进行验证码识别

文章:用KNN来进行验证码识别前言对那些及其简单的验证码,可以用KNN算法来破解,这里整理了一个思路,可以了解了解.那么KNN算法原理是什么呢?KNN原理 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类

2017-02-17 12:32:09 10620 6

转载 [机器学习]漫谈随机森林算法

目录1 什么是随机森林1.1 集成学习1.2 随机决策树1.3 随机森林1.4 投票2 为什么要用它3 使用方法3.1 变量选择3.2 分类3.3 回归4 一个简单的Python示例结语前言：随机森林是一个非常灵活的机器学习方法，从市场营销到医疗保险有着众多的应用。它可以用于市场营销对客户获取和存留建模或预测病人的疾病风险和易感性。随机森林能够用于分类和回归问题，可以处理大量特征

2017-02-16 11:47:31 6005 2

原创 [机器学习]基于spark框架的scala语言MAC环境的安装

scala语言介绍Scala 是 Scalable Language 的简写，是一门多范式的编程语言,scala作为spark的开发语言.具体安装步骤:第一步:下载scala官网安装包scala-2.12.1下载地址第二步:解压下载好的安装包直接双击解压第三步:把解压后的文件夹放到/usr/local/share/目录下第四步:修改配置文件在配置文件的末尾加上一句文件路径强制保存退出(:wq

2017-02-06 17:48:49 4833

翻译 [机器学习]二分k-means算法详解

二分k-means算法二分k-means算法是分层聚类（Hierarchical clustering）的一种，分层聚类是聚类分析中常用的方法。分层聚类的策略一般有两种：聚合。这是一种自底向上的方法，每一个观察者初始化本身为一类，然后两两结合分裂。这是一种自顶向下的方法，所有观察者初始化为一类，然后递归地分裂它们二分k-means算法是分裂法的一种。1 二分k-means的步骤

2017-02-05 21:00:05 15646 10

原创 [机器学习]如何用机器学习来判定红楼梦后40回是否曹雪芹所写

前言今天在涉机器学习相关知识时,看到黎晨这篇文章,觉得蛮有意思的,拿来这里介绍大家.这里判定的维度越多越精准,下面判定仅供参考,仅供娱乐学习!判定整体思路主要从以下几个方面可以进行粗略进行判定:1.写作习惯每个人写作都有一些与种不同的小习惯,这些小习惯并不会轻易就会发生改变;万分之一的例外情况不考虑!2.词频统计就像每次领导人开会一样,媒体或政客们都会去统计领导人讲话中出现的高频词汇,

2017-01-19 15:30:40 8981 23

翻译 [人工智能]基于Spark机器学习之决策树实现

决策树1 决策树理论1.1 什么是决策树所谓决策树，顾名思义，是一种树，一种依托于策略抉择而建立起来的树。机器学习中，决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表的某个可能的属性值，从根节点到叶节点所经历的路径对应一个判定测试序列。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。1.2 决策树学习流

2017-01-19 10:51:08 6993

转载 [大数据]大数据框架Hadoop和Spark的异同

转载地址: http://mp.weixin.qq.com/s?__biz=MjM5ODE1NDYyMA==&mid=2653381212&idx=2&sn=be85119297e51e8764e1e8ac8b189680&scene=21#wechat_redirect 谈到大数据，相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上，并

2017-01-19 10:05:29 4884 2

翻译 [Spark机器学习]基于Spark 2.0 机器学习之推荐系统实现

1 什么是ALS ALS是交替最小二乘（alternating least squares）的简称。在机器学习中，ALS特指使用交替最小二乘求解的一个协同推荐算法。它通过观察到的所有用户给商品的打分，来推断每个用户的喜好并向用户推荐适合的商品。举个例子，我们看下面一个8*8的用户打分矩阵。这个矩阵的每一行代表一个用户（u1,u2,…,u8）、每一列代表一个商品（v1,v2,…,v8）、用户的

2017-01-18 16:15:05 16491 11

翻译 [HTML5点滴]客户端存储那些事

客户端存储译者：文蔺原文：http://www.html5rocks.com/en/tutorials/offline/storage/客户端存储介绍本文是关于客户端存储（client-side storage）的。这是一个通用术语，包含几个独立但相关的 API： Web Storage、Web SQL Database、Indexed Database 和 File Access。

2017-01-18 09:05:30 4944

翻译 [HTML5点滴]web之HTTP 推送那些事

译者：文蔺原文：https://blog.yoav.ws/being_pushy/上周我在斯达哥尔摩住了几天，出席了 HTTP 研讨会，参与了不少吸引人的讨论。其中一次是关于 HTTP 推送及其优缺点、早期实验结果的。由于早期实验部署结果不那么理想，人们对 HTTP 推送大体持着怀疑态度，不过我想分享下自己更乐观一些的观点。HTTP 推送能做哪些预加载不能做的事？从怀疑者那里一再听到的观点

2017-01-18 09:02:07 5029

原创 [机器学习]主流深度学习框架和通用机器学习框架对比

目录深度学习框架 1.Theano & Ecosystem 2.Torch 3. Tensorflow 4. Caffe 5. CNTK 6.DSSTNE 7.Speed机器学习框架 1.sci-kit learn 2.Apache Mahout 3.SystemML 4.Microsoft

2017-01-17 09:28:40 15052 1

原创 [机器学习]KNN算法的理解与具体实现

K Nearest Neighbor算法又叫KNN算法，这个算法是机器学习里面一个比较经典的算法，总体来说KNN算法是相对比较容易理解的算法。其中的K表示最接近自己的K个数据样本。KNN算法和K-Means算法不同的是，K-Means算法用来聚类，用来判断哪些东西是一个比较相近的类型，而KNN算法是用来做归类的，也就是说，有一个样本空间里的样本分成很几个类型，然后，给定一个待分类的数据，通过计算接

2017-01-17 00:55:04 6013 6

原创 [CSS点滴]标签嵌套规则

基本嵌套规则 1.body可以直接包含块状元素、ins、del、script。不可以直接包含行内元素 2. ins和del（行内元素）可以包含块状元素或者行内元素，其他任何行内元素都不允许包含块状元素 2. p、h1-h6可以直接包含行内元素和文本信息，但是不允许包含块状元素 3. dl元素只允许包含dt和dd，同时dt不能包含块状元素，只允许包含行内元

2017-01-16 22:18:22 4642

原创 [深度学习]利用Keras深度学习框架和卷积神经网络玩FlappyBird

亲测可以玩!前言该项目通过卷积神经网络加Q-learning算法，利用Keras框架共210行代码实现了让程序自己学习如何玩耍FlappyBird。安装依赖库pip install keraspip install pygamepip install scikit-imagepip install h5py如果mac电脑没有安装pip命名,先安装该命令 pip install --upgrad

2017-01-16 11:25:56 9079

原创 [算法]直线与圆的交点程序设计

/** * Created by apple on 2017/1/15. *///求直线与圆的交点/*函数参数说明: cx:圆X轴坐标 cy:圆y轴坐标 r:圆半径 stx:起点直线的X轴坐标 sty:起点直线的轴坐标 edx:终点直线的X轴坐标 edy:终点直线的Y轴坐标返回值:交点坐标(x,y)*/function getPoint(cx,cy,r

2017-01-15 19:44:57 17191 3

原创 [JavaScript点滴]12个有关于JavaScript的小技巧

原文: http://www.w3cplus.com/javascript/12-extremely-useful-hacks-for-javascript.html?f=tt 在这篇文章中将给大家分享12个有关于JavaScript的小技巧。这些小技巧可能在你的实际工作中或许能帮助你解决一些问题。使用!!操作符转换布尔值有时候我们需要对一个变量查检其是否存在或者检查值是否有一个有效值，

2017-01-15 13:53:34 4626 2

原创 [机器学习]机器学习的框架偏向于Python原因

前言主要有以下原因:1. Python是解释语言，这让写程序方便不只一点。举例来说，在C等编译语言里写一个矩阵乘法，需要自己分配操作数（矩阵）的内存、分配结果的内存、手动对BLAS接口调用gemm、最后如果没用smart pointer还得手动回收内存空间。Python几乎就是import numpy; numpy.dot两句话的事。当然现在很多面向C/C++库已经支持托管的内存管

2017-01-11 22:07:27 21745 11

原创 [数据库设计]如何合理和有效的进行数据库设计

前言通常情况下，可以从两个方面来判断数据库设计的是否规范: 1)一是看看是否拥有大量的窄表窄表往往对于OLTP比较合适，符合范式设计原则 2)宽表的数量是否足够的少。所谓的宽表就是字段比较多的表，包含的维度层次比较多，造成冗余也比较多，毁范式设计，但是利于取数统计若符合这两个条件，我们可以说数据库设计的比较好.当然这是两个泛泛而谈的指标。为了达到数据库设计规范化的要

2017-01-08 21:31:37 10032 4

原创 [前端优化]webAPP优化总结

一前言在公司做过项目都知道,一款产品性能的优化非常重要,同时也是体现个人技术能力. 之前一直做算法,随后在公司做平台软件及后台,一个产品开发好-上线,优化一直伴随着整个过程,之前在公司做的一款平台软件,从上线到最终的稳定几乎花了一年时间,其中大部分都在做系统的优化. 优化的前提是软件的业务架构和数据设计的比较好,否则只能推到重来.所以产品的架构和数据库的设计很重要.

2017-01-05 14:21:26 11191 1

原创 [机器学习(转)]转AI方向应该注意什么

普通程序员如何转向AI方向 <div class="postBody"> <div id="cnblogs_post_body"><p class="p">　　眼下，人工智能已经成为越来越火的一个方向。普通程序员，如何转向人工智能方向，是知乎上的一个<a href="https://www.zhihu.com/question/510394

2017-01-05 11:07:27 7397 3

转载 [人工智能]深入浅出机器学习

从机器学习谈起参考:http://www.cnblogs.com/subconscious/p/4107357.html 　　在本篇文章中，我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习，并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇，从这里开始

2017-01-05 10:49:43 8724 15

转载 [后端服务]后端程序健壮性几点思考

参考文章:http://www.cnblogs.com/LBSer/p/4753112.html 　　对每一个程序员而言，故障都是悬在头上的达摩克利斯之剑，都唯恐避之不及，如何避免故障是每一个程序员都在苦苦追寻希望解决的问题。对于这一问题，大家都可以从需求分析、架构设计、代码编写、测试、code review、上线、线上服务运维等各个视角

2017-01-04 10:29:31 7566 2

转载 [数据库]mysql死锁问题分析

线上某服务时不时报出如下异常（大约一天二十多次）：“Deadlock found when trying to get lock;”。 Oh, My God! 是死锁问题。尽管报错不多，对性能目前看来也无太大影响，但还是需要解决，保不齐哪天成为性能瓶颈。为了更系统的分析问题，本文将从死锁检测、索引隔离级别与锁的关系、死锁成因、问题定位这五个方面来展开讨论。图1 应用日志1

2017-01-04 08:13:58 6101

转载 [接口设计]从客户端的角度设计后端的接口

前言兵马未动，粮草先行。在一款APP产品的各个版本迭代中，兵马的启动指的是真正开始敲代码的时候，粮草先行则是指前期的需求，交互，UI等评审准备阶段，还有本文要说的接口的设计与评审。虽然很多时候一个api接口的业务，数据逻辑是后端提供的，但真正使用这个接口的是客户端，一个前端功能的实现流程与逻辑，有时候只有客户端的RD才清楚，从某种意义来说，客户端算是接口的需求方。所以建议在前期接口设计和评审时，客

2017-01-04 08:05:45 11404 1

原创 [nodeJS]Node.js到底是什么?

来自：bestswifter - 简书链接：http://www.jianshu.com/p/59e59acde382这是一个移动端工程师涉足前端和后端开发的学习笔记，如有错误或理解不到位的地方，万望指正。Node.js 是什么传统意义上的 JavaScript 运行在浏览器上，这是因为浏览器内核实际上分为两个部分:渲染引擎和 JavaScript 引擎。前者负责渲染 HTML + CSS，后者

2017-01-03 21:29:24 5474

原创 [nodeJS篇]nodeJS之02-模块详解

模块编写稍大一点的程序时一般都会将代码模块化。在NodeJS中，一般将代码合理拆分到不同的JS文件中，每一个文件就是一个模块，而文件路径就是模块名。在编写每个模块时，都有require、exports、module三个预先定义好的变量可供使用。requirerequire函数用于在当前模块中加载和使用别的模块，传入一个模块名，返回一个模块导出对象。导入外部模块的路径需要注意:1)模块名可使用相对路径

2017-01-03 01:12:37 4986