机器学习
文章平均质量分 92
李龙生的博客
架构师工程师 ,热爱生活,热爱技术,喜欢旅游!
展开
-
机器学习 (一)你真的理解函数式编程吗?
前言 现在机器学习、人工智能的发展趋势如火如萘,很多培训班也在引入大数据、机器学习的课程,受到众多IT从业者的追捧,有一种势必与传统模式一决高下,分享半壁江山之势,如果人工智能走向企业、社会,它带来的经济效益以及影响是巨大的,我们每个人不管从事什么行业都有必要了解一下人工智能的发展趋势,机器学习背后隐藏着什么不可告人的秘密,让我们来揭开层层面纱,一窥究竟。 在面向对象语言满原创 2017-12-31 13:36:27 · 2478 阅读 · 4 评论 -
机器学习 (十七)kaggle竞赛之泰坦尼克号项目实战-2
简介想写这篇博客的由衷是做完几个项目,有时对于图的画法和模型融合算法原理理解还很肤浅,特此加深一下印象,个人随笔。图pandas、matplotlib、seaborn关系matplotlib是python里面最著名的绘图系统,也即最牛逼的绘图系统,seaborn也是封装了matplotlib而成,类似于pandas封装了numpy一样,由此可以想到seaborn的易用性要比matplotl...原创 2018-10-04 16:44:08 · 681 阅读 · 0 评论 -
深度学习 (二)Back Propagation Network
找一个例子实现一遍感知器推导一下BP网络隐藏层节点数如何确定?感知器发展历史?感知器和逻辑回归区别?原创 2018-10-13 16:59:55 · 961 阅读 · 2 评论 -
深度学习 (三)Convolutional Neural Network
What is Deep Learning认识任何事物之前最好了解这一事物在我们的知识认知体系中所处的位置,这样有助于将其归纳到自己的认知体系中,产生联系并编制成类似于知识图谱样的结构,不用记住也不好忘记。从大的方面说深度学习也属于机器学习这个分支科学中的一个学习方法,而其自身起源却是受人类生物神经系统结构的启发,从神经元细胞(树突、轴突)之间如何起作用的模仿,每个神经元是一个线性函数表示,无...原创 2018-10-27 10:54:28 · 607 阅读 · 1 评论 -
深度学习 (四)Keras利用CNN实现图片识别(Mnist、Cifar10)
视觉集视觉数据库是用来提供给图片识别领域用素材,目前各个教材常用的主要有手写数字识别库、10中小图片分类库,详细介绍如下:MnistMNIST(Mixed National Institute of Standards and Technology database)是一个计算机视觉数据集,它包含70000张手写数字的灰度图片,其中每一张图片包含 28 X 28 个像素点。可以用一个二维数字...原创 2018-11-03 22:51:44 · 7326 阅读 · 1 评论 -
深度学习 (五)cbow、skip-gram of word2vec
介绍NPLRules-Based基于统计词向量模型发展处理框架word2vec cbow skip-gram 关系word2vec google 发表C语言版本 linuxGensim python版本支持window句子三种表示方法1 是单词有没有出现的表示法2 表示单词出现次数的表示法3 表示用tf-idf来表示每个单词的值LSTM long short-term...原创 2018-11-14 07:21:51 · 1028 阅读 · 1 评论 -
算法笔记 (七)PriorityQueue 实现 Huffman Tree and code
背景在看word2vec训练模型时发现它在优化cbow模型时采用了哈夫曼编码,不禁勾起了以前的回忆,趁着模糊的记忆,梳理一下哈夫曼树相关内容,在以前的文章介绍了线性表、图等结构,这次我们正好来介绍下树结构。树先来熟悉一下树有关的概念,树先要认识它,它其实也只代表了每个数据节点之间的逻辑关系,每个节点中保存的是数据,数据类型可以多种多样,树代表了数据节点之间的逻辑关系。叶子节点:根节点...原创 2018-11-24 11:42:21 · 617 阅读 · 1 评论 -
让你的正则表达式技能提升的方法 持续更新
练习网址:https://alf.nu/RegexGolf有喜欢正则表达式的朋友可以一起学习。。。明确指定字符串匹配只输入一个确定的字符串,那么将会完全匹配该字符串结尾匹配以啥结尾,k$即以k结尾的字符串另一种方法以什么结尾匹配\b表示非字母或数字,u\b即表示字母u后面不是字母也不是数字匹配次数下图[a-f]表示匹配字母a-f其中任何一个,{4,6}表示匹...原创 2018-12-03 07:56:39 · 477 阅读 · 4 评论 -
深度学习 (六)Long Short Term Memery
简介为什么又出来了RNN模型前面提到的DNN CNN -gram等,他们几乎是没有记忆功能的,如果回答后面问题时如果用到了前面知识,就不好回答,而RNN可以记忆这些信息原理RNNLSTMRNN 和 word2vec的关系例子问题为什么激活函数采用tanhbptt优化rnn核心是隐藏层随笔...原创 2018-12-01 07:37:54 · 570 阅读 · 3 评论 -
积累的优秀博客链接(linux windows android ios c/c++ java ACM open cv LeetCode 数学 算法 前端 机器/深度学习 图形图像加速 )
pudnleetCode刷完的神机器学习数据挖掘基础Linux c/c++大神 目前csdn排名第一名1977出生的大神1977出生的大神1983出生的大神学习能力超强的神,必须向他学习源码分析Android API源码学习过程大叔的奔跑机器学习深度学习深度/机器学习深度/机器学习数学Android and ios趣学算法hook逆向分析ACM j2ee...转载 2018-12-01 09:49:37 · 557 阅读 · 2 评论 -
Leet Code Python版本 持续更新
为什么写这篇博客呢,主要是督促自己能够一直走下去,而不是做一两道题就停止了而已,哈哈。。Two_sum此题核心是利用了map key的不重复性方便了查找,比较简单,不在多说#!/usr/bin/python3import numpy as np"""1. Two SumGiven an array of integers, return indices of th原创 2018-12-03 08:27:38 · 604 阅读 · 3 评论 -
深度学习 (七)Hidden Markov Model
https://blog.csdn.net/zouxy09/article/details/14222605https://www.zybuluo.com/hanbingtao/note/485480https://segmentfault.com/a/1190000011765119http://m.elecfans.com/article/796677.htmlhttp://wiki....原创 2018-12-16 11:39:22 · 4289 阅读 · 2 评论 -
机器学习(十八) 方差、标准差、协方差、协方差矩阵、相关系数
实例计算学习数学理论发现还是懂了理论自己算一算,印象才深刻,记忆才清晰,并且在整理计算过程中会使得想法进一步加深,挖掘出来表面想象够不到的地方。先来看看统计学定义:大意是通过各种研究方法研究某一现象的内在规律,促进科学发展。统计学统计学统计学是关于认识客观现象总体数量特征和数量关系的科学。它是通过搜集、整理、分析统计资料,认识客观现象数量规律性的方法论科学。由于统计学的定量研究具有...原创 2018-12-23 11:53:38 · 1550 阅读 · 4 评论 -
一张图解AlphaGo原理及弱点
近期AlphaGo在人机围棋比赛中连胜李世石3局,体现了人工智能在围棋领域的突破,作为人工智能领域的工作者,我们深感欣慰。其实质是深度学习网络(CNN)跟蒙特卡罗搜索树(MCTS)结合的胜利,是人类智慧的进步。不少所谓的“砖”家开始鼓吹机器战胜人类、甚至人类将被机器统治等无知言论,让人实在看不下去。作为围棋爱好者和人工智能领...转载 2018-12-19 06:41:43 · 1405 阅读 · 2 评论 -
机器学习 (十六)电商O2O优惠券使用预测-2
介绍这篇文章是写了一遍优惠券预测项目,写写感受并进行一个记录总结,零零散散以作为记录整理之用。数据分析利器-pythondataframe操作方法总结copy()submit.head()u8 = utmp.groupby([‘User_id’], as_index = False).median()u8.rename(columns = {‘distance’:‘u_media...原创 2018-10-01 11:35:44 · 2371 阅读 · 1 评论 -
机器学习 (十五) 关联分析之Apriori算法
前言原理总结题外思考原创 2018-06-28 21:05:43 · 759 阅读 · 0 评论 -
机器学习 (三) k-近邻算法应用-约会网站匹配系统
前言 目前一些姻缘网站专门给人介绍对象,也经常有人陷入介绍门中,怎么样来提高准确率降低网站带来的风险呢?其实里面有些推荐算法和匹配算法在里面,今天我们简单介绍其中一种。 大家是否还记得在第一次注册的会员的时候,它会让你填一些年龄、性格、体貌特征选项等等,其实这些都是有用的个人特征数据,网站拿到这些数据之后会根据数据给你匹配最可能适合你的妹子,提高成功率,下面我们就来原创 2018-01-11 08:33:54 · 1234 阅读 · 0 评论 -
机器学习 (五) Logistic Regression 分类器
前言 上一篇文章我们谈了谈基于概率论的分类,这篇我们继续谈论分类问题,这篇讲述的是一种最优化问题,即通过简单计算并不能得出来最终结果,需要一步步来优化求最优值,这种分类方法应用广泛,也是我们必须要熟练掌握的分类算法,它的地位属于十大机器学习算法其中之一,可以说是里面的老大哥人物,不废话进入正题。原理 ...原创 2018-01-25 07:29:00 · 2094 阅读 · 0 评论 -
机器学习 (四) 贝叶斯分类器原理及实战系统
前言 前面介绍的k-近邻分类器有其自身优点也有不足,今天我们介绍下从另一个角度进行分类的算法,它是基于概率论为基础的分类,接触的机器学习算法多了之后也会体会到机器学习是集数学、概率论、统计学、数据挖掘、数据结构与算法等于一身的综合学科,重在根据理论基础来设计不同的算法解决现实生活中的问题,本人在实现每个算法之前会把相关概念也介绍一下,有助于大家理解后面的实现过程,也作为自己的一个随原创 2018-01-17 08:12:14 · 841 阅读 · 2 评论 -
机器学习 (六) 线性回归算法分析概览
前言 前面介绍了回归家族中的逻辑回归,本篇博客我们开始介绍线性回归算法相关的问题,正所谓不同的特征数据有不同的算法来对待,今天我们要研究的这个算法正好是具有线性特征的数据所具有的特征,与前面算法的一个典型特征是由于它输出为连续值,在处理这类问题时当然用线性回归算法是最好的,让我们进入正题了解这一算法的特性。案例 我们以一个预测一个人银行会给他带多少款的例子,银行原创 2018-02-06 08:12:42 · 831 阅读 · 0 评论 -
机器学习 (七) 决策树算法研究与实现
前言 从决策树这三个字中我们既可以看出来它的主要用途帮助决策某一类问题,树是辅助我们来决策用的,如下图一个简单的判断不同阶段人年龄的图: 看到上图是有几个问题的,我们的目的是将左边人分类,首先根据什么属性分类最佳?如何量化角度来识别?从图中也可...原创 2018-02-25 11:07:53 · 871 阅读 · 1 评论 -
机器学习 (八)kaggle竞赛之泰坦尼克号项目实战-1
引言       机器学习算法都是为项目为数据服务的,某一个算法都有它自己的适用范围,以及优势与劣势,研究算法由于平日的日常操练,那么用它去做项目就如同上战场杀敌一样,去发挥它的价值,kaggle就是这样一个刷怪升级的地方,在kaggle里面有无数的妖魔,等级从初级到专家级不等,下面就让我们去尝试一下。套路&nbs原创 2018-03-23 07:53:01 · 7163 阅读 · 0 评论 -
机器学习 (九) 深入浅出贝叶斯-Thomas Bayes
注意:贝叶斯是一个伟大的发明,给人工智能以及社会发展带来了巨大贡献**。引言 随着对贝叶斯的不断应用,对贝叶斯有了从新的认识,以前认为贝叶斯知识用来解决二分类问题,是大错特错发现贝叶斯是一种很厉害的理论,对于现在的人工智能以至于整个统计学都有着巨大贡献,贝叶斯这个人是英国业余数学家,他提出的理论主要是用新产...原创 2018-03-31 20:12:23 · 1442 阅读 · 0 评论 -
机器学习 (十一) SVM-支持向量机
春夜喜雨 好雨知时节,当春乃发生。 随风潜入夜,润物细无声。 野径云俱黑,江船火独明。 晓看红湿处,花重锦官城。前言        周末很多城市下开了雨,下雨中也不乏忙忙碌碌的人们,有的天不亮已经忙碌匆匆,让我想起了杜甫的经典诗词。。。  &nb原创 2018-04-23 07:16:11 · 492 阅读 · 1 评论 -
机器学习 (十) 优化算法利器之梯度下降(Gradient Descend)
理解:机器学习各种算法的求解最终出来的几乎都是求解最优模型参数的优化问题。前言 在优化问题领域有些很多优秀思想和算法,从约束条件分类 分为无约束条件的优化和有约束条件的优化问题,有约束条件优化分支里面又分为了等式约束条件和不等式约束条件,想不想逐一了解一下,本篇博客让我们一起来看一下无约束条件的算法之一,叫...原创 2018-04-19 20:11:31 · 1539 阅读 · 1 评论 -
机器学习 (十二)让你轻松理解K-means 聚类算法
前言你还记得菜市场卖菜的吗?书店卖书的或者是平时去超市买东西时的物品,它们是不是都根据相似性摆放在一起了呢,饮料、啤酒、零食分布在各自区域,像这样各级事物的相似特点或特性组织在一起的方法,在机器学习里面即成为聚类,感觉是不是很简单呢,我们先以一个实例聚类来观察一下,有一个直观的感觉。NBA球员分析下面我们先来通过一个例子看一下如何使用聚类,先使用sklearn封装好的方法通过这个分...原创 2018-05-09 12:12:00 · 7871 阅读 · 9 评论 -
深度学习 (一)计算机如何处理和识别图片揭秘
为什么要有特征工程?特征工程流程Sklearn处理总结题外思考原创 2018-05-27 11:49:51 · 18597 阅读 · 9 评论 -
机器学习 (十四)轻松理解模型评价指标
篇首语模型评估指标 范数的理解 距离和L0 L1 L2有啥联系?总结题外思考原创 2018-05-31 21:50:28 · 1506 阅读 · 0 评论 -
数学系列 (二)自然数、分数、小数、算数、代数
从未开化到文明数的黎明一一对应分割而不变数的语言数词的发展手指计算器金字塔二十进制十二进制六十进制定位与0的祖先多少个和多少用单位测量连续量的表示方法分数的意义折叠和扩展分数的比较分数的加法和减法乘法的扩大解释乘减少,除增大小数的意义分数和小数循环小数和分数非循环小数加减和乘除数学与现实世界正和负新数的名称负的符号正和负的加法减法运算...原创 2019-04-09 06:50:03 · 2035 阅读 · 0 评论