自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI深入浅出

专注于机器学习、自然语言处理、图像识别等领域,分享最新的领域前沿消息,数据处理、机器学习等技术以及在行业中的应用场景。欢迎同道中人关注交流~

  • 博客(19)
  • 收藏
  • 关注

转载 利用Python进行数据分析之Numpy

写在前面无论是计算机视觉、自然语言处理,还是语音识别等,虽然处理的非结构化数据形态不同,有图像、文本、语音等,但是本质都是数据。比如美团上一段评论可以被处理为一张词频表,而这张词频表就可以用于情感分析。大部分数据集被转化为更加适合分析和建模的结构化形式,更或者将数据集的特征提取为某种结构化形态。现在大数据、人工智能这么火,几乎各行各业都会提智能化,会提我们的某某产品里集

2017-11-30 00:00:00 872

转载 机器学习之聚类算法——K-Means算法

欢迎观临AI驿站~愿分享 共成长前面的算法中的一个显著特征就是我的训练数据中包含了标签,训练出的模型可以对其他未知数据预测标签。在下面的算法中,训练数据都是不含标签的,而算法的目的则是通过训练,推测出这些数据的标签。这类算法有一个统称,即无监督算法(前面有标签的数据的算法则是有监督算法)。无监督算法中最典型的代表就是聚类算法。让我们还是拿一个二维的数据来说,某一个数

2017-11-29 00:00:00 1246

转载 机器学习之理解支持向量机SVM

愿分享共成长    点击上方蓝字关注             平时都是直接使用现成的libsvm,虽然对于SVM原理理解有一定的难度,但是仍然试着知其然,亦知其所以然。本文主要是SVM的概念性的分享。基本概念支持向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表

2017-11-26 00:00:00 495

转载 自然语言处理入门资料推荐

最近几个月小编遨游在税务行业的智能问答调研和开发中,里面涉及到了很多的自然语言处理NLP的功能点。虽然接触NLP也有近两年的时间了,现在真正要应用到问答中,避免不了还是需要再重新熟识并深入研究理解。下面是与NLP相关的一些书籍推荐、课件推荐和开源工具推荐。主要是记录下入门的资料,由于资料的存储位置没有做规整,所以本文没有附带资源下载链接。如果有同学需要其中的资源,可以在公众

2017-11-26 00:00:00 1541

原创 机器学习之朴素贝叶斯分类器

没有最好的分类器,只有最合适的分类器。最广泛的分类模型,除了“机器学习算法之决策树”里分享的决策树模型(Decision Tree Model)之外,还有一种十分常见的分类模型,即朴素贝叶斯模型(Naïve Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很

2017-11-23 00:00:00 663

原创 数据科学与机器学习引领持续创新

11月16日~17日参加IBM的Modeler机器学习最佳实践,与会过程中了解到了机器学习的前沿信息。善良是一种信仰,不是看见了才相信,而是相信了就会看见。欢迎转发到朋友圈或分享给好友

2017-11-22 00:00:00 309

原创 英文智能问答之OpenEphyra

聊天机器人相信大家对于这个并不陌生,苹果手机Siri,百度的小度,小I机器人,虽然智能程度不同,但是关于智能问答已经走入了国人的眼中,扑面而来。今天的互联网上,已出现“比利”、“艾丽斯”等聊天机器人等,中文的如“白丝魔理沙”、“乌贼娘”等由网友制作的聊天机器人。聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序。Chatterbots已应用于在线互动游戏Tinymuds。

2017-11-20 00:00:00 1799

原创 机器学习之决策树分类和预测算法原理

转载自 http://www.36dsj.com/archives/44255写在前面:本文很详细的说明了决策树分类和预测算法的原理,并以某高尔夫球俱乐不同的天气状况下是否来打球为例进行分析。比较详尽,谢谢作者声明可以注明出处进行转载,让更多的人分享到这份知识。算法决策树是一种通过对历史数据进行测算实现对新数据进行分类和预测的算法。简单来说决策树算法就是通过对已有明确结果的

2017-11-18 00:00:00 2429

原创 书单下载 | 关于算法、编程、机器学习等书籍,也许正是你所需要的

近期有不少小伙伴问,怎样学程序?怎样学Python?怎么学习机器学习?有哪些书可以参考?周志华老师的机器学习可以提供吗?有Peter机器学习实战的Pdf吗?Balabala……此类问题,不胜枚举。对于怎样学,小编也在学习中,我们可以一起探讨交流;对于哪些书可以做参考,还有一些经典书籍电子版,这些小编在工作和学习过程中也积累下了不少的资源,本文就列出关于算法、关于编程、关于机器学习的部分

2017-11-17 00:00:00 1998

原创 一文实现0~9手写数字识别系统

上一篇《机器学习分类算法之k-近邻代码分析》中,大家后台留言有以下错误:在此,统一给大家答复:这是由于Python 3与Python 2之间的割裂以及向下不兼容造成的,iteritems是Python2里的写法,Python3中使用items。出错的童鞋使用的环境是Python3,大家可以查看下自己的Python版本。后续的代码分享,均使用Python3,如果有Python2和Pyth

2017-11-16 00:00:00 5390

原创 机器学习之K-近邻算法代码分析

在看Peter的K-近邻实战时,发现原来“手写识别系统”不止是图像处理和图像识别可以解决,原来从图像也是矩阵数据的层面来看,不同数字的识别也是数据分类问题(2333……又打开了思维的新视角)。因本身是学图像处理出身,所以关于手写识别系统,思维受限在怎样进行图像处理、怎样训练数字模型、怎样进行数字识别了。该文先简单在Jupyter上实现K-近邻算法。后续会专门通过一步步构造使用K-近邻分类器实现

2017-11-15 00:00:00 502

原创 机器学习分类算法之k-近邻算法

最近碰到一个用户场景:公安局每天会接受一堆的案件资料,其中包括电话报案、到局中录下的口供等等,这些资料数据会根据其属于治安类的妨碍公共秩序,还是抢劫等被分配到不同的警务工作人员手中。再有,就是过往案情可能被存放在一个盘里,每次翻看时都需要全盘搜索。如果这些数据一来或者已经处理到不同类型的治安类事件里,那么又会省下一大把的时间和人力了。办案人员基于经验和知识会判定出案情描述的是归属于哪一类,那么

2017-11-14 00:00:00 765

原创 数据分析Python工具Jupter Notebook快速部署

写在前面正在学习数据分析,或者想从事数据分析事业的你,都在用什么Python工具进行算法验证和结果分析的呢?仍旧在使用Python脚本,还是eclipseByPython,还是IDEAbyPython?小编今天与大家分享一个数据分析和Python编写代码的好工具,它就是Jupyter,不论是在学术界还是工业界,Jupyter都已经开始逐步发力,走入主流市场。Jupy

2017-11-10 00:00:00 1950

原创 短视频 | 问答开源项目解读之整体代码流程和问题分析

摘要:分享YodaQA问答的代码实现流程,解析问题分析(Question Analysis)的代码实现。问题分析:生成词性标注(POS)标签和依存句法分析结果,识别出命名实体;生成若干QA特征:线索、焦点、LAT。线索(Clue):问题内容的中心词,用于查询候选答案。可以是多种成分,如名词短语、名词标记、选择动词、命名实体、问题句主题等,不同成分对应的权重存在差异。如果线索对应于e

2017-11-09 00:00:00 471

转载 史上最全的机器学习资料(下)

原文转载自:http://blog.csdn.net/lipc_/article/details/52121102工欲善其事,必先利其器(下)机器学习牵涉的编程语言十分之广,包括了MATLAB、Python、Clojure、Ruby等等。为了让开发者更加广泛、深入地了解机器学习,云栖社区组织翻译了GitHub Awesome Machine Learning 资源,涵盖24种编程语言的机器

2017-11-09 00:00:00 824

原创 短视频 | 10分钟解读智能问答开源项目YodaQA架构原理

最近接触到了微课,了解了一些微课的知识,确实是一种很好的知识共享形式。今天初次做了个尝试,接着之前智能问答开源项目YodaQA的理解。最近正在分析YodaQA的源码,而YodaQA是基于Apache UIMA开发的问答框架,设计思路上借鉴IBM DeepQA。本次视频整体分享YodaQA的技术架构,每个模块的技术关键点,以及源码的核心构成。14分钟视频时间不长,均是粗略分享,再加上初次录制

2017-11-08 00:00:00 1738 1

转载 常用机器学习算法之线性回归

继上篇《一文读懂什么是机器学习》后,以后逐步分享机器学习的方法以及自然语言处理(文本处理+机器学习)的算法等。这些理解主要是从大概流程和主要思想着手。机器学习算法总览关于机器学习算法,广义来说,有三种:1、 监督式学习工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到

2017-11-08 00:00:00 755

转载 人工智能、机器学习和深度学习的区别与联系

人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。

2017-11-05 00:00:00 533

转载 我是IT程序猿,为自己证身......

程序猿我是做IT的。七大姑八大姨好哇!正好我家电脑不好使了,你给修修啊程序猿姑姑,我不会修电脑....在互联网和信息化高唱主旋律的时代,IT行业成为当之无愧的朝阳产业,这个行业的从业者可谓时代宠儿。他们智商高、年纪轻,在技术的海洋里自由驰骋,却与社会保持着一定的距离。熬夜加班的技术控、宅男、“码农”……透过这些神秘的色彩,让我们走近IT男真实的人生……我是做软件

2017-11-04 00:00:00 833

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除