【人工智能】
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
喵学长
爱好动漫、游戏的二次元,Java工程师
展开
-
jieba分词学习笔记(三)
DAG(有向无环图)有向无环图,directed acyclic graphs,简称DAG,是一种图的数据结构,其实很naive,就是没有环的有向图_(:з」∠)_DAG在分词中的应用很广,无论是最大概率路径,还是后面套NN的做法,DAG都广泛存在于分词中。因为DAG本身也是有向图,所以用邻接矩阵来表示是可行的,但是jieba采用了python的dict,更方便地表示DAG转载 2017-09-20 10:40:08 · 523 阅读 · 0 评论 -
jieba分词学习笔记(二)
分词模式jieba分词有多种模式可供选择。可选的模式包括:全切分模式精确模式搜索引擎模式同时也提供了HMM模型的开关。其中全切分模式就是输出一个字串的所有分词,精确模式是对句子的一个概率最佳分词,而搜索引擎模式提供了精确模式的再分词,将长词再次拆分为短词。效果大抵如下:# encoding=utf-8import转载 2017-09-20 10:39:26 · 765 阅读 · 0 评论 -
jieba分词学习笔记(一)
jieba分词的基本思路jieba分词对已收录词和未收录词都有相应的算法进行处理,其处理的思路很简单,当然,过于简单的算法也是制约其召回率的原因之一。其主要的处理思路如下:加载词典dict.txt从内存的词典中构建该句子的DAG(有向无环图)对于词典中未收录词,使用HMM模型的viterbi算法尝试分词处理已收录词和未收录词全部分词完毕后,使用d转载 2017-09-20 10:38:39 · 2250 阅读 · 0 评论 -
jieba完整文档
jieba“结巴”中文分词:做最好的 Python 中文分词组件"Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word segmentation module.Scroll down for English documenta转载 2017-09-20 10:36:03 · 1902 阅读 · 0 评论 -
windows安装TensorFlow
安装步骤1、安装python32、安装anaconda3.X(注意和python版本一致)ps:这里安装了anaconda可以不用安装python3、使用管理员权限打开命令窗口4、将命令窗口的字符编码调整为UTF-8【chcp 65001】如果是英文版系统,不用调整5、使用pip安装TensorFlow【pip install tensorflow】注意打开vpn验证Ten...原创 2019-11-06 16:09:30 · 389 阅读 · 0 评论 -
决策树之ID3算法
1. 决策树的基本认识 决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对 象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能 的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅 有单一输出,如果有多个输出,可以分别建立独转载 2017-11-03 10:52:14 · 549 阅读 · 0 评论 -
朴素贝叶斯算法 & 应用实例
一、朴素贝叶斯算法介绍朴素贝叶斯,之所以称为朴素,是因为其中引入了几个假设(不用担心,下文会提及)。而正因为这几个假设的引入,使得模型简单易理解,同时如果训练得当,往往能收获不错的分类效果,因此这个系列以naive bayes开头和大家见面。因为朴素贝叶斯是贝叶斯决策理论的一部分,所以我们先快速了解一下贝叶斯决策理论。假设有一个数据集,由两类组成(简化问题),对于每个样本的转载 2017-10-20 10:29:10 · 10149 阅读 · 0 评论 -
均分函数 numpy.arange() 和 numpy.linspace()
均分函数 numpy.arange() 和 numpy.linspace()numpy.arange([start, ]stop, [step, ])该函数返回的是一个均匀分布的数组step一般为整数import numpy as np>>> np.arange(5)[0 1 2 3 4] # 是数组,不是list>>> np.arange(2, 7)[转载 2017-09-11 13:19:39 · 8861 阅读 · 0 评论 -
绘图: matplotlib核心剖析
matplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包。我将在这篇文章中介绍matplotlib API的核心对象,并介绍如何使用这些对象来实现绘图。实际上,matplotlib的对象体系严谨而有趣,为使用者提供了巨大的发挥空间。用户在熟悉了核心对象之后,可以轻易的定制图像。matplotlib的对象体系也是计算机图形学的一个优秀范例。即使你不是Python程序转载 2017-09-15 09:18:21 · 431 阅读 · 0 评论 -
matplotlib.pyplot中add_subplot方法参数111的含义
下述代码若要运行,得在安装Python之外安装matplotlib、numpy、scipy、six等库,专门来看这篇小贴的朋友应该知道这些库。import matplotlib.pyplot as pltfrom numpy import *fig = plt.figure()ax = fig.add_subplot(349)ax.plot(x,y)plt.show()参数转载 2017-09-15 09:16:35 · 927 阅读 · 0 评论 -
Matplotlib 中文用户指南 3.1 pyplot 教程
pyplot 教程matplotlib.pyplot是一个命令风格函数的集合,使matplotlib的机制更像 MATLAB。 每个绘图函数对图形进行一些更改:例如,创建图形,在图形中创建绘图区域,在绘图区域绘制一些线条,使用标签装饰绘图等。在matplotlib.pyplot中,各种状态跨函数调用保存,以便跟踪诸如当前图形和绘图区域之类的东西,并且绘图函数始终指向当前轴域(请注意转载 2017-09-15 09:14:03 · 452 阅读 · 0 评论 -
numpy.linspace使用详解
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)在指定的间隔内返回均匀间隔的数字。返回num均匀分布的样本,在[start, stop]。这个区间的端点可以任意的被排除在外。Parameters(参数):start :转载 2017-09-15 08:10:41 · 902 阅读 · 0 评论 -
数据归一化和两种常用的归一化方法
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:一、min-max标准化(Min-Max Normalization)也称为转载 2017-09-14 20:53:23 · 648 阅读 · 0 评论 -
Python的numpy库中将矩阵转换为列表等函数
这篇文章主要介绍Python的numpy库中的一些函数,做备份,以便查找。(1)将矩阵转换为列表的函数:numpy.matrix.tolist()返回list列表Examples>>>>>> x = np.matrix(np.arange(12).reshape((3,4))); xmatrix([[ 0, 1, 2, 3],转载 2017-09-13 11:01:25 · 1703 阅读 · 0 评论 -
统计学概念基础---数学期望,方差,标准差,协方差
1.基本概念数学期望就是平均值:均值公式:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。2.协方差二、为什么需要协方差标准差和方差一般是用来描述一维数据的,但现实生活中我们常常会遇到含有多维数据的数据集转载 2017-09-13 11:47:58 · 2183 阅读 · 0 评论