人工智能
我是一只程序⚪
多读书,多看报
展开
-
LCS (Longest Common Subsequence)
一、最长公共子序列一个数列 S,如果分别是两个或多个已知数列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列。最长公共子串(Longest CommonSubstring)和最长公共子序列(LongestCommon Subsequence,LCS)的区别:子串是串的一个连续的部分,子序列则是从不改变序列的顺序,而从序列中去掉任意的元素而获得的新序列;更简略地说,子串...原创 2020-02-20 11:32:30 · 403 阅读 · 0 评论 -
Jaccard相似系数
Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。定义给定两个集合A,B,Jaccard 系数定义为A与B交集的大小与A与B并集的大小的比值,定义如下:当集合A,B都为空时,J(A,B)定义为1。与Jaccard 系数相关的指标叫做Jaccard 距离,用于描述集合之...原创 2020-02-20 11:30:56 · 2535 阅读 · 0 评论 -
BK-Tree
用于根据编辑距离(Levenshtein距离)概念执行拼写检查。 BK树也用于近似字符串匹配。基于该数据结构,可以实现许多软件中的各种自动校正特征。BKTree算法上分两步:1 构造在词典里面随便找一个词作为root节点,然后与其他词计算编辑距离n。若已有相同编辑距离n的子节点,就挂在子节点下;若没有,就新建边为n的子节点。如此递归下去。2 查询这里重点来了,编辑距离符合三角不等式...原创 2020-02-20 11:29:49 · 1871 阅读 · 0 评论 -
编辑距离(Levenshtein Distance)
是用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-msKmtzEa-1582169184523)(https://math.jianshu.com/math?formula=%3Cw_1%2Cw_2%3E)]之间,由其中一个单词[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(im...原创 2020-02-20 11:28:36 · 493 阅读 · 0 评论 -
Python人工智能--实现手写数字识别
在做此项目之前,首先要明白何为KNN算法。一 、 K-近邻算法(KNN)概述最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。 KNN是通...原创 2019-03-23 17:31:14 · 21377 阅读 · 3 评论 -
Python人工智能-卷积神经网络
卷积神经网络当你听到说深度学习打破了某项新技术障碍,那么十有八九就会涉及到卷积神经网络。它们也被称作CNNs或着ConvNets,是深层神经网络领域的主力。它们已经学会对图像进行分类,在某些情况下甚至超过了人类。如果有一个方法证明了这种假设,那就是CNN。为了帮助指导你理解卷积神经网络,我们讲采用一个非常简化的例子:确定一幅图像是包含有"X"还是"O"?这个例子足够说明CNN...原创 2019-04-01 09:54:10 · 1099 阅读 · 1 评论 -
数据分析常用内容总结
Numpyimport numpy as np1、创建数组a = np.array([2])aarray([2])a = np.array([2,2])aarray([2, 2])b = np.array([[1,2],[3,4]])barray([[1, 2], [3, 4]])2、数组属性a.ndim #维度1a.shape #返回...原创 2019-04-02 17:20:59 · 758 阅读 · 0 评论