- 博客(4)
- 资源 (36)
- 收藏
- 关注
原创 【算法】相似度算法—文本相似度
1) Jaccard相似系数Jaccard系数主要用于计算个体间的相似度,个体的特征属性可以通过符号度量或者布尔值标识。不能通过特征属性的差异进行直接计算,只能通过特征属性是否相同进行比较。Jaccard系数只关心个体间特征属性是否相同 计算步骤:1、 分词处理2、 把需要计算的网页内容转化为集合3、 将集合和集合之间进行计算并集和交集4、 计算交...
2018-03-13 15:41:27 4391
原创 【算法】距离算法总结
1. 欧氏距离欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采用的距离定义在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。 二维公式: 三维公式: n维公式:或 向量运算表现形式: python实现:"""欧氏距离"""import numpy as npfrom scipy.spa...
2018-03-13 11:40:55 4031
原创 【深度学习】TensorFlow系统架构和设计理念
TensorFlow系统架构设计理念 图的定义和图的运行完全分开。TensorFlow为“符号主义”的库。编程模式通常分为命令式编程和符号式编程。命令式编程:编写通常意义上的程序,容易理解和调试,按照原有的逻辑执行。符号式编程:涉及很多的嵌入式和优化,不同意理解和调试,运行速度相对提升。 符号式计算:先定义各种变量,然后建立一个数据流图,在数据流图中规定各个变量间的计算关系,最后对数据流图进行编译...
2018-03-10 09:49:41 3390
原创 【机器学习】公开数据集总汇(欢迎补充)
目录【图片数据集】【人脸数据集】【视频数据集】【问答数据集】【自动驾驶数据集】【年龄、性别数据集】修改时间:2018-10-30:新增9个 人脸数据集 【图片数据集】 世界上最大的图像识别数据集ImageNet :http://www.image-net.org 用于分割和加字幕标注的数据集COCO : http://c...
2018-03-06 10:22:04 3130
机器学习知识手册
2018-10-15
《精益数据分析》埃里克·莱斯
2018-09-25
pycharm2017汉化包
2017-09-18
全面的各类RAID详解
2017-09-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人