自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

探索世界,改变世界

善于分享知识,勤于探索知识,知识就是力量。

  • 博客(4)
  • 资源 (36)
  • 收藏
  • 关注

原创 【算法】相似度算法—文本相似度

1)  Jaccard相似系数Jaccard系数主要用于计算个体间的相似度,个体的特征属性可以通过符号度量或者布尔值标识。不能通过特征属性的差异进行直接计算,只能通过特征属性是否相同进行比较。Jaccard系数只关心个体间特征属性是否相同 计算步骤:1、       分词处理2、       把需要计算的网页内容转化为集合3、       将集合和集合之间进行计算并集和交集4、       计算交...

2018-03-13 15:41:27 4391

原创 【算法】距离算法总结

1.   欧氏距离欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采用的距离定义在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。 二维公式: 三维公式: n维公式:或 向量运算表现形式: python实现:"""欧氏距离"""import numpy as npfrom scipy.spa...

2018-03-13 11:40:55 4031

原创 【深度学习】TensorFlow系统架构和设计理念

TensorFlow系统架构设计理念 图的定义和图的运行完全分开。TensorFlow为“符号主义”的库。编程模式通常分为命令式编程和符号式编程。命令式编程:编写通常意义上的程序,容易理解和调试,按照原有的逻辑执行。符号式编程:涉及很多的嵌入式和优化,不同意理解和调试,运行速度相对提升。 符号式计算:先定义各种变量,然后建立一个数据流图,在数据流图中规定各个变量间的计算关系,最后对数据流图进行编译...

2018-03-10 09:49:41 3390

原创 【机器学习】公开数据集总汇(欢迎补充)

目录【图片数据集】【人脸数据集】【视频数据集】【问答数据集】【自动驾驶数据集】【年龄、性别数据集】修改时间:2018-10-30:新增9个 人脸数据集  【图片数据集】 世界上最大的图像识别数据集ImageNet :http://www.image-net.org 用于分割和加字幕标注的数据集COCO : http://c...

2018-03-06 10:22:04 3130

clickhouse+springboot+logback的Demo

大数据项目模板

2021-01-19

TeamViewer 14

TeamViewer 14 换ID

2019-04-14

数据分析师常用的十种数据分析思路

数据分析师常用的十种数据分析思路

2018-11-01

机器学习知识手册

目录: 数学基础 1.线性代数基础 2.概率论基础 3.数值计算基础 4.常用函数 统计学习 0.机器学习简介 1.线性代数基础 2.支持向量机 3.朴素贝叶斯 4.决策树 5.knn 6.集成学习 7.梯度提升树 8.特征工程 9.模型评估 10.降维 11.聚类 深度学习 0.深度学习简介 1.机器学习基础 2.深度前馈神经网络 3.BP算法 4.正则化 5.最优化础 6.卷积神经网络 7.循环神经网络 8.工程实践指导原则 自然语言处理 主题模型 词向量 计算机视觉 图片分类网络 工具 CRF CRF++ lightgbm xgboost

2018-10-15

机器学习系列文章

机器学习系列文章

2018-10-08

《精益数据分析》埃里克·莱斯

本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。 深入理解精益创业、数据分析基础,和数据驱动的思维模式 如何将六个典型的商业模式应用到各种规模的新企业 找到你的第一关键指标 确定底线,找到出发点 在大企业中应用精益分析,打造新产品

2018-09-25

《程序员的数学3-线性代数》

《程序员的数学3-线性代数》

2018-09-05

《大数据时代的算法》 机器学习、人工智能及其典型实例-刘凡平

《大数据时代的算法》 机器学习、人工智能及其典型实例-刘凡平,

2018-09-05

大数据分析下的数据预处理

大数据分析下的数据预处理,大数据分析下的数据预处理,大数据分析下的数据预处理,

2018-07-30

数据仓库中的ETL和元数据

数据仓库中的ETL和元数据,数据仓库中的ETL和元数据,数据仓库中的ETL和元数据,数据仓库中的ETL和元数据

2018-07-30

聚类分析方法

聚类分析方法,聚类分析方法,聚类分析方法,聚类分析方法,聚类分析方法,

2018-07-30

电子商务与数据挖掘

电子商务与数据挖掘

2018-07-30

大型数据库中的关联规则挖掘

大型数据库中的关联规则挖掘,大型数据库中的关联规则挖掘,大型数据库中的关联规则挖掘

2018-07-30

数据挖掘概述

数据挖掘概述,数据挖掘概述,数据挖掘概述,数据挖掘概述,数据挖掘概述,

2018-07-30

文本挖掘概述与方法

文本挖掘概述与方法,文本挖掘概述与方法,文本挖掘概述与方法,文本挖掘概述与方法,文本挖掘概述与方法,

2018-07-30

WEKA数据挖掘教程

数据挖掘,WEKA开源软件,数据挖掘,WEKA开源软件,数据挖掘,WEKA开源软件,数据挖掘,WEKA开源软件,

2018-07-30

OLAP联机分析处理

OLAP联机分析处理,OLAP联机分析处理,OLAP联机分析处理,OLAP联机分析处理

2018-07-30

R语言入门详解

R语言绘图,R语言绘图,R语言绘图,R语言绘图,R语言绘图,R语言绘图,R语言绘图

2018-07-30

Python机器学习实践指南

Python机器学习实践指南Python机器学习实践指南Python机器学习实践指南Python机器学习实践指南Python机器学习实践指南

2018-03-19

python机器学习入门实战

python机器学习 理论+实战,线性回归。逻辑回归、决策树、SVM、感知机、随机森林、正则化

2018-02-05

pycharm2017汉化包

pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包pycharm2017汉化包

2017-09-18

全面的各类RAID详解

磁盘阵列(Redundant Arrays of Independent Disks,RAID),全称独立磁盘冗余阵列。 磁盘阵列是由很多廉价的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。 利用同位检查(Parity Check)的观念,在数组中任意一个硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。 相同的数据存储在多个硬盘的不同的地方的方法。通过把数据放在多个硬盘上(冗余),输入输出操作能以平衡的方式交叠,改良性能。因为多个硬盘增加了平均故障间隔时间(MTBF),储存冗余数据也增加了容错。

2017-09-08

MySQL-5.7英文参考手册.pdf

MySQL-5.7英文参考手册.pdf

2017-08-30

MySQL 5.5 中文参考手册.pdf

MySQL 5.5 中文参考手册.pdf

2017-08-30

ITIL流程图

ITIL流程图

2017-08-24

CentOS 7 下安装OpenStack Ocata

在CentOS 7下安装OpenStack Ocata

2017-04-30

WinRAR_x64_SC.exe

WinRAR

2017-01-03

PyDev 5.0.0.zip

PyDev 5.0.0.zip

2017-01-03

collectd-5.4.2.tar.gz

collectd

2017-01-03

互联网分析

互联网就业 Cloud BigData

2017-01-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除