Hadoop及Hbase介绍与Ubuntu下安装配置

Hbase 安装模式介绍1.单机模式 1> Hbase 不使用 HDFS,仅使用本地文件系统 2> ZooKeeper 与 Hbase 运行在同一个 JVM 中2.分布式模式 – 伪分布式模式 1> 所有进程运行在同一个节点上,不同进程运行在不同的 JVM...

2019-06-21 00:09:58

阅读数 6

评论数 0

TF-IDF介绍及Python实现文本聚类

TF-IDF 是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中 一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但 同时会随着它在语料库中出现的频率成反比下降。TF-IDF 加权的各种形式常被搜 索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了 TF...

2019-06-20 23:45:07

阅读数 22

评论数 0

Azure中通过模板部署批量创建虚拟机

1.开始模板部署,点击创建 2.编辑模板 3.加载导入json模版文件(这里使用了CentOS虚拟机的),修改内容 4.设置对应参数 5.点击确定,等待部署完成。 ...

2019-06-20 23:24:35

阅读数 24

评论数 0

SpringCloud的Config Client端Could not resolve placeholder 'xxx' in value "${xxx}错误解决

编写SpringCloud的Config Client端时,当尝试去配置文件里拿某${xxx}的值会出现以下错误: org.springframework.beans.factory.BeanCreationException: Error creating bean with nameInje...

2019-06-20 23:06:44

阅读数 105

评论数 0

关于Correct the classpath of your application so that it contains a single, compatible version of xxx错

在编写java项目时,遇上报如下错误: *************************** APPLICATION FAILED TO START *************************** Description: An attempt was made to ...

2019-06-04 14:04:21

阅读数 57

评论数 0

SQL Server系统数据库损坏时的快速恢复使用

1.假设data文件夹中master,masterlog,model,modellog,msdbdata,msdblog的系统数据库文件已损坏,复制Binn/template中的同名文件替换。 2.管理员模式运行cmd,命令行中输入NET START MSSQLSERVER /f /T3608启...

2018-09-24 15:04:03

阅读数 379

评论数 0

SQL Server的Windows验证之NTLM的Netmon主要过程

NTLM连接SQL Server默认实例 1. 使用命令,ipconfig /flushdns, 然后再次去执行连接,由于没有client会发一个包给DNS Server, 来查询SERVER的IP地址。 2.然后,在服务器端,抓到的TCP三次握手过程。 3.三次握手建立以后,SQLNCLI...

2018-09-24 14:51:16

阅读数 89

评论数 0

Python实现根据评论评分信息预测 (协同过滤,LFM,词向量)

  一.数据集 train.dat共393366项,第一维是用户的代号,第二维是商品代号,第三项是用户对该商品的评分,第四项是评论数,第五项是评论内容。   test.dat第一维是用户代号,第二维是商品代号。   二.简单思路及实现过程 这里简单先贴出代码实现,后期再慢慢补...

2018-06-28 01:17:54

阅读数 1206

评论数 1

基于yale人脸库的人脸图像检测

一.嵌入式特征选择:将特征选择方法和学习训练过程融为一体。两者同在一个优化过程中完成。在学习器训练时自动进行特征选择。给定训练集,考虑线性回归模型,以平方误差为损失函数,则优化目标为: 当样本特征较多,样本数量较少时,很容易过拟合。若采用L1正则化,则有:   二. 人脸图片处理读入训练图片,将每...

2018-04-15 17:06:43

阅读数 1896

评论数 1

Pat部分答案

今天看到同学在做pat,也做了一点试水。下面贴上部分代码~ 1006 #include<iostream> using namespace std; int main(){ int n; cin>>n; int m=n; ...

2018-04-13 20:27:09

阅读数 175

评论数 0

关于SVM算法 python实现

    SVM简介   SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。 SVM的主要思想可以概括为两点: 它是针对线性可分情况进行分析,对于线性不可分的情况,...

2018-03-26 22:08:29

阅读数 362

评论数 0

Adaboost python初探

  Adaboost简介:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 下面使用sklearn库简单体验一下,使用自带数据集iris:   from sklearn.model...

2018-03-26 21:41:44

阅读数 148

评论数 0

isomap算法 python实现

  isomap算法主要流程: 1:构建邻接图G:基于输入空间X中流形G上的的邻近点对i,j之间的欧式距离dx (i,j),选取每个样本点距离最近的K个点(K-Isomap)或在样本点选定半径为常数ε的圆内所有点为该样本点的近邻点,将这些邻近点用边连接,将流形G构建为一个反映邻近关系的带权流通...

2018-03-26 21:34:07

阅读数 1793

评论数 3

Kmeans算法 python实现

K-Means算法简介:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(这里为欧式距离),将样本点归到最相似的类中,接着,重新计算每个类的质心(即为类中心),重复这样的过程,知道质心不再改变,最终就确定了每个样本所属的类别以及每个类的...

2018-03-26 21:27:13

阅读数 92

评论数 0

EM算法 python初探

EM算法在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variable)。最大期望经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算...

2018-03-26 21:13:11

阅读数 304

评论数 2

Apriori算法 python实现

算法简介:   首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,一旦这些规则被生成,那么只有那些大于用户给定的...

2018-03-26 20:59:52

阅读数 138

评论数 0

理解numpy squeeze()

在squeeze函数中,指定axis后,若该维度为1,则收缩这个维度。见官方文档:

2018-02-18 21:13:57

阅读数 649

评论数 0

决策树剪枝简单python实现

决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,...

2017-12-18 16:52:31

阅读数 2777

评论数 4

python实现QR法解线性方程组

python简单实现QR法

2017-10-23 11:16:43

阅读数 637

评论数 0

python实现共轭梯度法

共轭梯度法(Conjugate Gradient)是介于最速下降法与牛顿法之间的一个方法,它仅需利用一阶导数信息,但克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点,共轭梯度法不仅是解决大型线性方程组最有用的方法之一,也是解大型非线性最优化最有效的算法之一。  ...

2017-10-23 10:58:53

阅读数 2545

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭