自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (3)
  • 收藏
  • 关注

原创 linux(centos 7)mysql安装

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 最流行的关系型数据库管理系统,在 WEB 应用方面MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件之一。 MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数

2017-01-22 10:35:39 297

原创 机器学习-贝叶斯分类

1、分类问题综述 对于分类问题,其实谁都不会陌生,说我们每个人每天都在执行分类操作一点都不夸张,只是我们没有意识到罢了;有一次出差,出差经常加班到深夜,打车回宾馆,刚上车,司机师傅说了句,哥几个是程序员吧,我们几个非常诧异,他是怎么看出来的,ps:当时感觉特别尴尬。这其中就涉及到了分类,司机师傅是按照自己的经验得出的结论,分类无非也是从训练样本中学习经验,然后根据训练出的模型进行分类。

2017-01-10 23:19:52 505

原创 python-jieba分词的安装和使用

最近在做文本分析的这部分,对于中文文本,要想对其使用机器学习的算法,必须得将这种非结构化的数据转化为结构化的并且计算机能够认识的结构,这中间就涉及到了中文分词,本人比较熟悉的开源的分词框架有python的结巴和IK分词,IK分词我曾经在elasticsearch里面使用过,现在开始学习jieba分词的使用。 安装: 安装python3.4 python下载地址 下载完毕后点击安装,然后配置环

2017-01-10 21:02:03 1371

转载 余弦相似度

余弦距离、欧氏距离和杰卡德相似性度量的对比分析 1、余弦距离 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角。 余弦定理描述了三角形中任何一个夹角和三个边的关系。给定三角形的三条边,可

2017-01-10 14:51:13 1407

原创 文本分析之TF-IDF

1、定义: TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用

2017-01-10 14:08:40 1891

基于C++的定时关机的实现

基于C++的定时关机的实现

2015-03-30

C++实现的简单投票系统

基于C++实现的简单的投票系统 基于C++实现的简单的投票系统 代码简单易懂 希望能够给大家提供学习的资料

2015-03-30

VC显示行号

VC++6.0 编译器  显示行号的插件

2015-03-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除