自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 如何使用navicat for mysql连接本地数据库,并且导入数据文件

navicat for mysql是一种数据库管理工具, 专门用于简化, 开发和管理MySQL。我们可以使用navicat for mysql来连接远程数据库,也可以连接本地数据库。使用这个工具,查看表的数据非常方便,也可以输入SQL命令来实现查询。但是输入创建表等命令就不是很方便了。好了,我们一起来看看怎么使用navicat for mysql 创建并查询数据库中的数据。

2014-11-30 08:58:16 19889

原创 程序员编程技术学习笔记——字符串包含

给定两个分别由字母组成的字符串A和字符串B,字符串B的长度比字符串A短。请问,如何最快地判断字符串B中所有字母是否都在字符串A里?为了简单起见,我们规定输入的字符串只包含大写英文字母,请实现函数boolStringContains(string &A, string &B)

2014-11-27 16:36:08 1320

原创 程序员编程技术学习笔记——左旋转字符串

给定一个字符串,要求把字符串前面的若干个字符移动到字符串的尾部,如把字符串“abcdef”前面的2个字符'a'和'b'移动到字符串的尾部,使得原字符串变成字符串“cdefab”。请写一个函数完成此功能,要求对长度为n的字符串操作的时间复杂度为 O(n),空间复杂度为 O(1)。

2014-11-27 11:02:32 912

原创 程序员编程技术学习笔记

程序员编程技术学习笔记    看july的博客也有好久了,一直没能好好整理一下自己的学习笔记,开了博客之后更加愿意好好整理一番了。其中不免有些内容在july那里可以找到原文,但是更多的加入了我个人的理解。这个系列也是对那句“一直有深入理解数据结构的计划”的回答吧~1. 左旋转字符串

2014-11-27 08:09:01 1103

原创 Jieba分词包(二)——trie树和DAG

在Jieba分词包的源码中,有一个重要的分词函数——__cut_DAG(sentence),它里面涉及到了trie树和DAG有向无环图。在作者的说明文档中也指出了:基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)。所以说这篇博客我们就来说说Jieba里面的trie树和DAG图。

2014-11-26 16:51:43 8533 1

原创 NLP分析技术的三个层面

NLP分析技术大致分为三个层面:词法分析、句法分析和语义分析。

2014-11-26 09:21:00 9905

原创 理解SVM(二)——线性不可分的情况

理解SVM(二)——线性不可分的情况    前面一篇介绍了SVM的

2014-11-20 11:06:28 32345 2

原创 入门Hadoop的WordCount程序

本篇文章主要说两部分:简单介绍MapReduce的工作原理;详细解释WordCount程序。

2014-11-19 10:46:42 1646

原创 如何在Centos下安装hadoop并与Eclipse连接?

整个教程分为这样5个部分来说:1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;2)centos下设置ssh服务无密码登录;3)centos下安装jdk,并配置环境变量;4)centos下安装hadoop,并配置文件;5)windows下安装jdk和eclipse,并将eclipse与centos下的hadoop连接。可以说这5个部分每一个都很重要,尤其是第4)步。下面我们就详细说一下每一步该怎么做。

2014-11-18 14:37:54 3472

原创 TF-IDF算法及其编程实现

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果

2014-11-15 10:08:32 13209 7

原创 入门B-树的世界

入门B-树的世界    很久之前,看过一篇关于外存磁盘数据搜索的讲解稿,偶然看到B树的知识。当时青涩地觉着:高大上的数据结构啊,渊博的data structure啊~~哈哈哈,今天我终于可以来了解一下这种外存数据结构:B树。1. B树的引入    前面我们介绍的二叉搜索树(二叉查找树)、AVL树等等都是当数据存储在内存中对应的搜索结构。当我们在内存数据中搜索的时候,用AVL树表示就可以

2014-11-11 21:46:33 1265

原创 理解线性回归(四)——总结线性回归

Scikit Learning 学习笔记——总结线性回归

2014-11-07 10:50:13 4104

原创 理解线性回归(三)——岭回归Ridge Regression

Scikit-Learn学习笔记——岭回归Ridge Regression

2014-11-06 16:52:51 16631

原创 入门数据结构的世界

入门数据结构的世界系列地介绍了数据结构知识点。

2014-11-03 16:32:55 813

原创 Jieba分词包解析系列

Jieba分词包解析系列

2014-11-03 15:07:01 1302

原创 Scikit-Learn学习笔记系列

Scikit-Learn学习笔记系列关于Python中的e

2014-11-03 14:51:57 1400

原创 Jieba分词包(一)——解析主函数cut

Jieba分词包——解析的Python源代码

2014-11-03 14:26:46 8833

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除