Tensorflow基于linux环境python语言开发环境安装

Tensorflow的安装比较简单,跟安装python依赖包几乎差不多。 我当时安装是基于anaconda和pip,两个结合着用的。 1.安装anaconda 先到https://www.continuum.io/downloads 下载anaconda, 现在的版本有python2.7...

2017-04-17 23:24:30

阅读数 1529

评论数 0

python sklearn常用分类算法模型的调用

实现对'NB', 'KNN', 'LR', 'RF', 'DT', 'SVM','SVMCV', 'GBDT'模型的简单调用。# coding=gbk import time from sklearn import metrics import pickle as pickle im...

2017-03-27 15:19:30

阅读数 9042

评论数 2

SimHash算法原理

刚到公司项目中用到了simhash,但没有详细的了解,后来被问到原理,结果就狗带了。。 下面是自己查资料和自己的一些理解,不愧是google出品,比较符合google的风格,简单实用。 先贴一张网上的图片: 解释一下图片:这里feature可以指一篇文档分词后的某个词,即将文档中的某个词...

2016-08-29 19:42:26

阅读数 9556

评论数 3

Word2vec 句向量模型PV-DM与PV-DBOW

参考原文:LE, Quoc V.; MIKOLOV, Tomas. Distributed representations of sentences and documents. arXiv preprint arXiv:1405.4053, 2014. 这篇论文提出了一个使用Word2ve...

2016-08-24 11:38:27

阅读数 5938

评论数 0

bootstrap, boosting, bagging 几种方法的区别与联系

参考来源:http://blog.sina.com.cn/s/blog_4a0824490102vb2c.html ========================================================== 这两天在看关于boosting算法时,看到一篇不错的文章讲boo...

2016-07-28 20:01:21

阅读数 3688

评论数 0

算法效率比较

题目:针对数组A和数组B,两个数组的元素内容相同,不过数组A是已经排序的,数组B是乱序的,针对数组的中位数,存在以下两组程序,比较其效率并分析原因。 int g; int main() { g = 0; for(int i = 0 ; i < n ; i++) { ...

2016-07-28 10:54:16

阅读数 300

评论数 0

旋转有序数组中找最小值

O(n)的算法就不说了,这题主要考查的是 O(logn)的算法。 有序数组容易想到使用二分查找解决,这题就是在二分基础上做一些调整。数组只有一次翻转,可以知道原有序递增数组被分成两部分,这俩部分都是有序递增的(这题只需要考虑有序数组的递增情况)。 假如翻转后的数组以第 x 个结点分为两...

2016-07-27 09:37:15

阅读数 987

评论数 0

机器学习优化算法之EM算法

EM算法简介 EM算法其实是一类算法的总称。EM算法分为E-Step和M-Step两步。EM算法的应用范围很广,基本机器学习需要迭代优化参数的模型在优化时都可以使用EM算法。 EM算法的思想和过程 E-Step:E的全称是Expectation,即期望的意思。E-step也是获取期望的过程。即根据...

2016-07-13 09:05:53

阅读数 3476

评论数 0

合并两个排序的链表

输入两个单调递增的链表,输出两个链表合成后的链表,当然我们需要合成后的链表满足单调不减规则。 /* public class ListNode { int val; ListNode next = null; ListNode(int val) { th...

2016-07-10 16:54:12

阅读数 195

评论数 0

斐波那契数列

大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项。 n public class Solution { public int Fibonacci(int n) { if(n<=1){ return n; ...

2016-07-10 16:16:33

阅读数 153

评论数 0

旋转数组的最小数字

把一个数组最开始的若干个元素搬到数组的末尾,我们称之为数组的旋转。输入一个递增排序的数组的一个旋转,输出旋转数组的最小元素。 例如数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转,该数组的最小值为1。NOTE:给出的所有元素都大于0,若数组大小为0,请返回0。 import java....

2016-07-10 16:08:03

阅读数 163

评论数 0

重建二叉树

输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。 /** * Definition for binary ...

2016-07-10 15:47:25

阅读数 173

评论数 0

二维数组中的查找

在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。 public boolean Find(int [][] array,int target) { ...

2016-07-10 13:47:16

阅读数 180

评论数 0

5. Longest Palindromic Substring

Given a string S, find the longest palindromic substring in S. You may assume that the maximum length of S is 1000, and there exists one unique lo...

2016-07-10 10:40:37

阅读数 531

评论数 0

Stanford-parser依存句法关系解释

ROOT:要处理文本的语句;IP:简单从句;NP:名词短语;VP:动词短语;PU:断句符,通常是句号、问号、感叹号等标点符号;LCP:方位词短语;PP:介词短语;CP:由‘的’构成的表示修饰性关系的短语;DNP:由‘的’构成的表示所属关系的短语;ADVP:副词短语;ADJP:形容词短语;DP:限定...

2016-07-02 21:19:28

阅读数 13761

评论数 1

计算文章中每个词的权重值-信息熵及代码实现

计算出每个词的信息熵可以用来作为词的权重,信息熵公式是: W代表该词,p代表该词左右出现的不同词的数目。 比如现在某篇文章中出现了两次 A W C, 一次B W D 那么W的左侧信息熵为: 2/3表示词组A在3次中出现了2次,B只出现了一次,故为1/3. W右侧的信息熵也是一样的。如果是A...

2016-06-29 16:15:32

阅读数 4466

评论数 2

基于标题分类的文章主题句识别与提取方法

基于标题分类的主题句提取方法 基于标题分类的主题句提取方法可描述为: 给定一篇新闻报道, 计算标题与新闻主题词集的相似度, 判断标题是否具有提示性。对于提示性标题,抽取新闻报道中与其最相似的句子作为主题句; 否则, 综合利用多种特征计算新闻报道中句子的重要性, 将得分最高的句子作为主题句。 算法过...

2016-06-24 17:53:46

阅读数 5584

评论数 4

使用CRF++进行分词的原理和实现过程

使用CRF分词的原理和实现过程 目前业内分词效果最好的是CRF模型,而CRF++是CRF实现的比较成熟的工具,下面是用CRF++做分词的过程。 1.使用4-tags标记,对训练语料做预处理 分别用B代表词首,E代表词尾,M代表词中,S代表单字词。然后使用python将训练语料中的词处理成CR...

2016-06-22 20:58:54

阅读数 5712

评论数 0

spark性能调优

spark性能调优有很多措施,下面说说我用到的一些调优手段。 1.RDD分片数和executor个数的协调 要想充分的使数据并行执行,并且能充分的利用每一个executor,则在rdd的个数与executor的个数之间要有一个合适的值。若rdd的个数较多而executor的个数较少,则会导致部分r...

2016-06-21 18:33:33

阅读数 4864

评论数 1

斯坦福和NLTK英语短语词组抽取工具原理及源码理解

一、斯坦福短语抽取工具实现了四个方法来进行短语搭配抽取 (1)基于统计频率数的方法 该方法用于查找长度为2或者3并且连续的短语搭配。因此只处理bigrams和trigrams语料库。对于候选短语集,首先使用预定义的词性序列做一个初步的过滤,将不符合该词性序列的短语组合过滤掉。预定义的词性组合为: ...

2016-06-12 12:07:55

阅读数 4520

评论数 2

提示
确定要删除当前文章?
取消 删除
关闭
关闭