liuyanfeier的专栏

小白进阶之路

k-means聚类算法的详解和实现

一、相异度计算  在正式讨论聚类前,我们要先弄清楚一个问题:如何定量计算两个可比较元素间的相异度。用通俗的话说,相异度就是两个东西差别有多大,例如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。但是,计算机没有这种直观感受能力,我们必须对相异度在数学上进行定量定义。    ...

2017-08-29 10:51:06

阅读数 1455

评论数 0

简单教程-word2vec处理英文语料

word2vec是google的开源文本处理工具,可以将词处理成向量变成神经网络的输入。word2vec官网其中提供了一个text8英文语料供我们学习。下载地址:http://mattmahoney.net/dc/text8.zip 网上有很多教我们处理维基百科里面的数据然后变成我们的学习语料的...

2017-08-09 15:16:52

阅读数 4899

评论数 1

python批量修改文件名

我有一个目录下有很多文件,但是文件的命名比较混乱,一个一个改有比较麻烦,所以我就写了一个python脚本来做批量更改。# coding: utf-8''' import os num = 0 for file in os.listdir('raw_data/'): #os.listdir('...

2017-08-01 14:41:20

阅读数 847

评论数 0

shell-grep中的正则表达式

介绍ls /usr/bin | grep zip这个命令会列出,位于目录 /usr/bin 中,文件名中包含子字符串“zip”的所有文件。这个 grep 程序以这样的方式来接受选项和参数:grep [options] regex [file...]这里的 regx 是指一个正则表达式。 下面是g...

2017-07-25 16:51:00

阅读数 1183

评论数 0

python-二进制读写存取

python的pickle模块可以很方便的进行序列化的操作,将一个Python对象序列化为一个字节流,以便将它保存到一个文件、存储到数据库或者通过网络传输它。但是当我们直接使用pickle的时候,保存的字节流无法被例如C等其他语言读取。所以Python提供了一个struct模块,用来处理Pytho...

2017-07-21 11:41:45

阅读数 1270

评论数 0

在 Ubuntu 15.10 下编译 GCC 4.3

本文将介绍如何在 Ubuntu 15.10 下编译 gcc 4.3. 有时候我们可能需要使用低版本的gcc去编译很久之前的代码,但是 Ubuntu 15.10 最低的gcc版本都是4.7了,再前面的版本已经不能直接安装了,需要我们自己去下载源码编译。本文就是整个编译安装的过程。首先检查你是否已经安...

2017-07-07 15:23:28

阅读数 572

评论数 0

Linux C 多线程编程

简介进程— 资源分配的最小单位 线程— 程序执行的最小单位进程是一个程序的一个实例,拥有自己独立的各种段(数据段,代码段等等),每次创建一个进程需要从操作系统分配这些资源给他,消耗一定的时间,在linux下C语言创建一个进程使用fork()函数; 线程是一个轻量级的进程,除了自己少数的资源,不...

2017-07-04 16:44:41

阅读数 4101

评论数 0

char short int long float double等字节大小基础信息

C类型 字节(32位) 字节(64位) char 1 1 short int 2 2 int 4 4 long int 4 8 long long i...

2017-04-19 20:15:26

阅读数 3455

评论数 0

sigmoid和softmax函数的C++实现

float sigmoid(float x) { return (1 / (1 + exp(-x))); }float sigmoid_dy_dz(float x) { return (x * (1.0 - x)); }float tanh_dy_dz(float x) { ...

2017-03-17 15:36:13

阅读数 3816

评论数 0

C语言文件操作

打开文件fopen我们可以使用fopen()创建一个新的或者打开一个文件, 文件信息会保存在一个FILE类型的指针中, 该函数的原型为:FILE *fopen( const char * filename, const char * mode );filename是文件名, mode是打开模式, ...

2017-03-17 14:27:21

阅读数 438

评论数 1

数组与指针

数组数组是指具有相同类型的数据组成的序列,是有序集合。(教科书上的定义) 即:数组就是内存中一段连续的存储空间。那么我们怎么使用它呢?用数组名。也就是我们用数组名可以在内存中找到对应的数组空间,即数组名对应着地址。对应着首元素的地址,所以,我们可以通过数组的首元素地址来找到数组数组名是一个地址(...

2017-03-17 11:35:38

阅读数 258

评论数 0

linux后台执行命令:&和nohup

当我们在终端或控制台工作时,可能不希望由于运行一个作业而占住了屏幕,因为可能还有更重要的事情要做,比如阅读电子邮件。对于密集访问磁盘的进程,我们更希望它能够在每天的非负荷高峰时间段运行(例如凌晨)。为了使这些进程能够在后台运行,也就是说不在终端屏幕上运行,有几种选择方法可供使用。 & ...

2017-03-16 14:34:40

阅读数 170755

评论数 4

Linux下的打包和解压缩命令

先直接给出各种解压缩命令.tar 压缩:tar cvf FileName.tar FileName 解压:tar xvf FileName.tar --------------------------------------------- .gz 解压1:gunzip FileName.gz ...

2017-03-16 14:09:11

阅读数 63362

评论数 1

epoch和iteration的区别

epoch——使用整个训练样本集传播一次。一次传播 = 一次前向传播 + 一次后向传播。(所有的训练样本完成一次Forword运算以及一次BP运算)但是考虑到内存不够用的问题,训练样本们往往并不是全都一起拿到内存中去训练,而是一次拿一个batch去训练,一个batch包含的样本数称为batch s...

2017-03-09 17:56:25

阅读数 383

评论数 0

感知器Perceptron

//perceptron.h #ifndef PERCEPTRON_H__ #define PERCEPTRON_H__#include <stdio.h> #include <stdlib.h> #include <string.h> #include <...

2017-03-09 17:47:36

阅读数 266

评论数 0

trie字典树实现

实现了一个简单的字典树. 假设所有的字符只有26个小写字母,并且除了节点出现的次数之外还增加了类似map功能的索引。 假如不只有26个字母,需要相应的做一些修改。#include <stdio.h> #include <string.h> #include <st...

2017-03-09 14:33:14

阅读数 208

评论数 0

C语言字符串读取函数 gets()与fgets()

在c语言中读取字符串有多种方法,比如scanf() 配合%s使用,但是这种方法只能获取一个单词,即遇到空格等空字符就会返回。如果要读取一行字符串,比如:I love BIT这种情况,scanf()就无能为力了。这时我们最先想到的是用gets()读取.gets()函数从标准输入(键盘)读入一行数据,...

2017-03-09 14:22:12

阅读数 3661

评论数 0

C语言二进制文件读写以及大小端转换

因为工作需要所以需要将文件用二进制方式读取。网上资料比较少,所以我再次把自己的实践过程mark一下。 并且由于代码可能需要在不同的机器上运行,所以还需要考虑一下大小端转换问题。 先看下面的代码,然后我在简短的解释一下。#include <stdio.h> #include <...

2017-03-09 11:37:25

阅读数 5229

评论数 0

HTK英文大词汇连续语音识别

最近实习,跑了一下htk book里面的前三章描述的例子。当然不是完全htk book里面的步骤,因为我有的数据集什么的都不一样。目标也不是一个小的语音拨号系统,而是英文的语音识别。当然了,最终结果出来了之后很低,还有很多过程要走。语音识别,肯定不是我这样小打小闹就可以的。本文就主要记录我在训练过...

2017-01-06 17:38:09

阅读数 1870

评论数 0

Python I/O文件操作

打开和关闭文件Python 提供了必要的函数和方法进行默认情况下的文件基本操作。你可以用 file 对象做大部分的文件操作。open 函数你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。 语法:file object = open(...

2016-12-21 11:08:50

阅读数 293

评论数 0

提示
确定要删除当前文章?
取消 删除