自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (3)
  • 收藏
  • 关注

原创 tensorflow学习笔记之word2vec

Intrductionword2vec是训练词向量的方法,tensorflow自带的word2vec代码实现的是Skip-gram方法,即使用周边词预测中心词。代码比较简单,BP的一个前向后向过程,主要学习BP网络的搭建方法Code Analysis:    def maybe_download(filename, expected_bytes):'''数据下载方法,下载完毕是一个

2016-10-27 14:45:52 4912

原创 交换机(switch),集线器(hub),路由器(router)三者区别

离大学网络课已经很久了,最近由于工作的原因,重新认识了一下这三个东西。以前记住的知识很全面,用来考试用。现在理解的很浅显,但是却很实用。共同点就是,他们都有好多孔,每个孔可以引出来一条网线,连上一台电脑。这样就可以把一群电脑连到一起。不同点先说hub和switch1. hub是一种低级的交换机2. 他们都工作在数据链路层3. 交换机以mac地址来作为网络包转发路径的依据。h

2015-11-09 16:26:59 5216 1

原创 mysql 加外键约束

管理实验室网站的原因,学了mysql一招。1. mysql表类型分不同的引擎,包括MyISAM和InnoDB,因为商业的问题后面可能还有其他,没关心。MyISAM对高级的事物操作支持非常差,连最基本的外键都不支持。所以,之前在表上加外键约束,不起效,后来定位是MyISAM的问题。Navicat上点中一个表,看他的属性,就能看到用得时是什么引擎。2. 我的mysql版

2015-11-05 16:24:15 579

原创 utf8编码问题深究

之前,遇到汉字的utf8编码问题,掌握了处理方法,没做理论方面的深究。如今又遇到了缅甸语的编码问题,现在理清一下理论的问题。1. utf8是变长编码,也就是一个字符(汉字或是其他文字)所占的字节数不同。这个主要影响C++里面把一个句子分割成一串字符序列时,substring的参数,也就是一次取几个字节出来,如果字节长度没确定对,会把正确的字切开,导致乱码问题。字节长度变化范

2015-10-23 17:35:57 687

原创 利用开源工具搭一套汉英翻译系统(四):解码器Moses

解码器采用Moses,有其他选择。官网:http://www.statmt.org/moses/ ,上面的manual.pdf非常有用。下载地址:https://github.com/moses-smt/mosesdecoder前序安装:moses需要boost库的支持,所以需要先装boost,boost1.48中存在影响moses的bug,所以应该避开该版本,选择其他版本。我

2015-10-12 16:15:32 1214

原创 利用开源工具搭一套汉英翻译系统(三):语言模型工具SRILM

语言模型工具选择使用SRILM。存在其他选择KenLM, IRSTLM。下载地址:http://www.speech.sri.com/projects/srilm/download.html ,需要提供一点个人信息才允许下载。下载完后,解压。vi Makefile改SRILM = $文件夹路径MACHINE_TYPE := i686-m64记得去掉#,保存退出。ma

2015-10-12 15:55:08 1193

原创 利用开源工具搭一套汉英翻译系统(二):词对齐

训练语料是句子级别对齐的,词对齐工具用来从句子对齐中学习到词对齐,对齐这个概念可以理解成为两个词的翻译对应关系。理论知识不再介绍,感兴趣的看《统计机器翻译》对齐工具有多个,这里选择使用GIZA++,下载与编译下载地址:github下载完,解压后的路径结构:其实,这里包含了两个工具,一个是GIZA++,一个是mkcls。make一下,编译。我的编译环境是:gcc versio

2015-09-29 16:11:59 4619

原创 利用开源工具搭一套汉英翻译系统(一):预处理工具

语料获取不在赘述,可以去LDC上申请,也可以找找别人放出的免费资源。语料编码默认都是UTF8。第一步做语料处理:汉语端需要做分词,标点符号全半角转换。英语端需要做转小写,token,标点符号全半角转换工具:standford

2015-09-29 10:56:32 1360

原创 分治法求解逆序数问题

// Sort_and_Count.cpp : 定义控制台应用程序的入口点。//#pragma once#include "stdafx.h"#include #include #include #include using namespace std;int fileLength = 10000;int numbers[10000];//存储所有数据的数组long i

2014-11-02 23:53:21 1901

原创 快速排序程序(windows vs)

// Sort_and_Count.cpp : 定义控制台应用程序的入口点。//#pragma once#include "stdafx.h"#include #include #include #include using namespace std;int fileLength = 100000;int numbers[100000];//存储所有数据的数组voi

2014-11-02 21:57:51 293

原创 小代码整理

整理一些小的方法,以后方便复用文件duxie

2014-10-17 10:52:50 311

原创 C++ string转double

#include "math.h"string str="2.1";double= atof(str.c_str());

2014-07-06 10:45:09 1871

原创 学习bash脚本

文件开头:#!/bin/bash屏幕输出

2014-06-27 15:28:45 344

原创 linux下编译C++代码,makefile文件内容

# ExecutableEXE    = BPnetwork# Compiler, Linker DefinesCC      = g++ CFLAGS  = -w -O -Wno-deprecatedLIBS    = LDFLAGS = $(LIBS)# Compile and Assemble C++ Source Files into Objec

2014-06-27 08:27:44 883

原创 C++读写文件,处理UTF8文件,处理GBK中文字符

读文件

2014-06-27 08:25:42 5189

原创 妈蛋,怎么发现百度空间以前写的东西居然连个分类都没有了,只好转到CSDN存点学习材料了

RT总结,积累。2014-06-27

2014-06-27 08:18:32 441

原创 第一篇CSDN博客

以前在百度写过一些技术博客,都是一些技术总结记录。从开始踏入计算机学科,接触过的东西也很多,但是不经常总结,到现在能掌握住的也很少。尤其现在,年龄大了,事情也多了,记性更差了。写一些拾遗文章一方面可以记录一些有用的知识,另一方面也给自己的学习提供动力,或许也能给他人提供一定的帮助。好好写!

2014-03-19 16:11:43 293

java实现网络抓包

java实现对网络包的抓取,对数据包的分析,然后对http数据包进行重组还原成网页。

2011-01-07

傅立叶变换java代码

傅立叶变换 java gui界面 可实现一维二维傅立叶变换和一维二维傅立叶反变换。

2011-01-07

使用小波变换,实现图像纹理识别,java实现

使用小波变换,实现图像纹理识别,java实现。

2011-01-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除