- 博客(6)
- 资源 (5)
- 收藏
- 关注
原创 theano - scan - 个人理解
theano 的 scan 是这段时间觉得比较难以理解的东西,本想着既然用loop的方式就可以实现元素的遍历和计算操作,为什么要做出这么一个 scan 函数呢? scan的主页http://deeplearning.net/software/theano/library/scan.html给了这么一段描述:The scan functionsprovides thebasicfunct
2016-06-27 10:59:08 504
原创 theano win7 64bit
theano 在 linux 安装很容易,但是在windows 下却十分麻烦,各种问题。 尝试过很多失败之后,这里把成功的经验分享一下。废话不多说,直接上干货:下载Anaconda2-2.4.1-Windows-x86_64.exe(https://www.continuum.io/downloads)安装到目录C:\Anaconda下。整个过程比较久,要耐心等待。
2016-01-30 13:31:40 616
原创 GIZA++ 使用说明书
首先下载1500句平行句对,作为GIZA++的实验语料利用java程序将1500句对进行分离,注意里面有一句中文多加了一个回车符,找到并删掉,然后执行该java程序。得到汉英分离的两个文件chinese和english两个文件。接下来利用中科院的分词工具和EGYPT分别实现对中文和英文进行分词,生成两个文件chinese_segment.txt和english.segment.txt。这里
2012-03-07 19:25:14 7795 3
原创 Ubuntu 10.10 SRILM完全配置手册
<!--p {margin-bottom:0.21cm}h3 {margin-bottom:0.21cm}h3.ctl {font-family:"Lohit Hindi"}-->因为Ubuntu10.10比较新,根据前人的博客,我自己实验了很久,始终是出现了这样和那样的错误,功夫不负有心人,终于解决了!这里把步骤书写下来,希望看到此帖的人不用再走弯
2011-10-28 21:36:22 1485 3
转载 fstream类读取UTF-8、Unicode和ANSI文本文档乱码问题的解决方案
终于解决了fstream类读取UTF-8、Unicode和ANSI文本文档乱码问题的解决方案:http://m.oschina.net/blog/17457非常值得推荐!
2011-10-24 20:24:48 935 1
原创 如何利用boost_1_43_0正则识别汉字
#include "Node.h"#include "WordMap.h"#include #include#include using namespace boost;using namespace std;void MatchWords(wstring wsToMatch){ wregex wrg(L"([\u4e00-\u9fa5])"); wsmatch wsm; v
2011-10-21 19:43:28 448
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人