mcg@xisu
码龄14年
关注
提问 私信
  • 博客:35,694
    35,694
    总访问量
  • 11
    原创
  • 1,805,782
    排名
  • 26
    粉丝
  • 0
    铁粉

个人简介:机器翻译、自然语言处理、语音翻译

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 加入CSDN时间: 2011-03-17
博客简介:

michenggang_dami的专栏

查看详细资料
个人成就
  • 获得22次点赞
  • 内容获得20次评论
  • 获得42次收藏
创作历程
  • 1篇
    2022年
  • 1篇
    2014年
  • 3篇
    2012年
  • 9篇
    2011年
成就勋章
TA的专栏
  • MySQL
    1篇
  • 搜索技术
    2篇
  • 计算机基础知识
    3篇
  • 程序设计(原创)
    2篇
  • 程序设计(转载)
  • 关注博客
    2篇
  • 开源专区
    6篇
  • 机器翻译
    3篇
兴趣领域 设置
  • 人工智能
    语音识别深度学习自然语言处理pytorchnlp
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Windows命令行更换pip国内源

因为易学易操作等特点,Python受到各行各业人们的广泛关注。其最为重要的优势就是大规模的第三方库。然而,当安装成功Python想要pip安装一个第三方库时, 由于多种原因,往往会得到大串的下载超时信息。针对该问题,一个最直接了当的方法就是更换国内源。一些可用的国内源如下:清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/豆瓣:http://pypi.douban.com/sim
原创
发布博客 2022.03.24 ·
5956 阅读 ·
12 点赞 ·
2 评论 ·
29 收藏

"latex unknown graphic extension: .eps"解决之道

"latex unknown graphic extension: .eps"解决之道在使用latex进行文献排版时,需要插入后缀为.eps的图片文件,代码如下所示:\includegraphics[angle=-90, width=0.3\textwidth]{somepic.eps}编译时,输出以下错误信息:。上网查询后发现用户给出了多种不同的解决问题的方法,但大多数方法都
原创
发布博客 2014.03.04 ·
4538 阅读 ·
4 点赞 ·
0 评论 ·
2 收藏

使用GIZA++进行平行语料的词对齐

使用GIZA++进行平行语料的词对齐 在使用moses搭建机器翻译系统时,词对齐的过程是和模型训练结合在一起的,GIZA++运行的很多细节都被跳过。本文是将GIZA++单独拿出来,关注其从编译、运行到最终获取对齐文件各阶段的细节问题,以求更加深刻地理解GIZA++的工作原理。 1、 编译安装GIZA++ 最新版本的GIZA++可以从下列链接中找到http://code.go
原创
发布博客 2012.08.11 ·
4466 阅读 ·
3 点赞 ·
1 评论 ·
4 收藏

使用ictclas4j进行中文分词(续)

使用ictclas4j进行中文分词(续)在对大文件进行中文分词时,出现了以下的错误信息java.lang.ArrayIndexOutOfBoundsException: -39 at java.util.ArrayList.get(ArrayList.java:324) at org.ictclas4j.bean.Dictionary.findInOri
原创
发布博客 2012.03.31 ·
2126 阅读 ·
1 点赞 ·
4 评论 ·
0 收藏

使用ictclas4j进行中文分词

使用ictclas4j进行中文分词   ictclas4j是中科院计算所开发的中文分词工具ICTCLAS的Java版本,因其分词准确率较高,而备受青睐。  1、ictclas4j的下载及使用        1>先从http://ishare.iask.sina.com.cn/f/12821600.html下载ictclas4j的源码包ictclas4j.zip
原创
发布博客 2012.03.03 ·
6298 阅读 ·
0 点赞 ·
12 评论 ·
7 收藏

Ubuntu操作系统下笔记本触摸板失效解决之道

Ubuntu操作系统下笔记本触摸板失效解决之道       最近在笔记本上重装完Ubuntu后重启系统,触摸板没有任何反应,以为是计算机本身出现了问题,但回到windows操作系统下,触摸板又能正常工作,可见应该不是硬件的问题。通过在网上查询资料、咨询同学,最终找到了解决这一问题的有效方法,以下是两种方法具体的操作过程: 方法一、        在终端依次输入以下代码:
原创
发布博客 2011.11.06 ·
2761 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

使用googlecode进行项目管理(Linux)

使用googlecode进行项目管理(Linux)    在进行软件开发时,需要对自己的项目进行有效地管理,这样不仅能够使我们的项目代码看起来更有条理,也会使我们的软件开发过程变得更为高效。googlecode是google提供的一款非常优秀的在线项目管理工具,从最初的项目创建开始,一直到后续的开发、发布、更新,googlecode都会在你输入几个命令之后,帮你完成一系列繁琐的工作。下面就
原创
发布博客 2011.11.05 ·
738 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器翻译系统的搭建(Ubuntu10.04+Moses)

机器翻译系统的搭建(Ubuntu10.04+Moses)        因为学习的需要,前一段时间要搭建一个机器翻译系统,最终选择了Moses作为系统的框架,操作系统使用Ubuntu10.04。现对系统的安装流程总结如下: 1、 系统需要的工具(点击超链接可进入相应的下载页面)  GIZA++ 翻译模型训练工具  SRILM  语言模型训练工具  Moses
原创
发布博客 2011.10.24 ·
2933 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Win+Linux双系统中重装Windows操作系统后Ubuntu系统的恢复

前几天由于对Win7进行了重新安装,就考虑如何能够将原来的ubuntu11.04进行恢复。刚开始想借助于现有的应用软件EasyBCD2.2进行引导,但未能成功,于是就另辟蹊径。经过上网查找和阅读相关书籍,终于找到了多种解决方案。现就将具体的方法总结如下:       针对几款
原创
发布博客 2011.09.20 ·
1354 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

norains的专栏

norains的专栏
转载
发布博客 2011.09.14 ·
795 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Yt7589的专栏

Yt7589的专栏
转载
发布博客 2011.09.14 ·
535 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

未来搜索引擎应提供问题答案而非链接(转载)


原文链接:http://tech.chinaunix.net/a2011/0508/1187/000001187632.shtml
 
导语:科技博客TechCrunch周六刊登了雅虎搜索产品高级副总裁、谷歌YouTube前高管萨什·塞斯(Shashi Seth)的分析文章。文章称,未来的搜索引擎应当向用户提供问题的答案,而不是简单的链接。
  以下为文章全文:
  搜索引擎即将发生巨大的变化。在过去10年多内,搜索引擎的发展陷入停滞,核心产品没有太大
转载
发布博客 2011.05.09 ·
632 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MySQL学习(一)——中文支持相关

MySQL数据库中插入中文记录时,遇到的问题以及解决方法。
原创
发布博客 2011.04.16 ·
700 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

计算机基础知识——计算机的存储单位

刚刚从网上看到了PB这个单位,所以查了一下。找到了计算机中比较完整的存储单位,学习一下。
原创
发布博客 2011.04.14 ·
1057 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏