- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 【Python】Python在文本分析中将中文和非中文进行分割
1.问题描述进行文本分析的时候需要将中文和非中文进行分开处理,下面通过Python将文本中的中文部分提取出来进行需要的处理。2.问题解决开发环境:Linux程序代码如下:split.py#!/usr/bin/python#-*- coding:utf-8 -*-import sysreload(sys)sys.setdefaultencoding("ut
2014-12-31 16:21:15 16094 2
原创 【Python】Python的urllib、urllib2模块调用“百度翻译”API进行批量自动翻译
1.问题描述在文本数据处理时,经常回出现文本中各种语言的混杂情况,包括:英文、日语、俄语、法语等,需要将不同语种的语言批量翻译成中文进行处理。可以通过Python直接调用百度提供的翻译API进行批量的翻译。百度翻译API详细文档见:百度翻译API文档2.问题解决开发环境:Linux将文本中的中文和非中文进行分离,对非中文的部分进行翻译。Python的代码如下:#
2014-12-31 15:37:26 6402
原创 【Python】Python文本处理中用langid工具包来对文本进行语言检测与判别
1.问题的描述用Python进行文本处理时,有时候处理的文本中包含中文、英文、日文等多个语系的文本,有时候不能同时进行处理,这个时候就需要判别当前文本是属于哪个语系的。Python中有个langid工具包提供了此功能,langid目前支持97种语言的检测,非常好用。2.程序的代码以下Python是调用langid工具包来对文本进行语言检测与判别的程序代码:import langid
2014-12-22 18:36:41 6698 1
原创 【Java】MyEclipse中复制项目或修改项目名字出现问题
今天用MyEclipse复制一个已经存在的项目,并将名字修改成另外一个项目时,出现了一个问题困扰我多时,后来终于解决了。1.问题描述复制并修改名字后,部署到Tomcat上跑,结果发现运行时都是复制前的那个项目的名字,修改后的项目的名字完全没有起到作用。2.解决办法点击新的项目名,右键->Properties->MyEclipse->Web,将Web Context-
2014-12-01 19:27:56 6755
C语言---经典编程900例---------------------
2010-05-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人