![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
科研工具及FAQ
Tiffany_Li2015
2016,戒骄戒躁!一路前行,勇敢细心~
展开
-
Sklearn TFIDF中文计算问题以及解决方法
我在使用sklearn中的ITIDF工具,想来这是在文本处理中常用的有个现成的工具一定是极好的。但是网上查了下代码试了下并没有得到跟他们一样的结果。现象是这样的,凡是输入的是中文就直接被忽略掉了,如果全是中文就直接空输入了。当然,前提已经排除掉是编码或者unicode的错误了。网上搜到的代码参考:from sklearn.feature_extraction.text import Tfi原创 2015-12-09 15:20:12 · 7621 阅读 · 1 评论 -
编码常见问题及解决方式
1、问题:UnicodeEncodeError: 'ascii' codec can't encode characters in position 方法:字符集的问题,在文件前加两句话reload(sys) sys.setdefaultencoding( "utf-8" )原创 2015-10-23 10:48:38 · 1314 阅读 · 0 评论 -
NLP 最近常用分词工具
1、python工具包结巴分词,可直接使用easy_intall下载,方便。http://www.oschina.net/news/34492/jieba-0-202、HanLP这个Java工具包功能很强大,但在特定任务上容易出现过拟合。比如在语音识别后的文本上表现就不是那么好,容易把很多词分为人名。目前为止至少我还没找到可弥补的方法。https://github.com/hankcs/Han原创 2015-10-29 10:54:42 · 886 阅读 · 0 评论 -
Xshell界面输出中文乱码现象解决方法
[文件]-->[打开]-->在打开的会话session中选择连接的那个 ,点击属性properties -> 终端[Terminal ] ,在右边的转换translation先选择编码utf8就可以啦.原创 2015-10-30 11:40:17 · 1750 阅读 · 0 评论 -
Protege一种本体构建编辑器
1、下载方式一:可以通过官网渠道下载最新版本http://protege.stanford.edu/products.php#desktop-protege方式二:下载现在中文说明文档均提到的版本4.3 http://protege.stanford.edu/download/protege/4.3/installanywhere/Web_Installers/但是均有各自问题:方原创 2015-11-12 14:22:41 · 2229 阅读 · 1 评论 -
PyTagcloud工具使用——显示中文词云
预备条件:电脑上装有1python 2 pygame然后再使用命令行装pyTagcloud注意:在windows下的话使用pip install命令的时候,如果你的Python不在user目录下,就不用多加--user参数,而是直接pip install pytagcloud开始:1、首先不管你用什么方法,TFIDF,词频统计或者已知词汇也好得到一个词表,因为要显示的就是他们,接下原创 2015-12-08 15:35:08 · 3244 阅读 · 1 评论 -
使用360浏览器出现域名解析错误和有道词典连接不了网络的解决方法
从易到难说:1、检查下自己的网络配置,打开网络和共享中心-更改适配器设置-点击右键属性-Internet协议版本4(TCP/IPv4)-打开后,检查自己的网络配置,尤其是DNS,可以使用自己局域网的DNS, 也可以使用公用的如谷歌的8.8.8.8或者阿里的223.5.5.5。这样做的好处就是可以仍使用自己的IP地址和配置。2、使用360,断网急救箱。简单粗暴,不好的就是会把网络配置改成自动原创 2015-12-22 11:05:47 · 5585 阅读 · 0 评论 -
如何在谷歌上建立自己的个人主页
见 http://www.360doc.com/content/15/0724/08/21544473_487024989.shtml原创 2016-02-17 11:35:19 · 4374 阅读 · 0 评论 -
使用HanLP配置文件经常消失
把备份hanlp.properties文件放在bin文件下即可原创 2016-03-10 11:50:05 · 1568 阅读 · 1 评论 -
在linux自己目录下(没有管理员权限)安装java
1、选择合适自己系统的Java版本下载。http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html (使用uname -a查看系统版本)2、放至一个目录下,假设直接放在自己的根目录/home/username/java下3、解压: 命令 tar -zxvf jdk....tar.gz原创 2016-04-02 16:09:58 · 3593 阅读 · 0 评论 -
如何将本地磁盘映射到服务器
见网页:http://jingyan.baidu.com/article/676629977fa5b454d51b84ac.html关键词:mstsc------>本地资源原创 2016-06-03 21:56:43 · 1556 阅读 · 0 评论 -
git常用命令(标黑放大属于常用命令)
git config --global user.name "xxx" # 配置用户名 git config --global user.email "xxx@xxx.com" # 配置邮件 git config --global color.ui true # git status等命令自动着色 git config --global转载 2016-06-06 20:41:19 · 757 阅读 · 0 评论 -
听Simon Peyton Jones讲如何写一篇伟大的论文
废话不多说,喜欢看原著的见这里 http://v.youku.com/v_show/id_XMTQ0MzcwODM3Mg==.html下面我来讲一下这个老师讲到的7个建议中我受益的地方:1、Don't wait. 改变以前做研究的思路 topic(idea)---do research---writer paper,这是大多数人一贯的做法而且我们确实一直以来受到这样的教育认为是对的。其实,原创 2016-01-25 23:11:39 · 811 阅读 · 0 评论 -
在python安装基础上两步命令安装Gensim
easy_install -U setuptoolspip install gensim解释:在gensim官网上点击打开链接有提示说有两种安装方法easy_install -U gensim或者pip install --upgrade gensim,但在cmd窗口打开试了下均不成功,看提示后才得知需要需要提前安装setuptools.检测:在python中输入Import gens原创 2015-06-17 13:45:04 · 1730 阅读 · 0 评论