- 博客(28)
- 资源 (4)
- 收藏
- 关注
原创 利用Visio转换成pdf图形时的注意事项
我们在写毕业论文的时候,通常会画一些流程图之类的图形,这类图形通常需要手工绘制,而不是像数据分析图之类的,有现成的数据分析软件R、Python等可供自动绘制。我经常采用的手工绘制软件就有Visio。今天我要讲一讲利用Visio将画好的流程图转换成eps或者pdf格式时出现的陷阱。1 忘记选中当前页面当你画好图后,你也许会迫不及待地点击转换按钮,直接转换成pdf或eps格式,殊不知你讲整个Visio环
2015-10-24 20:39:17 27149 6
原创 我为什么不喜欢CTex套件中的CJK包及不再用CTex套件的原因
我从以下几个方面进行解释:CJK支持中文的方法是一种黑客手段1。已逐渐成为一种过时的、不方便使用的书写中文的方法。现在较新的是XeLaTeX中的ctexart,当然,如果你是高手的话,可以采用更加底层的fontspec等宏包直接使用更底层的中文字体处理命令来写中文。目前各个著名高校提供的学位论文LATEX\LaTeX模板,采用的都是UTF8编码格式。而CTex套件中的CJK包文档的书写采用的是G
2015-10-24 11:41:18 4681 1
原创 CountVectorizer.transform出现的一个错误的解决
问题该错误的出现还是跟我上一个博客中讲述的问题有关,因为我将CountVectorizer的参数input设置为file,所以在本博客出现问题的代码中,因为给它的是一个字符串列表,所以就会出现错误。先看出现问题的代码:new_post = ['imaging databases']new_post_vec = vectorizer.transform(new_post)print(new_pos
2015-10-21 19:34:44 4777
原创 使用vectorizer.fit_transform时出现AttributeError: 'file' object has no attribute 'lower'
问题最近在读书《Building Machine Learning Systems with Python》1第一版,发现其中的一个代码错误, AttributeError: ‘file’ object has no attribute ‘lower’产生该错误的代码为:import osos.listdir('./data/toy/')posts = [open(os.path.join
2015-10-21 11:53:23 9415
原创 Python3利用PyMySql连接MySQL数据库
由于一些书籍和博客讲解的方法不正确,在此给出正确的连接方法。我的环境是:Ubuntu 14.04Python 3.4.0安装sudo pip3 install PyMySQL连接import pymysqlconn = pymysql.connect(host='127.0.0.1',port=3306, user='root', passwd=
2015-10-16 09:23:30 6460 2
原创 Ubuntu系统上Python2和Python3共存时安装BeautifulSoup4
问题我的电脑安装的系统为Ubuntu 14.04,同时安装有python 2.7.6和python 3.4.0,我需要在python 3.4.0上面安装BeautifulSoup4,而直接采用下面命令:sudo apt-get install python-bs4则将BeautifulSoup4安装在了python 2.7.6上面。采用什么方法将其安装在与python2.7.6共存的python 3
2015-10-15 00:02:20 4765
原创 在Anaconda中安装python包seaborn
1 问题产生今天在看一个Ipython notebook的资料,题目是《Introduction to Scientific Computing with IPython》,我上来就开始运行下面代码,可是出现了错误的提示: 提示说找不到包seaborn。我之前安装的是Anaconda,将许多包已经打包安装在一起,没想到没有捎带将seaborn安装上。我又找了找Anaconda的安装路径,确认没
2015-10-13 20:26:12 41509
原创 Pandoc一个好用的格式转换工具
前几天吃过格式转换方面的亏,在从pdf转成doc文件方面。实际上pdf是由LATEX\LaTeX生成的。最后花费了我2天将pdf中的内容转换成doc,手工来做这种转换,效率之低下实在是让人难以忍受。所在,在自己的日常工作、学习中特别留意格式转换方面的工具。最终,我发现了pandoc这样一个优秀的格式转换工具,用了之后感觉好,心中立刻感觉到:这是一个迟到的工具。1 介绍也许上几天我在网上疯狂找格式转换
2015-10-13 16:55:54 9175
原创 将Ipython notebook转为pdf
本来这不应该成为一个问题,因为在jupyter的file菜单下面有download as pdf (via latex)菜单项目,但是当你点了该菜单项后,会出现一个错误的网页提示: nbconvert failed: Pandoc wasn’t found. Please check that pandoc is installed: http://johnmacfarlane.ne
2015-10-13 11:21:40 12643
原创 写学位论文时使用版本控制软件TortoiseSVN
今天读微博,无意中看到一条微博,建议使用TortoiseSVN来对自己的学位论文进行版本控制,是一个码农写的。我认为很好,就用了一番,感觉不错。TortoiseSVN在以前被我认为是很高大上的东西,我一直不敢碰它。因为要建立服务器端的配置,同时客户端也要相应的配置,对我来说是个很难的事情。可是如果放到单个人写自己的学位论文、仅仅进行版本控制和备份的需要,而不是多人协作的情况,那么情况就大大简化,仅仅
2015-10-13 09:07:21 2087
原创 Word Wrap (不加换行符自动换行)带来的好处
任何一个简单文本编辑器,例如Windows下的notepad、更加广泛使用的含有各种编码的编辑器NotePad++等,都有Word Wrap菜单项,一般是否默认打开由不同的编辑器规定。我在刚开始学电脑的时候就已经注意到这个功能,但没有太在意,认为它就是一个简简单单的功能,没什么大不了的。最近我经历的事情让我对它另眼相看了。我要讲一讲在NotePad++中没有使用它给我带来的麻烦及我推荐使用它的情况。
2015-10-12 22:52:52 3282
原创 小脚本清理垃圾文件使电脑变快
感谢下面的小脚本,每当我的电脑变慢的时候,我就运行一些下面给出的脚本,电脑瞬间感觉不一样,要快很多。优化很重要,不服不行。下面给出代码:@echo offecho 正在帮您清除系统LJ文件,请稍等......echo 本工具由aznmv3修正del /f /s /q %systemdrive%\*.tmpdel /f /s /q %systemdrive%\*._mpdel /f /s /
2015-10-12 20:50:34 902
转载 使用TortoiseSVN进行论文版本管理
最近开始写论文了,为了保险起见,需要对不同版本的论文进行各种存储和编辑。前段时间见到有同学按照“日期(上午/下午/晚上).docx”这种命名方式来分别存储每天各阶段的论文成果,以备不同版本的对比和恢复。作为一个码农,当然想参考源码版本管理的方式来对论文进行管理,当前源码版本的工具有TortoiseSVN、Github、Bibucket等,其中Github和Bibucket都需要与互联网服务器进行同步
2015-10-12 20:10:50 1993
原创 Pdf转doc的感受
一个含有大量中文的pdf文档因故需要转成doc文档。折腾了好久,最终得结果仍然不理想。使用的好多的软件,有的是收费的(没有使用);有的只转换前面几页,想转换更多的页面,需要注册用户,同时缴纳部分费用;有的一插件的形式加到word中去来转换的。它们转换的结果大都很差,60页的文档有58页的乱码。分析原因,可能是利用latex生成pdf的时候的设置问题,我也不明白其中真正的原因。就是我直接利用拷贝的办法
2015-10-09 17:51:42 904
原创 使用ctexart排版中文时\\的语义的改变
在通常的英文排版时,连续两个斜杠\\表示接下来是一个新的段落,中间不用加空行。但是在ctexart类下使用\\时表示另起新的一行,而不是一个新的段落。而两个段落间加一个空行,还是保证它的通常的语义。注意我是利用UTF-8编码,使用xelatex编译命令编译的。
2015-10-09 10:59:39 1454
原创 对TeXworks编辑器再感受
1 原来印象8月底刚装上Texlive 2015那会,我对装在我Win7电脑上面的默认编辑器TeXworks用了一次,立刻就不用了,而改用在Notepad++中编写tex文件,在console中,即Windows中的cmd程序中编译tex文件方式。这种方式一直持续到昨天。我开始对其印象不好的原因是:编辑部分和pdf预览部分各占半个屏幕,而当时在暑假时我在一台笔记本电脑上,而该电脑的屏幕相当的小。整
2015-10-09 10:23:14 11684 2
原创 一个完整的利用xeCJK包书写中文文档的例子
以UTF-8编码格式将下面代码书写到test.tex中:\documentclass[12pt]{article}\usepackage{fontspec}\usepackage[BoldFont,SlantFont,CJKchecksingle]{xeCJK} %[BoldFont,SlantFont,CJKchecksingle]\setCJKmainfont[BoldFont=SimHe
2015-10-08 21:24:32 5447
原创 xeCJK时的警告:xeCJK warning: "CJKfamily-Unknown"
在使用xeCJK时出现下面的警告信息: \ *************************************** * xeCJK warning: “CJKfamily-Unknown” * * Unknown CJK family \CJKsfdefault' is being ignored. * * Try to use\setCJKsansfo
2015-10-08 21:07:09 7265
原创 XeLeTeX字体警告"EU1/SimSun(0)/m/it' undefined的原因
我们在利用XeLaTex编译写的含有中文的.tex文件时,例如,以下面开头的:\documentclass[12pt]{article}\usepackage{fontspec}\usepackage{xeCJK} \setCJKmainfont[BoldFont=SimHei]{SimSun}\setCJKmonofont{SimSun}% 设置缺省中文字体...文件时,当然上面文件已U
2015-10-08 20:15:32 8963
原创 Win7系统上利用Texlive2015写含有中文文档应该注意的问题
在Win7系统上面利用Texlive2015的XeLaTeX编译含有中文文档的时候,有一些问题需要注意。这就是: 想让最终编译的结果正确显示中文,你就必须采用UTF-8编码的.tex源文件;而如果你采用ANSI编码格式的.tex文件时,编译结果中英文字体能正确显示而中文字体不显示,编译log信息不提示任何错误信息。上面结果是经过我的实践总结出来,没有任何人告诉我或参考任何资料。再次强调,我的电
2015-10-08 14:55:46 6754
原创 Win7系统上查看TexLive2015可访问的中文字体
在使用XeLaTex编写含中文的文档时,需要知道究竟哪些系统中文字体TeXLive2015能够访问。我是在Win7上面安装的TexLive2015。任意打开一个console程序,在其中输入:fc-list :lang=zh >ls.txt然后,利用记事本打开文件ls.txt,你会发现好多乱码: 我利用notepad++打开上面文件,能正确显示内容: 我发现利用notepad++打开该文件
2015-10-08 12:13:53 2962
原创 利用7-zip软件压缩并加密自己的保密文件
生活在一个高度信息化的社会里,不懂得一点信息安全的知识是不行的,尤其是牵涉到保密性很强的文件时。读一读相关的信息泄露而造成重大损失的例子,就会更加增强你的信息安全的主动性。本文介绍的就是一款免费的文件加密和压缩软件—7-zip。1 下载和安装点击该网站下载7-zip安装程序。当你进入该网站的网页时会出现: 由于我的电脑是32位的Windows系统,所以下载的是上图中红色椭圆部分的版本。相信绝大
2015-10-07 11:21:31 12159
原创 pdf文档统计字数的问题
1 问题以前也遇到过这样的问题,总是采用笨方法,即将pdf文档中的内容拷贝到word中,利用word中的字数统计功能得知pdf文档的当前总字数。这种“曲线救国”的方式,我总感觉太麻烦,认为应该存在更加简单的方法。可是我错了,一些不用拷贝到word中的做法,一旦用于统计中文字数,其统计结果立即就变得不准确了。2 不转word统计字数方法—abracadabraCompteur 2.5 (对中文无效)首
2015-10-06 10:09:21 12127
原创 LaTeX中表格单元格中内容自动换行 (Wrap text)问题
以前也遇到过该问题,但没有深究,采用的是一个非常笨的方法,将表格另起一行,将需要换行的那个单元表格的内容写在新的行中的对应单元格中,而新行的其他所有单元格都保持为空白。这是一个非常不好的办法。 今天,我在此遇到该问题,终于将该问题弄明白。原来table命令中本来就有就有让单元格自动换行的参数命令。先看不自动换行的表格带来的丑陋面貌: 可以看出C级出版社那一列已经跑出页面,很不好看。修正后的代码如
2015-10-05 19:09:02 96013 5
原创 LaTeX分情况公式的书写
在利用LATEX\LaTeX语言写论文的时候,有时你会利用它写一些分情况的公式。这个问题是一个比较简单的问题,可是当你每隔几个月才用一次LATEX\LaTeX写论文的时候,你会发现又忘记怎么书写它们了。我反反复复碰到这种情况几次,为了方便我查找,最终还是决定将该代码块写在我的博客中,一是方便查找,二是给有需要的人提供帮助。分情况公式代码书写举例:\[ BS(x) = \begin{case
2015-10-05 09:57:11 11802
原创 R语言利用ggplot画图时调整坐标轴字体大小
利用ggplot画好图,并把它插入到论文中后,你会发现默认的字体大小12pt太小了,与LATEX\LaTeX中图的caption大小不匹配,为此,你需要在利用ggplot画图的时候一开始就要调整到你需要的大小。我经过摸索,发现将字体调整为14pt比较合适。R的具体代码如下所示:library(ggplot2)acs = read.csv("newJScs.csv",header=T)pdf(fi
2015-10-05 09:48:10 68946
原创 利用R语言的ggplot2包画分组boxplot
先按照以下格式准备数据,将其命名为newXZcs.csv: grade, salary 1, 2320 1, 2480 1, 2640 1, 2800 1, 2960 1, 3120 1, 3280 1, 3440 1, 3600
2015-10-03 23:59:48 20623
原创 感悟--网络找答案
在使用R、Python、LATEX\LaTeX等语言编程的时候,我们可能会遇到一些问题,需要查找针对该问题的答案。我们可能去一些大部头的专门的著作里面去找这些问题的答案,因为这些书是系统的讲解整体知识,不含有针对某个问题的具体的答案,况且,纵然大部头很厚,也很难把所有问题都面面的讲到。有时候在网络上面搜寻自己遇到的问题的答案时,按中文意思搜的时候,搜寻的结果往往不含自己要找的答案;而改用英文,当然你
2015-10-03 22:46:24 916
Expert Systems Principles and Programming (Third Edition)
2018-09-07
Metamath: a computer program language for pure mathematics
2011-06-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人