- 博客(14)
- 资源 (4)
- 收藏
- 关注
原创 何时需要对时间序列进行Log Transformation
处理时间序列数据时,经常需要对数据进行预处理,然后在使用复杂模型处理数据。其中,常用的一种方法就是对数据取log,进行log变形。那么什么样的时间序列数据需要进行取log呢?查阅资料发现,如果数据满足如下两点,就比较适合take log。每个时刻的数据都为正数(为0时,可以通过+1来变为正数)数据的变化量随着时间的增加,指数级增加以一个具体的例子来看:原始数据:
2015-08-31 06:43:26 9347 3
原创 几个将汉字转换成拼音的在线工具
编程时,经常遇到由于汉字兼容性差带来的困扰。解决的方法之一就是使用汉语拼音来代替汉字,(使用英语翻译比较费时)。将汉语转换成拼音的方法有很多,可以通过编程实现,比如借助于pinyin package,也可以使用现在工具,直接将汉语转化为拼音。需要注意的是,在汉字转化成拼音时,需要注意尽量不要保留声调,因为声调的兼容性也比较差。支持不带声调的汉字转化成拼音的在线工具如下:http://www
2015-08-26 07:02:53 3739 3
原创 Excel 2013导出图表的两种方法
使用Excel时,经常需要将绘制的图形导出成PDF或者PNG等图片格式。最简单的一个方法就是使用截图工具,将需要导出的图进行截图,然后另存为所需格式。该方法效率较高,但是效果不够美观。本文推荐两种方法,分别将excel中的图表导出为pdf和png格式。方法1:选中将要导出的图表,点击print,选择Microsoft Print to PDF或者系统上安装的第三方打印机,比如Nit
2015-08-24 12:59:56 17670 1
原创 Excel中高亮一行中最小的数据
Excel可以很方便的高亮出一行中最值数据,以高亮最小值为例:选中将要高亮的数据选择home选项卡,选择conditional formatting选择new rules,在弹出的对话框中输入=第一行起始点=MIN(第一行起始点:第一行终止点),然后点击Format在Format弹出的对话框中,选择Fill选项卡,选择将要高亮的颜色。点击ok按钮,退回到New Format
2015-08-24 12:30:51 6916
原创 Windows平台上安装scikit-learn包的方法
在Windows平台上首先安装Python 3.4 EXE或者MSI安装包,然后从https://pypi.python.org/pypi/scikit-learn下载scikit-learn相应的EXE安装包。在安装过程中可能会遇到如下问题:显示在注册表中找不到Python 3.4。该问题很可能是由于scikit-learn与Python的版本号不一致造成的。版本号不一致分为两个部分
2015-08-24 04:26:31 3215
原创 Python 3.x中的除法
Python 3.x中改变了division运算:例如:5/4 = 1.25 而不是 15//4 = 1 而不是1.25但是在Python 2.x中5/4 = 1 而不是1.25
2015-08-24 03:33:07 6177
原创 R语言中按照列之和进行升降排序data frame
R中按照列之和进行升序排序:data = data[,order(colSums(data))]R中按照列之和进行降序排序:data = data[,order(colSums(data),decreasing = TRUE)]
2015-08-21 22:10:07 13890
原创 LaTeX排版指定行列的子图
在写paper时,经常遇到LaTeX排版指定行列的子图形。以2X2子图为例,代码如下:\usepackage{subfig}\begin{figure*}[!htb] \centering \subfloat[Location of Cell Towers]{\includegraphics[width=0.47\textwidth]{figures/geo_tower.pdf}}
2015-08-20 05:37:40 8680
原创 K-means算法原理以及其缺点
K-means是一种经典unsuper的聚类算法。其算法描述如下:输入:聚类个数-k,N个数据对象输出:每个数据对象所属的聚类label(满足方差最小)从N个数据对象中挑选出k个质心。计算N个数据对象距离不同质心的距离,并将N个数据对象划分到与之距离最小的质心,形成新的k个聚类。重新计算步骤2中获取新的k个聚类的质心,计算方法为求取聚类中所有数据对象的均值。重复2-3步
2015-08-12 10:30:21 6261
原创 调试程序心得-1
多总结,多思考,多沟通是一种很好的工作方式。很多事情看似简单和随意,但将这些事情书写出来和在脑子里打转,对以后工作的effect factor是有很大差别的。于是,写下今天调试代码的心得。调试的过程就是从现象追溯会源头的过程。关于现象的观察,可以使用强大的debug工具,也可以使用最原始的方法——打印出错信息。很多事情,我都是使用后一种。关于现象的观察,粒度有粗有细。比如,今天我调试一
2015-08-06 09:51:53 3512
转载 硬盘构造及其工作原理
一、硬盘原理之硬盘的组成 硬盘大家一定不会陌生,我们可以把它比喻成是我们电脑储存数据和信息的大仓库。一般说来,无论哪种硬盘,都是由盘片、磁头、盘片主轴、控制电机、磁头控制器、数据转换器、接口、缓存等几个部份组成。 图1 硬盘组成图 所有的盘片都固定在一个旋转轴上,这个轴即盘片主轴。
2015-08-05 05:14:19 2406 1
原创 LaTex I found no \bibdata command 解决方案
最近在使用TeXnicCenter编译latex文件的时候,遇到了如下问题,检查N次文件后,没有发现明显的错误。查看生成文件发现,bbl文件不能由bib文件成功生成,于是尝试使用BibTex编译bib文件,但不能通过。I found no \citation commands---while reading file BA.auxI found no \bibdata command---
2015-08-03 21:42:35 39705 1
原创 LaTex不能预览生成的PDF文件的解决办法
使用texniccenter工具编译生成PDF文件并同时预览生成的PDF文件时,遇到了 docopen bm.pdf fileopen bm.pdf cannot execute错误。解决的思路和步骤如下:首先,需要明白的是PDF文件已经成功生成了,问题出在预览部分。然后,查看预览部分出错的原因。原因无非有如下几种:PDF预览软件没有安装,指定的PDF预览软件路径或名称错误,没有权限打
2015-08-03 05:15:01 142708 13
兔子过河C语言代码小游戏
2009-08-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人