- 博客(8)
- 收藏
- 关注
转载 R语言进阶之3:数据汇总/透视/提炼
2013-05-16 09:37 xxx 网易博客 字号:T | T汇总、透视、提炼、凝炼,对数据处理来说这些词的意思都差不多,R语言提供了很多函数处理这些事情,还有一些软件包也提供了非常方便的数据汇总功能,方法不胜枚举。summary是获取数据概要最常用的函数,应该很熟悉了。这里只简单介绍rowSums, colSums, rowMeans, colMeans, tabl
2013-12-12 16:17:51 1148
转载 R语言进阶之2:文本(字符串)处理与正则表达式
R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。高效处理文本少不了正则表达式(regular expression),虽然R在这方面先天不高效,但它处理字符串的绝大多数函数都使用正则表达式。0、正则表达式简介:正则表达式不是R的专属内容,所以用0编号,这里也只简单介绍,更详细的内容请查阅其他文章。正则表达式是用于描述/匹配一个
2013-12-11 15:52:26 1308
转载 网络爬虫基本原理
网络爬虫是捜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网上的网页下载到本地形成一个或联网内容的镜像备份。这篇博客主要对爬虫以及抓取系统进行一个简单的概述。一、网络爬虫的基本结构及工作流程 一个通用的网络爬虫的框架如图所示: 网络爬虫的基本工作流程如下: 1.首先选取一部分精心挑选的种子URL; 2.将这些URL放入待抓取URL队列;
2013-12-05 18:21:12 1037 1
转载 位操作
一、基本位操作|或&与~取反^异或左移>>右移二、位操作的常见用法1.获取某位的值#define BitGet(Number,pos) ((Number)|= 1(pos)) //把某位置1 #define BitGet(Number,pos) ((Num
2013-12-05 17:18:31 700
原创 #define 宏函数的应用
1.简单的define定义#define MAXTIME 1000一个简单的MAXTIME就定义好了,它代表1000,如果在程序里面写if(i编译器在处理这个代码之前会对MAXTIME进行处理替换为1000。这样的定义看起来类似于普通的常量定义CONST,但也有着不同,因为define的定义更像是简单的文本替换,而不是作为一个量来使用,这个问题在下面反映的尤为突出。2.
2013-12-05 17:07:48 2131
转载 C语言中嵌入正则表达式
标准的C和C++都不支持正则表达式,但有一些函数库可以辅助C/C++程序员完成这一功能,其中最著名的当数Philip Hazel的Perl-Compatible Regular Expression库,许多Linux发行版本都带有这个函数库。C语言处理正则表达式常用的函数有regcomp()、regexec()、regfree()和regerror(),一般分为三个步骤,如下所示:
2013-12-05 16:19:30 519
转载 HTTP协议
深入理解HTTP协议http协议学习系列1. 基础概念篇1.1 介绍 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写。它的发展是万维网协会(World Wide Web Consortium)和Internet工作小组IETF(Internet Engineering Task Force)合作的结果,(他们)最终发布了一系列的RF
2013-12-05 14:05:18 1338
原创 我的博客开通了,欢迎大家的到来!!!
工作好几年了,零零散散的一些感悟,昙花一现,许多学习知识,没有整理归纳。 人需要一个平台,去归纳总结,需要有个地方,停下来,想想未来的发展,烦闷的时候,需要一吐为快,开心的时候,和大家分享。
2013-12-04 09:01:10 412
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人