- 博客(5)
- 收藏
- 关注
转载 R中的普通文本处理-汇总
介绍:1. 文本文件的读写2. 字符统计和字符翻译3. 字符串连接4. 字符串拆分5. 字符串查询6. 字符串替换7. 字符串提取 说明: 普通文本文件不同于我们平时接触到的表格式文本文件,这里的文本文件是纯文本文件,里面包含的大部分都是字符串;而表格式文本文件大多是行列比较整齐的数据文件,读取这一类的文件,需要用到read.table()或read.csv()之类的函数。 关于正则表达式的介...
2018-07-10 12:41:49 2261
原创 大数据简介
Evolution in Big Data technologies, help businesses to:Enhance and streamline existing databasesAdd insight to existing opportunitiesExplore and exploit new opportunitiesProvide faster access to informationAllow storage of large volumes of inform
2018-07-06 14:39:38 1403
原创 支持向量机
支持向量机(Support Vector Machine, SVM)是统计机器学习和数据挖掘中常用的一种分类模型。从逻辑回归到线性分类与非线性分类> install.packages("e1071", dep = TRUE, type = "source") # 正确的安装软件包> iris[1:5,] # datasets软件包中的iris数据集 Sepal.Length ...
2018-07-05 11:23:40 281
原创 数据结构基础知识
列表列表的创建列表是“递归型”的向量,即列表中的元素是可以再分的。以超市货品数据为例,可以用列表A存储每一种货物,列表A中的每一种元素可被视为一种货物。对于每一种货物,可以用列表B存储其各方面的属性,比如名称,价格,生产日期等信息。> goods <- list(name = "Cookie", price = 4, outdate = F)> goods$name[1]...
2018-07-04 21:22:33 470
原创 R语言数据的输入和输出
数据的载入 R本身已经提供了超过50个数据集,而在众多功能包中,默认的数据集被存放在datasets程序包中,通过函数data()k可以查看系统提供所有的数据包,同时可以通过函数library()加载程序包中的数据。矩阵型数据最常用的读取方式是read.table()具体的调用格式是()read.table(file, header = FALSE, sep = "", quote = ...
2018-07-03 16:35:41 17715
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人