- 博客(8)
- 收藏
- 关注
原创 python3 中文乱码与默认编码格式设定
python默认编码格式是utf-8。在python2.7中,可以通过sys.setdefaultencoding('gbk')设定默认编码格式,而在python3.3中sys.setdefaultencoding()这个函数已经没有了。在python3.3中该如何设置内置的默认编码格式啊!急求!!!(类似于“#coding:gbk”这种就不必来说了。能让import sys print(
2016-12-31 11:56:35
20139
转载 Python正则表达式
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re 模块也提供了
2016-02-02 22:43:51
746
原创 决策树与随机森林的R语言实现
1.用party包构建决策树以iris数据集为例。用ctree()建立决策树,用predict()对新数据进行预测。训练集与测试集划分:> str(iris)'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.W
2016-01-30 22:27:25
17689
4
原创 用R语言进行数据探索
以iris数据集为例做演示。1.查看数据> #1.查看数据集的大小和结构,维度、名称、属性。> dim(iris)[1] 150 5> names(iris)[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species" > str(iris)'data.frame': 15
2016-01-30 20:45:01
6132
原创 R语言数据的导入与导出
1.R数据的保存与加载可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中。> a <- 1:10> save(a,file='d://data//dumData.Rdata')> rm(a) #将对象a从R中删除> load('d://data//dumData.Rdata')> print(a) [1] 1 2 3 4 5 6
2016-01-30 16:13:21
74622
3
原创 数据挖掘综述
1.请用一句话介绍数据挖掘?数据挖掘是从大量数据中发现有趣知识的过程;它涉及多个交叉学科,如统计、机器学习、信息检索、模式识别、生物信息;它应用领域广泛,如电子商务、零售、金融、通信、社交媒体。2.数据挖掘主要包含哪些技术?分类与预测、聚类、离群点检测、关联规则、序列分析、时间序列分析、文本挖掘、社交网络分析与情感分析。3.请举出数据挖掘实施的流程与步骤?CRI
2016-01-30 11:41:27
1537
原创 R语言数据挖掘常用资源
1.CRAN任务视图CRAN提供了任务视图,https://cran.r-project.org/web/views/,将所有R程序包按照不同的处理任务组织起来。与数据挖掘相关的几个任务视图是:机器学习和统计学习聚类分析与有限混合模型时间序列分析多元统计空间数据分析2.R Reference Card for Data Mining它提供了一套完整的用于数据挖掘的R程序包和
2016-01-30 11:37:25
3437
原创 如何查看R中可获取的数据集有哪些?
Once you start your R program, there are example data sets available within R along with loaded packages. You can list the data sets by their names and then load a data set into memory to be used in
2016-01-30 11:30:49
13167
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人