自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xiaoshu的博客

记录,思考,积累

  • 博客(8)
  • 收藏
  • 关注

原创 python3 中文乱码与默认编码格式设定

python默认编码格式是utf-8。在python2.7中,可以通过sys.setdefaultencoding('gbk')设定默认编码格式,而在python3.3中sys.setdefaultencoding()这个函数已经没有了。在python3.3中该如何设置内置的默认编码格式啊!急求!!!(类似于“#coding:gbk”这种就不必来说了。能让import sys print(

2016-12-31 11:56:35 20139

转载 Python正则表达式

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re 模块也提供了

2016-02-02 22:43:51 746

原创 决策树与随机森林的R语言实现

1.用party包构建决策树以iris数据集为例。用ctree()建立决策树,用predict()对新数据进行预测。训练集与测试集划分:> str(iris)'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.W

2016-01-30 22:27:25 17689 4

原创 用R语言进行数据探索

以iris数据集为例做演示。1.查看数据> #1.查看数据集的大小和结构,维度、名称、属性。> dim(iris)[1] 150 5> names(iris)[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species" > str(iris)'data.frame': 15

2016-01-30 20:45:01 6132

原创 R语言数据的导入与导出

1.R数据的保存与加载可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中。> a <- 1:10> save(a,file='d://data//dumData.Rdata')> rm(a) #将对象a从R中删除> load('d://data//dumData.Rdata')> print(a) [1] 1 2 3 4 5 6

2016-01-30 16:13:21 74622 3

原创 数据挖掘综述

1.请用一句话介绍数据挖掘?数据挖掘是从大量数据中发现有趣知识的过程;它涉及多个交叉学科,如统计、机器学习、信息检索、模式识别、生物信息;它应用领域广泛,如电子商务、零售、金融、通信、社交媒体。2.数据挖掘主要包含哪些技术?分类与预测、聚类、离群点检测、关联规则、序列分析、时间序列分析、文本挖掘、社交网络分析与情感分析。3.请举出数据挖掘实施的流程与步骤?CRI

2016-01-30 11:41:27 1537

原创 R语言数据挖掘常用资源

1.CRAN任务视图CRAN提供了任务视图,https://cran.r-project.org/web/views/,将所有R程序包按照不同的处理任务组织起来。与数据挖掘相关的几个任务视图是:机器学习和统计学习聚类分析与有限混合模型时间序列分析多元统计空间数据分析2.R Reference Card for Data Mining它提供了一套完整的用于数据挖掘的R程序包和

2016-01-30 11:37:25 3437

原创 如何查看R中可获取的数据集有哪些?

Once you start your R program, there are example data sets available within R along with loaded packages.  You can list the data sets by their names and then load a data set into memory to be used in

2016-01-30 11:30:49 13167

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除