自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 数据挖掘---数据处理

大致流程:问题分析(需求分析),数据预处理(数据清洗,数据集成,数据归约),特征选择,模型选择(方案设计),模型求解,模型评估,模型解释,写成报告形式,展示。 先撇开问题分析不说,数据预处理是数据分析挖掘最重要也是最基本的步骤。因为数据的质量往往能决定结果的质量。所以本篇先不谈各种数据挖掘算法,先做好数据预处理的基本功才是最重要的。只做总结,不作细说一、认识数据 首先对数据进行一些基本的描述性统

2017-09-23 19:47:14 1207

原创 R语言绘图之ggplot2包

今天来迅速的学习下ggplot2包的简单绘图。 主要介绍了ggplot2中的基本元素:数据与映射,几何对象,统计变换,标度,坐标系,分面,还有直方图,柱形图等的使用方法。

2017-07-04 16:21:55 60490 1

转载 用python爬虫

python功能强大,但是目前最想尝试的是利用python爬取网络数据,觉得这个比较有意思,因此想先学习下网上python的爬虫教程。以下是转载自伯乐在线的文章,个人整合下,mark。之前已经看过了廖大大的python3教程,有一定的基础。 原文地址: http://python.jobbole.com/81334/一、综述 - Python urllib和urllib2 库的用法urlli

2017-05-22 14:07:08 1615 1

转载 Python3教程--协程(转自廖雪峰的官方网站)

在学习异步IO模型前,我们先来了解协程。协程,又称微线程,纤程。英文名Coroutine。协程的概念很早就提出来了,但直到最近几年才在某些语言(如Lua)中得到广泛应用。子程序,或者称为函数,在所有语言中都是层级调用,比如A调用B,B在执行过程中又调用了C,C执行完毕返回,B执行完毕返回,最后是A执行完毕。所以子程序调用是通过栈实现的,一个线程就是执行一个子程序。子程序调用总是一个入口,一次返回,调

2017-05-21 20:37:34 1557

转载 python---深入理解yield

原文地址: http://www.pythontab.com/html/2015/pythonhexinbiancheng_0415/946.htmlyield的英文单词意思是生产,刚接触Python的时候感到非常困惑,一直没弄明白yield的用法。 只是粗略的知道yield可以用来为一个函数返回值塞数据,比如下面的例子:def addlist(alist): for i in alis

2017-05-21 20:14:29 360

转载 异步IO的一些理解

转载地址: http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143208573480558080fa77514407cb23834c78c6c7309000廖大的python教程中的异步IO编程,一些网友的见解。Mark下来学习。(匿名sina网友V) I/O模型,同步异步,

2017-05-21 19:24:26 546

转载 递归算法

原文地址:http://blog.csdn.net/wangjinyu501/article/details/8248492 递归算法 递归算法是一种直接或者间接调用自身函数或者方法的算法。Java递归算法是基于Java语言实现的递归算法。递归算法的实质是把问题分解成规模

2017-05-21 16:01:27 892

原创 R语言学习总结---数据操作

接上一篇(R语言学习总结—基本数据类型) 补充: 类的判断 对象类型判断 mode() 判断存储的类型> mode(1:5)[1] "numeric"class() 判断数据的类> class(1:5)[1] "integer"根据数据的类,采用相应的处理方法。 以下函数,主要用在函数处理异常时使用,目的是增强程序的稳健性。 is.numeric() #返回值为TRUE或FALSE>

2017-05-13 21:55:12 1608

原创 R语言学习总结---基本数据类型

在大二就已经开始学R了,但是一直没有一篇总结的文章,今天顺便上来总结一下R语言的快速上手命令,以备日后翻阅。R的介绍R的基本操作基本数据类型数据操作语法绘图操作一些包的介绍一、R的介绍R是一种开源而且免费的软件。在统计学家中比较流行,它轻巧简便,约43M(相比matlab光是安装包就要接近8G)。R官网上还有许多已经开发好的包,可以直接下载来调用。R在统计功能上更加强大,R的下载和安

2017-05-13 15:22:19 1202

原创 用matlab实现k-means聚类

用matlab实现k-means聚类本文是大三下学期课程《数据分析方法》中的一些简单实现,部分内容摘自《大数据分析:方法和应用》一书。本文仅作为学习总结用,不作商用本文思路: 聚类的概念 k-means算法的思路和步骤 matlab的实现 运行结果分析一、聚类的概念 聚类是数据挖掘比较常见的方法,也相对比较简单。 聚类分析的目的在于把分类对象按一定的规则分成若干类,这些类没

2017-05-13 14:57:55 6195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除