自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

九茶

强者自强,厚积薄发。

  • 博客(85)
  • 资源 (12)
  • 问答 (1)
  • 收藏
  • 关注

原创 R语言——哈希表

前言:在 R 语言中有个包——hash 包提供了我们需要的哈希结构,本文主要介绍该 hash 包的使用。 (使用之前先 install.packages(“hash”) 进行安装)其实,数据框也可以实现哈希表的功能,但是效率不高,操作不方便。 另外,在之前有个 rdict 包,使用起来就像 Python 里面的字典一样好用,详情请见:rdict: A hash table for R using

2015-08-21 00:25:25 13551 1

原创 ggplot2——柱状图

目录:初始图样 如何修改柱条的宽度 如何修改柱条的顺序 如何在柱条上添加文字 (更多关于图例、坐标系等内容请见:R、ggplot2、shiny 汇总) 初始图样:library(ggplot2)library(ggthemes)dt = data.frame(obj = c('A','D','B','E','C'), val = c(2,15,6,9,7))p = ggplot

2015-08-20 00:47:39 38792

原创 免安装Oracle连接数据库(odbc驱动)

前言:最近使用 R 开发数据分析系统,需要连接Oracle数据库获取数据,但是又不想为了拿几个数据而装一个Oracle,所以就想直接找个Oracle的odbc驱动,免去安装Oracle客户端的麻烦。以下对安装过程作个记录,希望能对大家有所帮助。 正文:下载:首先,我们需要下载两个驱动: instantclient-odbc-win32-11.2.0.1.0 和 instantclient-bas

2015-08-14 02:07:10 9598 7

原创 ggplot2——玫瑰图

更多内容请见:R、ggplot2、shiny 汇总初始图样:library(ggplot2)dt = data.frame(A = c(2, 7, 4, 10, 1), B = c('B','A','C','D','E'))windowsFonts(myFont = windowsFont("楷体")) ## 绑定字体p = ggplot(dt, aes(x = B, y = A, fill

2015-08-13 23:18:10 14111

原创 ggplot2——坐标系篇

目录:初始图样 如何修改坐标轴的显示范围 如何修改坐标轴的标签(内容、大小、字体、颜色、加粗、位置、角度) 如何修改坐标轴的刻度标签(内容) 如何修改坐标轴的刻度标签(大小、字体、颜色、加粗、位置、角度) 如何修改坐标轴的刻度间隔 如何去掉网格线 如何去掉刻度标签 如何去掉刻度线 如何去掉外层边框 如何再加上X轴、Y轴(无刻度、无标签) (更多内容请见:R、ggplot2、s

2015-08-13 22:23:08 190466 7

原创 决策树之 C4.5

C4.5 是对 ID3 的一个优化,它根据信息增益率来进行属性选择。 关于决策树,请参见:http://blog.csdn.net/bone_ace/article/details/46299681 关于 ID3,请参见:http://blog.csdn.net/Bone_ACE/article/details/46312215 关于 C4.5C4.5 主要针对 ID3 的缺陷作了一些优化

2015-08-13 12:41:24 4436

原创 ggplot2——饼图篇

目录:原始图样 如何去除饼图中心的杂点 如何去除饼图旁边的标签 如何去掉左上角多出来的一横线 如何去掉图例的标题,并将图例放到上面 如何对图例的标签加上百分比 如何让饼图的小块按顺时针从大到小的顺序显示 如何去掉白色外框上的数字 如何在图中加百分比 如何生成饼环 如何去掉饼环之外的框框和中间的坐标线 饼环的另外一种画法(geom_rect()) (更多内容请见:R、ggpl

2015-08-13 01:28:35 60859 13

原创 R——颜色篇

(更多内容请见:R、ggplot2、shiny 汇总 )转载请注明出处,谢谢!(原文链接:http://blog.csdn.net/bone_ace/article/details/47362619)

2015-08-11 21:06:45 150365 2

原创 ggplot2——主题篇

目录:如何插入主题?ggplot2自带的两个主题ggthemes包的十个主题(更多内容请见:R、ggplot2、shiny 汇总) 如何插入主题?方法一:library(ggplot2)set.seed(2015) diamond.part<-diamonds[sample(nrow(diamonds),100),] b = ggplot(diamond.part, aes(x =

2015-08-07 00:10:04 8820

原创 R语言的各种报错及其解决方法

前言:人不能在同个地方栽两次跟头,那样的生活效率太低。所以我一直以来都保持着随手记录的习惯。现在把近半个月来遇到的关于R语言的错误分享一下,希望能帮助到一些朋友,同时也希望各位朋友把遇到的已解决的、未解决的错误提出来一下,完善彼此的知识点,谢谢! 目录:连接数据库报错:negative length vectors are not allowed连接数据库报错:first argument i

2015-08-06 23:02:50 64401 15

原创 ggplot2——图例篇

目录:ggplot2中图例基础 如何隐藏图例? 如何隐藏图例标题? 如何更改图例顺序? 如何更改图例的标签文字? 如何设置图例标题和标签文字的大小、颜色? 如何将图例放到图的上方 (更多内容请见:R、ggplot2、shiny 汇总) ggplot2中图例基础:ggplot2会自动生成图例,我们可以对图例进行删改。相同名称相同颜色的图例会自动合并。如下图,点图和线图的color

2015-08-06 01:13:40 75124

原创 python字典--知识点总结

前言:代码使用python2.7 字典的创建:方式1:>>> d = {'a':2,'b':3,'c':5}>>> d{'a': 2, 'c': 5, 'b': 3}方式2:>>> d = {}>>> d['a'] = 2>>> d['b'] = 3>>> d['c'] = 5>>> d{'a': 2, 'c': 5, 'b': 3}方式3:>>> d = dict((['a',2]

2015-07-19 20:57:43 5096

原创 FP-Growth算法之频繁项集的挖掘(python)

前言:关于 FP-Growth 算法介绍请见:FP-Growth算法的介绍。 本文主要介绍从 FP-tree 中提取频繁项集的算法,关于伪代码请查看上面的文章。FP-tree 的构造请见:FP-Growth算法之 FP-tree 的构造(python)。 正文:tree_miner.py\color{aqua}{tree\_miner.py}文件:#coding=utf-8import tre

2015-07-04 00:29:51 6224

原创 FP-Growth算法之FP-tree的构造(python)

前言:关于 FP-Growth 算法介绍请见:FP-Growth算法的介绍。 本文主要介绍 FP-tree 的构造算法,关于伪代码请查看上面的文章。上接:FP-Growth算法python实现;下接:FP-Growth算法之频繁项集的挖掘(python)。 正文:tree_builder.py\color{aqua}{tree\_builder.py}文件:#coding=utf-8import

2015-07-04 00:18:33 7546 2

原创 FP-Growth算法python实现

前言:关于关联分析和FP_Growth的介绍请见:什么是关联分析、FP-Growth算法的介绍。本文主要介绍用 python 语言实现 FP_Growth 算法的代码。 正文:FP_Growth项目目录有四个文件: >FP_Growth  ▪ __init__.py  ▪ tree_builder.py  ▪ tree_building.py  ▪ tree_miner

2015-07-03 22:51:03 16406 11

原创 python实现二叉树和它的七种遍历

介绍:树是数据结构中非常重要的一种,主要的用途是用来提高查找效率,对于要重复查找的情况效果更佳,如二叉排序树、FP-树。另外可以用来提高编码效率,如哈弗曼树。 代码:用python实现树的构造和几种遍历算法,虽然不难,不过还是把代码作了一下整理总结。实现功能:树的构造递归实现先序遍历、中序遍历、后序遍历堆栈实现先序遍历、中序遍历、后序遍历队列实现层次遍历#coding=utf-8cl

2015-07-02 01:02:55 76788 17

原创 FP-Growth算法的介绍

引言:在关联分析中,频繁项集的挖掘最常用到的就是Apriori算法。Apriori算法是一种先产生候选项集再检验是否频繁的“产生-测试”的方法。这种方法有种弊端:当数据集很大的时候,需要不断扫描数据集造成运行效率很低。 而FP-Growth算法就很好地解决了这个问题。它的思路是把数据集中的事务映射到一棵FP-Tree上面,再根据这棵树找出频繁项集。FP-Tree的构建过程只需要扫描两次数据集。

2015-06-28 10:31:45 25913 5

原创 Apriori算法的介绍

前言:数据挖掘中的关联分析可以分成频繁项集的挖掘和关联规则的生成两个步骤,而Apriori算法是找频繁项集最常用到的一种算法。 关于关联分析和频繁项集请见:什么是关联分析? 中言:我们还是利用购物篮的例子来讲述Apriori算法的思路。 购物篮信息如下: TID Items 001 Cola, Egg, Ham 002 Cola, Diaper, Bee

2015-06-27 13:32:24 11966

原创 什么是关联分析?

引言:在认识什么是关联分析之前,先了解一下关联分析能用来干什么吧: 示例1:如下是一个超市几名顾客的交易信息。 TID Items 001 Cola, Egg, Ham 002 Cola, Diaper, Beer 003 Cola, Diaper, Beer, Ham 004 Diaper, Beer TID代表交易流水号,Items代

2015-06-26 13:06:29 14618

原创 python元组、列表的异同总结

定义的异同:列表(list):[]\color{blue}{[ ]}list是一种有序的集合,可以随时添加和删除其中的元素,用 [] 表示。 列表的三个特性:①创建之后也可以加减修改元素; ②元素可以是数字、字符、变量等,也可以混杂; ③列表可以嵌套。 例如:>>>f=3>>>list_example = [1, 'dog', f, ['monkey', 'duck']]>>>list_ex

2015-06-25 10:04:22 3440

原创 CSDN-Markdown语法集锦

前言:使用Markdown近一个来月,越来越觉得不舒爽! 改字体、改字号、改颜色、改样式,全不会!想加个数学公式,得,只会截图。把图片传上去了还不会控制大小,也不会控制文字与图片的排版,写出来的博客怎么看都还是有点丑!今天真忍不住了,这内容不咋地也就算了,排版也给弄漂亮点吧!今晚要搜遍网上各种关于Markdown语法的文章,作个总结! 表格:标题1|标题2|标题3 ---:|:-----:

2015-06-07 15:17:37 4890 3

原创 朴素贝叶斯

朴素贝叶斯算法是一种基于概率统计的分类方法,它主要利用贝叶斯公式对样本事件求概率,通过概率进行分类。以下先对贝叶斯公式做个了解。 贝叶斯公式条件概率:对于事件A、B,若P(B)>0,则事件A在事件B发生的条件下发生的概率为: P(A|B)=P(AB)P(B)P(A|B) = \frac{P(AB)}{P(B)}贝叶斯公式:将条件概率稍作转化即可得到贝叶斯公式如下: P(A|B)=P(B|A

2015-06-05 18:49:22 2650

原创 哲学家就餐问题

问题描述:五个哲学家(A~E)围着一张圆桌就餐,他们每个人面前都有一盘通心粉。由于通心粉很滑,所以需要两只筷子才能夹住,但每两个盘子之间只放着一只筷子,如下图。 哲学家只有两个动作:要么就餐,要么思考。而且他们之间从不交谈。 当一个哲学家饿了的时候,就拿起盘子左右两边的筷子开始就餐(不能同时拿起两只筷子)。就餐完以后,就把筷子放回盘子左右,继续思考。 由于他们之间互不交谈,所以很容易出现“死锁

2015-06-04 15:42:55 8116 2

原创 决策树之 ID3

ID3 是一种用来构建决策树的算法,它根据信息增益来进行属性选择。 关于决策树,请参见:http://blog.csdn.net/bone_ace/article/details/46299681 此处主要介绍 ID3 算法如何利用信息增益选择属性。 信息增益的计算:信息熵:信息熵,简称“熵”。假定训练集中目标属性为CC,CC 的取值为:C1,C2,…,CmC_1,C_2,…,C

2015-06-01 16:00:44 4363

原创 决策树

在众多分类算法中,决策树应该是最基本的一种算法了,也是相对比较简单的一种算法。 决策树的介绍:首先,什么叫做决策树?决策树用于解决什么样的问题?先看一个例子: 现有某银行客户拖欠贷款的历史数据,如表 3-1。现在一个新客户{ no, married, 80K, ? } 前来申请贷款,请你根据银行的历史数据判断这个人会不会拖欠贷款? 当然,客户最终是否会拖欠贷款,我们是无法100%确定的。但

2015-06-01 08:18:09 2809

原创 凸包问题的五种解法

前言:首先,什么是凸包? 假设平面上有p0~p12共13个点,过某些点作一个多边形,使这个多边形能把所有点都“包”起来。当这个多边形是凸多边形的时候,我们就叫它“凸包”。如下图: 然后,什么是凸包问题? 我们把这些点放在二维坐标系里面,那么每个点都能用 (x,y) 来表示。 现给出点的数目13,和各个点的坐标。求构成凸包的点? 解一:穷举法(蛮力法)时间复杂度:O(n³)。 思路:两点确

2015-05-29 17:58:51 60628 22

原创 python学习-知识点记录(Temp)

前言:此文章仅供自己使用,学习笔记记录。 知识点记录:命令行目录跳转: 如何使print输出不换行: 在print语句末尾加上一个英文逗号。安装第三方模块时,用pip和easy_install是一样的。下载一个setuptools.exe安装好就有easy_install,目录在python目录下的Scripts里面。在对文件读写的时候,对字符串有个方法strip()可以把读取的字符

2015-05-29 17:58:08 8398

原创 R学习-知识点记录(Temp)

前言:此文章仅供自己使用,学习笔记记录。 视频教程学习记录:视频地址:数据分析与R语言视频教程+课件。 书籍学习笔记:书籍:《统计建模与R软件》(薛毅编著)R树笔记:指数:2**3或者2^3。exp()指数;sqrt()开根号;range()范围,得到最小值和最大值;prod()求向量各分量的连乘积。中位数:median()、均值:mean()、方差:var()、标准差sd()等差数列:

2015-05-27 13:29:01 5221

原创 求圆周率的各种方法

求圆周率π!你能想到的有多少种方法呢? 今天对圆周率的求解方法作个整理、总结,因为感觉它挺好玩的。 (对于π的演算历史,可见百度π。最新的记录是2011年10月日本职员将小数点算到了10万亿位!!这得闲的有多蛋疼啊。。)方法一:等积代换这应该是最原始的解法了,把圆切成一个多边形,然后求出多边形的面积S。当这个多边形足够多边的时候,它的面积就近似等于圆面积了,然后由面积等式 π·r² = S 就可

2015-05-25 16:19:56 9021

原创 计算机如何实现开根号?

今天看到一个问题:计算机如何实现开根号?如何求一个数字的算术平方根(又叫开根号,或者开方)?大家普遍都是用计算器直接计算的,对于程序员来说,就是调用sqrt()方法。但是其内部又是怎么实现的呢?下面作了下总结。———-方法一:迭代法学过计算方法的应该都还有印象:一个函数 f(x) 在区间 [a,b] 上连续,且 f(x)=0 在 x∈[a,b] 上有解,求x? 最简单的就是用二分法:分别求f(

2015-05-20 14:58:16 20097 4

原创 数学名词的意义

前言:最近在重学概率论,遇到很多名词、公式,感觉很高大上,只是因为看不懂!虽然可以通过练题去熟悉各个公式的使用,但我觉得此刻有必要对各种名词进行系统的总结,认识各种名词所代表的现实意义,和它们之间的关系,然后才能更深入地把概率论学好。 注:对于一个名词 最重要的有两点,做什么用?和怎么用?此处只以通俗理解各名词的功用为目的,不深究其用法,不追求数学严谨性。 数学期望:设某人甲去赌钱,每次赌钱要4

2015-05-06 14:24:05 2256

原创 刷欢乐豆的方法

前言:每次能刷五万多,刷之前账号必须至少有1000欢乐豆。原理:淘宝上有低价卖欢乐豆,大家可知道? 先介绍一下他们的方法:店家用两个小号在“闷抓斗地主”场开一个桌子(加了密码的),你付款以后他们给你一个密码让你进入桌子。开始游戏后两个小号会一直“不出”,你可以一直赢,赢够五万欢乐豆了他们两个小号会自动退出,交易成功。(至于店家的两个小号哪里来的欢乐豆我们不管,我们只要进入了桌子,那两个小号就会输五

2015-04-19 11:48:51 22146 1

原创 R-pie()

普通饼图:> table(iris[,4])0.1 0.2 0.3 0.4 0.5 0.6 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5 5 29 7 7 1 1 7 3 5 13 8 12 4 2 12 5 6 6 3 8 3 3 >

2015-04-16 16:01:37 2369

原创 R-plot()

普通散点图:> BOD Time demand1 1 8.32 2 10.33 3 19.04 4 16.05 5 15.66 7 19.8> plot(BOD$Time,BOD$demand,main='主标题',xlab='X轴标题',ylab='Y轴标题',xlim=c(0,10),ylim=c(8,20),col

2015-04-16 10:37:11 3488

原创 10只老鼠与1000瓶药水

题目:1000 瓶无色无味的药水,其中有一瓶毒药,10只小白鼠拿过来做实验。喝了无毒的药水第二天没事儿,喝了有毒的药水后第二天会死亡。如何在一天之内(第二天)找出这瓶有毒的药水?思路:10只小白鼠,喝了药水之后第二天只有存在和挂掉两种情况,我们用计算机二进制里面的0和1来进行模拟,1代表喝、0代表不喝。【 二进制映射喝法:0000000001对应十进制编号第1瓶药水 】

2015-04-01 09:27:29 8479 1

原创 资源分享

不管是学习还是娱乐,生活中我们经常要找一些资源(例如各种教学视频、源代码、破解版的安装包,考试资料、报告文档,又或者最新电影等等)很多人都无从下手。其实网络是一个非常丰富、好用的资源库,只是你知不知道途径而已。下面推荐一下鄙人觉得很赞的平台、网站,希望对某天看到这篇博客的人有所帮助吧。(虽然说我这博客无人问津。。。至少是作为自己的一个总结吧)网盘、云盘:主要是百度云盘,

2015-03-25 14:54:20 10624 3

原创 第一只python小爬虫

前言:互联网就像一张无形的蜘蛛网,网站就相当于在这张网的交叉结点。而网络爬虫就是这张网上的蜘蛛,它是一种程序,能够利用url链接在各网站之间自动穿梭并抓取所需数据。学了python的正则表达式之后,我便迫不及待的想要找个应用玩一下,而网络爬虫就是个不二的选择。下面记录一下我写的第一只小爬虫,用来自动下载网页上的图片。(操作环境:32位Win8系统,运行工具:python2.7.9+Ec

2015-03-24 21:04:03 3842

原创 正则表达式之python实现

前文:首先,什么叫正则表达式(Regular Expression)?    例如我们要判断字符串"adi_e32fv,Ls"里面是否含有子串"e32f",又例如我们在一个含百万个姓名的txt文件中找姓“王”,名字以“五”结尾的名字,然后打印出来。结果为:“王五”、“王小五”、“王大五”、“王小小五”……    以前我们是使用字符串函数来查找的,但是代码实现起来会很复杂。如今用正则表达

2015-03-19 23:46:30 2448

原创 马踏棋盘之贪心算法优化

问题描述:曾经用简单的深度优先搜索方法、递归的形式对马踏棋盘进行搜索,运行效率不甚理想。(博客见马踏棋盘之递归实现)。所以现在用贪心算法将其优化了一下。问题解析:主要的思想没有变,还是用深度优先搜索,只是在选下一个结点的时候做了贪心算法优化,其思路如下:从起始点开始,根据“马”的走法,它的下一步的可选择数是有0—8个的。我们知道,当下一步的可选择数为0的时候,进行回

2014-11-28 23:43:44 21495 11

原创 八皇后之回溯法解决

问题描述:要在8*8的国际象棋棋盘中放8个皇后,使任意两个皇后都不能互相吃掉。规则是皇后能吃掉同一行、同一列、同一对角线的棋子。如下图即是一种方案:

2014-11-23 22:09:56 13510 24

SpringBoot实战,丁雪丰 译

别人20个积分放这个资源好贵呀,很多人都下不起,现上传一份供大伙使用。

2018-03-20

Python2.7.14 for windows64位 最新版下载

Python2.7.14,适用64位Windows系统,官网的下载速度特别慢,所以传一份到CSDN,欢迎下载。

2017-10-19

phantomjs-2.1.1-linux-x86_64.tar.bz2

Linux下使用PhantomJS,方法见http://blog.csdn.net/bone_ace/article/details/53213779 第一条评论。

2016-11-25

SublimeText3工具箱

包括文件:Sublime Text Build 3083 x64 Setup.exe、Sublime_Text_CN_3083.zip、 pylint-1.5.2.tar.gz、 Theme - Cobalt2、 使用说明.txt 更多情况请见博客:http://blog.csdn.net/Bone_ACE/article/details/50434050

2015-12-30

FP-Growth算法python实现(完整代码)

包含两个文件,一个是刚构造好FP-tree的代码,另一个是FP-Growth算法python实现的完全代码。更多的介绍请见博客:http://blog.csdn.net/bone_ace/article/details/46746727

2015-07-04

广工离散数学试卷集合

大广工离散数学07/08/12/13年试卷集合

2015-06-16

广工软件工程试卷+各种图

大广工软件工程试卷若干+类图、数据流图、顺序图、状态图、用例图

2015-06-16

广工计算机网络试卷大集合

广工计算机网络07/08/09/12年试题,加上二十几份练习试卷、考纲、知识点、课后答案等等,这些资料考个网络完全够了!

2015-06-16

广工数据结构试卷

大广工05年到10年数据结构试卷集合

2015-06-16

广工数值计算方法试卷

广工数值计算方法试卷5份

2015-06-16

广工Java实验+课设

广工2013年Java实验、课设、蜘蛛纸牌详细设计两份、Java学习笔记。含代码。

2015-06-16

广工数据挖掘12、13、14年试题+课后答案+知识点总结+上课PPT+课外资料

广工数据挖掘12、13、14年试题,课后习题及答案,数据挖掘知识点总结,数据挖掘上课PPT,数据挖掘课外资料

2015-06-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除