- 博客(191)
- 收藏
- 关注
翻译 ggplot2杂记
ggplot2杂记 本文是我在阅读<<ggplot2 Elegant Graphics for Data Analysis (use R)>>时,所做的笔记,所谓好记性不如烂笔头,还是记下来用起来就方便了。1. ggplot2概览 ggplot2作为画图工具的利器,实现了数据到统计图的转换,如下图所示。 Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传La
2016-11-02 21:23:23 1305
转载 python中编码问题
原文链接:http://www.iteye.com/topic/560229一、 预备知识1, 常用字符集分类ASCII及其扩展字符集作用:表语英语及西欧语言。位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。范围:ASCII从00到7F,扩展从00到FF。ISO-8859-1字符集作用:
2015-05-09 23:41:49 2702
原创 数据集网址
1. http://projects.iq.harvard.edu/cces/home2. Opinion evolution model of social network based on information entropy
2015-02-03 17:05:07 4719
原创 数据挖掘之部分监督学习
本文的笔记来源于> Bing Liu著监督式学习:算法通过利用每个类别中的已标注数据来生成一个分类函数,需大量已标注数据来保证学习的准确性。【需大量标注,费时费力】部分监督学习(Partially Supervised Learning):(1)已标注和无标注数据中进行学习(Learning from Labeled and Unlabeled Examples) 【LU学习
2015-01-21 15:57:27 5743 1
原创 awk
本来参考资源:>1. awk命令行短程序通常是直接在命令行上提供,而比较长的程序,则委托-f选项指定。--是特殊选项,指出awk本身已没有更进一步的命令行选项。任何接下来的选项都可被程序使用。-F选项是用来重新定义默认字段分隔字符,且一般惯例将它作为第一个命令行选项。fs参数是一个正则表达式,或是被提供作为下一个参数,字段分隔字符也可设置使用内建变量FS所指定的
2015-01-20 18:14:15 874
原创 数据挖掘之无监督学习篇
本文主要是在看> Bing Liu著 的这本书的笔记1. 基本概念监督学习(Supervised Learning):通过发现数据attributes和类别attributes之间的关联模式,并通过利用这些模式来预测未知数据实例的类别属性。聚类(Clustering):是一种发现数据内在结构的一种技术,处于相同聚类中的数据实例彼此相似,处于不同聚类中的实例则彼此不同。【是一个将数据集
2015-01-20 12:01:12 3795 1
原创 学习资源
1. stanford大学开课(1)主页http://openclassroom.stanford.edu/MainFolder/HomePage.php(2)线性回归http://openclassroom.stanford.edu/MainFolder/DocumentPage.php?course=DeepLearning&doc=exercises/ex2/ex2.ht
2015-01-15 12:34:06 744
转载 shell中的特殊符号
原文链接:http://blog.itpub.net/10522540/viewspace-212846/在shell中常用的特殊符号罗列如下:# ; ;; . , / \ 'string'| ! $ ${} $? $$ $* "strin
2015-01-12 11:33:24 646
转载 准确率与召回率
原文链接:http://blog.csdn.net/wangzhiqing3/article/details/9058523在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(
2015-01-08 09:51:06 1010
原创 Shell脚本实训
1. 向多个user问好,并输出其IPuser信息存储在userInfo.txt中,内容为:fengtian pts/1 2015-01-06 08:47 (192.168.5.179)root pts/0 2015-01-01 14:06 (192.168.5.40)zhangqiang pts/2 2015-01-06 08:4
2015-01-06 15:58:53 1563
转载 shell中各种括号的作用()、(())、[]、[[]]、{}
原文来源:http://blog.csdn.net/taiyang1987912/article/details/395513851. 小括号,圆括号()(1)单小括号 ()①命令组。括号中的命令将会新开一个子shell顺序执行,所以括号中的变量不能够被脚本余下的部分使用。括号中多个命令之间用分号隔开,最后一个命令可以没有分号,各命令和括号之间不必有空格。②命令
2015-01-06 11:40:22 641
原创 Python中的numpy包
本文主要来源参考:http://wiki.scipy.org/Tentative_NumPy_Tutorial1. BasicsNumpy包中array【是ndarray class的】要求有相同的类型,维数被称作axes,axes的number是rank(秩),它与 Standard Python Library中的class array不同【仅能处理一维array】,可处理多维
2015-01-05 16:20:19 8922
转载 交叉验证(Cross Validation)方法思想简介
原文链接:http://blog.csdn.net/chl033/article/details/4671750交叉验证(CrossValidation)方法思想以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),
2015-01-05 09:40:20 1157
转载 Google网址大全
本文来源:http://www.admin10000.com/document/4615.html镜象:https://s3.amazonaws.com/google./index.htmlhttps://s3-ap-southeast-2.amazonaws.com/google6/index.htmlhttps://s3-us-west-1.amazon
2015-01-04 11:12:59 4183
原创 Linux、Shell实用用的网址
1. Shell for Beginner's guidehttp://www.freeos.com/guides/lsst/
2015-01-02 15:46:53 976
转载 python常用50个模块
本文来源:http://blog.csdn.net/pfanaya/article/details/7567077Graphical interface wxPython http://wxpython.org Graphical interface pyGtk http://www.pygtk.org Graphical interface pyQT
2015-01-01 23:25:08 754
原创 R与统计分析
本文主要来自>一书1. 基础知识(1)factor重命名################################################################## 将因素型转换重新命名#################################################################factorTest <- facto
2014-12-04 14:53:04 2372 1
转载 python与自然语言处理
大牛网址:http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE
2014-11-30 13:15:09 1506
转载 Python
本文来源:https://docs.python.org/3/reference/lexical_analysis.htmlhttp://www.cnblogs.com/frydsh/archive/2012/07/15/2592512.html1. Python Language Reference(1)Python的词法分析与语法分析词法分析(Lexical A
2014-11-27 18:10:18 734
原创 有用的网址
1. 语言类JS: http://www.lellansin.com/jade-%E6%A8%A1%E6%9D%BF%E5%BC%95%E6%93%8E%E4%BD%BF%E7%94%A8.html
2014-11-07 10:07:39 935
转载 查看R函数源代码
原文链接:http://wangjinshe33.blog.163.com/blog/static/17558281201371301051757/
2014-10-30 14:52:28 1713
转载 关于在R中使用C程序的一些问题
原文链接:http://www.math.pku.edu.cn/teachers/lidf/docs/statsoft/html/s/dll.html
2014-10-30 11:21:09 3262
原创 Writing R Extensions
1. Creating R packagespackage: a directory of files
2014-10-29 18:17:33 1323
转载 Texting Mining with R
原文链接: http://www.bjt.name/upload/pdf/Text%20Mining%20in%20R.pdf
2014-10-10 12:27:58 1832
原创 R相关的网站
R基础学习:http://jiaoyan.org/r/http://flowingdata.com/牛人们的博客:http://helloxxxxxx.blog.163.com/blog/#m=0&t=1&c=fks_084070092080086071085094094095086087087067085083086074081http://r-ke.in
2014-10-10 09:29:40 5672
转载 数据挖掘之聚类篇
一聚类,顾名思义就是把一组对象划分成若干类,并且每个类里面对象之间的相似度较高,不同类里面对象之间相似度较低或差异明显。与分类不同的是聚类不依靠给定的类别对对象进行划分。
2014-09-10 13:16:05 1651 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人