goldendata
码龄15年
关注
提问 私信
  • 博客:245,799
    社区:540
    246,339
    总访问量
  • 43
    原创
  • 1,763,151
    排名
  • 13
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2009-12-09
博客简介:

goldendata的博客

博客描述:
杂记,不专业。
查看详细资料
个人成就
  • 获得31次点赞
  • 内容获得11次评论
  • 获得76次收藏
  • 博客总排名1,763,151名
创作历程
  • 1篇
    2015年
  • 8篇
    2014年
  • 53篇
    2013年
成就勋章
TA的专栏
  • 视角与观点
    1篇
  • R
    22篇
  • SAS
    2篇
  • mysql
    2篇
  • Sql Server
    5篇
  • 课程笔记-R
    4篇
  • AA
    3篇
  • 统计
    6篇
  • Oracle
    1篇
  • R实战阅读
  • 数学
    1篇
  • SPSS
    1篇
  • 数据挖掘
  • 杂记
    1篇
  • java
    3篇
  • hadoop
  • linux
  • 常用工具
  • Python
    3篇
  • Data Mining
    2篇
兴趣领域 设置
  • 人工智能
    深度学习
创作活动更多

『技术文档』写作方法征文挑战赛

在技术的浩瀚海洋中,一份优秀的技术文档宛如精准的航海图。它是知识传承的载体,是团队协作的桥梁,更是产品成功的幕后英雄。然而,打造这样一份出色的技术文档并非易事。你是否在为如何清晰阐释复杂技术而苦恼?是否纠结于文档结构与内容的完美融合?无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

51人参与 去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

廖雪峰Python教程学习笔记

廖雪峰写了一个Python教程,比较基础,文风也比较口语化,阅读学习体验都不错,推荐给需要者。本博文记录阅读该教程的一些总结和遇到的问题。1. 在dict和set中使用tuple事实证明将元组放入set。如果元祖中包含可变元素,报错。不然则将元祖中所有元素加入set。对于dict也是如此,看下面的例子:>>> n = (1,[2,3]) #元组中包含可变
原创
发布博客 2015.10.18 ·
6213 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

How to use function in Python(Reship)

Python中的函数(一)  接触过C语言的朋友对函数这个词肯定非常熟悉,无论在哪门编程语言当中,函数(当然在某些语言里称作方法,意义是相同的)都扮演着至关重要的角色。今天就来了解一下Python中的函数用法。一.函数的定义  在某些编程语言当中,函数声明和函数定义是区分开的(在这些编程语言当中函数声明和函数定义可以出现在不同的文件中,比如C语言),但是在Python中,函数声明和...
原创
发布博客 2014.10.18 ·
433 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Using Python to write Hadoop MapReduce program(Reship)

转载自:http://isilic.iteye.com/blog/1750271  使用 Python 编写 Hadoop MapReduce 程序 以前写 Hadoop 的 MapReduce 程序时,使用的是 Java ,利用 Java 写起来是轻车熟路,没有问题,但是使用 Java 很明显的一个弊端就是每次都要编码、打包、上传、执行,还真心是麻烦,想要更加简单的使用 ...
原创
发布博客 2014.10.11 ·
279 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Brief introduction to LASSO (Reship)

使用数理统计模型从海量数据中有效挖掘信息越来越受到业界关注。在建立模型之初,为了尽量减小因缺少重要自变量而出现的模型偏差,通常会选择尽可能多的自变量。然而,建模过程需要寻找对因变量最具有强解释力的自变量集合,也就是通过自变量选择(指标选择、字段选择)来提高模型的解释性和预测精度。指标选择在统计建模过程中是极其重要的问题。Lasso算法则是一种能够实现指标集合精简的估计方法。    Tibshir...
原创
发布博客 2014.10.09 ·
289 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Recognize (multi)collinearity in a regression model

The kappa() function can help. Here is a simulated example:> set.seed(42)> x1 <- rnorm(100)> x2 <- rnorm(100)> x3 <- x1 + 2*x2 + rnorm(100)*0.0001 # so x3 approx a li...
原创
发布博客 2014.10.05 ·
281 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Bitwise and Bit Shift Operators in Java

按位与运算符(&)参加运算的两个数据,按二进制位进行“与”运算。运算规则:0&0=0;   0&1=0;    1&0=0;     1&1=1;       即:两位同时为“1”,结果才为“1”,否则为0例如:3&5  即 0000 0011 & 0000 0101 = 0000 0001   因此,3&5的值得...
原创
发布博客 2014.10.05 ·
273 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Error Collections in Java

本文记录遇到的各种Java报错提示。 1.Cannot make a static reference to the non-static field  无法在静态方法中引用非静态变量 。public class Test { byte aa; short bb; int cc; long dd; double ee; float ff; boolean...
原创
发布博客 2014.10.04 ·
173 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

What is the difference between data types and literals in Java?

最近学习Java,看的是Oracle的官方Tutorials,其中有一个单词“literals”经常遇到,但总不能正确对应到专业的中文术语。于是Google了一下,发现Stackoverflow上有一帖子讨论了这个问题:What is the difference between data types and literals in Java? 看罢,才恍然明白,原来literals就是...
原创
发布博客 2014.10.02 ·
265 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

简单区分Vmware的三种网络连接模式(bridged、NAT、host-only)

摘要: 简单区分Vmware的三种网络连接模式(bridged、NAT、host-only)最近一段时间开始接触linux,为了学习方便就在vware上安装了CentOS,下面是转载的有关vmware连接网络的三种模式的区别(在此非常感谢原创作者的分享)Vmware在安装时默认安装了两块虚拟网卡,VMnet1和VMnet8,另外还有VMnet0。这些虚拟
转载
发布博客 2014.01.14 ·
921 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

R的几种编辑器的选择与配置

http://jekyll.math.byuh.edu/other/howto/notepadpp/这个网站提供了R的几种编辑器的特性描述、安装方法、配置、使用方法,对于学习R的人来说帮助很大。比如npp2R,TinnR等等。慢慢琢磨吧。
原创
发布博客 2013.12.07 ·
6476 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

notepad如何设置背景

本文转载自:http://blog.csdn.net/fly542/article/details/7101118经常试用notepad++看代码,白色的背景连续看的时间长了眼睛很容变花,所以找了相关的设置选项,分享给大家具体设置步骤如下:  然后如下设置  这样前景色背景色已经发生改变了哟,下面再修改下选
转载
发布博客 2013.12.07 ·
1489 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java学习

本博文为学习高淇老师java视频的笔记。1.不仅要学习java的语法,更要深入到内存结构、分析JDK源代码。高手都拥有好的习惯,打好基础是关键。2.所有代码现场手敲,真实展现代码编写过程。3.第一季98集,主要讲解java编程基础,通过游戏项目提高编程能力。打基础的,比较重要。4.编程语言怎么学?找准一门语言,精通它。。。各种语言之间都是有渊
原创
发布博客 2013.12.06 ·
893 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

近期learning task

最近感觉很busy,但又没感觉到到底在忙what,所以有必要画一点时间来理清自己的mind,分清什么是important和immediate的,所以做了下面的list,来督促自己learning。1. Java。(求入门)。2. thesis。(important and immediate)。3. R。(近期是ggplot2)。4. hadoop。(java熟悉时
原创
发布博客 2013.12.06 ·
832 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

主成分分析和因子分析十大不同点

主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。1.原理不同主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主
转载
发布博客 2013.11.29 ·
3063 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

生成带权重随机数

想生成10个随机1-100的整数,有权重,请问怎么生成(权重例如产生5的概率是1/30,产生76的概率是1/100).pp[5]sample(1:100,10,prob=p)sample(1:100,10,replace=TRUE,prob=p)
原创
发布博客 2013.11.26 ·
1508 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

问题临时记录

--------------2013/11/22---------关于max.print的疑问library(ggplot2)options(max.print=99999)getOption("max.print")diamonds为什么我设置的是99999的maxprint,显示的却只有9999行观测?----------------
原创
发布博客 2013.11.23 ·
765 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

rpart杂记

rpart:Recursive Partitioning(递归分割)。
原创
发布博客 2013.11.19 ·
1185 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

画散点图练习

问题来自:http://zhidao.baidu.com/question/680266505858712212.html?quesup2&oldq=1&sort=6&qq-pf-to=pcqq.c2c在看别人的论文的时候出现的这种图不知道是怎么画的,已知的部分数据还有要画的散点图在下面的截图中,跪求高手指点一下!解答用R画了一下,大致差不多。
原创
发布博客 2013.11.17 ·
4573 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

删除特定的对象

删除所有对象是rm(list=ls())。删除特定对象,rm(n1,a,c)。
原创
发布博客 2013.11.13 ·
1021 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

批量转换为因子变量

居住地、婚姻状况、教育水平……等名义变量,要转换为因子类型的,有么有批量转换方法?而不是逐条  PhoneData$居住地 ……
原创
发布博客 2013.11.13 ·
5544 阅读 ·
2 点赞 ·
1 评论 ·
3 收藏
加载更多