自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 机器学习,统计和物理中的评价尺度

不同领域对于同一种数学表达式的命名方式不一样,使用的时候很容易混淆。评价指标可以从两个角度去看,一个是追求更高标准,一个是会犯的错误。下面分别列出基于confusion matrix得到的不同尺度(reject H0对应于predicted positive) Do Not Reject H0(Predicted negative) ...

2019-09-02 07:24:18 292

转载 泊松分布与指数分布

泊松分布与指数分布的10分钟教程一、泊松分布日常生活中,大量事件是有固定频率的。某医院平均每小时出生3个婴儿某公司平均每10分钟接到1个电话某超市平均每天销售4包xx牌奶粉某网站平均每分钟有2次访问它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?有可能一下子出生6个,也有可能一个都不出生。这是我们没

2015-09-08 10:46:20 1243

转载 数据标准化的几种方法

数据标准化的几种方法发表于 2012-11-13 23:45 来源:网站数据分析数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上,常见

2015-06-03 23:34:30 1627

转载 志向做数据分析师的职业规划

http://www.ppvke.com/Blog/archives/592对于数据分析,有一句话说得非常好:SPSS、SQL之类的软件、决策树、时间序列之类的方法,这些仅仅就都是个工具而已,最重要的是对业务的把握。没有正确的业务理解,再牛的理论,再牛的工具,都是白搭。做一名合格的数据分析师,除了对数据需要有良好的敏感性之外,还要对相关业务背景有深入了解,对客户或业务部门的需求有清晰认识。

2015-04-26 15:20:48 1318

转载 matlab中的textread函数

http://blog.sina.com.cn/s/blog_9e67285801010bju.html今天打算跑下程序,突然发现,真的很烂,不会读入数据,简单的Iris.txt一上午都没读进去,在此对matlab中的textread函数做下总结,textscan函数待续。本文主要内容引自http://linux.chinaitlab.com/administer/

2015-03-15 11:20:54 805

转载 How to create Linked list using C/C++

From: http://www.codeproject.com/Articles/24684/How-to-create-Linked-list-using-C-CIntroductionLinked list is one of the fundamental data structures, and can be used to implement other dat

2015-02-10 15:33:58 1283

转载 JAVA对ArrayList排序

以下前三个代码都是通过实现Comparable接口,或是实例化一个比较器,虽然重点部分重复了,也各有不同,还是都贴上吧。 http://zhidao.baidu.com/question/97784478java如何对ArrayList中对象按照该对象某属性排序  增加排序功能,打印时:输出学生对象的时候,需要先按照年龄排序,如果年龄相同,则按照姓名排序,如果姓

2015-02-05 18:42:29 952

转载 java中List的遍历

import java.util.ArrayList; import java.util.Iterator; import java.util.List; public class ListTest { public static void main(String[] args) { List list = new ArrayList();

2015-02-03 11:31:36 455

转载 java处理json数据格式

首先下载json-simple-1.1.jar包 主要的类为:JSONArray,JSONObject,JSONValue 简单的JSON操作代码示例:public static void testJSON() { String jsString = "[\"129653\",\"129664\",\"129660\",\"129665\"]";

2015-02-03 10:58:30 1044

转载 A Comparison between Focus-Group and In-Depth Interview

有时接到比较紧急的调研需求,需要快速反馈问题,用户深度访谈持续的时间似乎太长,于是往往会采取另一种调研方法“焦点小组”。只需要1~2场深度访谈的时间,却能同时搜集到8~12名用户的反馈,于是在敏捷的用户研究中,焦点小组似乎成了无往不胜的利器,那是不是只要时间紧急,都可以尝试使用焦点小组呢?笔者在初做用户研究员时,走过一些弯路,这次把自己对焦点小组的了解和经验写一写,抛砖引玉,希望能和大家一起讨论。

2015-02-02 14:59:22 1190

转载 关于焦点小组(Focus Group)访谈法

焦点小组访谈法源于精神病医生所用的群体疗法。目前的焦点小组一般由8-12人组成,在一名主持人的引导下对某一主题或观念进行深入讨论。焦点小组调研的目的:在于了解和理解人们心中的想法及其原因。调研的关键是,使参与者对主题进行充分和详尽的讨论。调研的意义在于了解他们对一种产品、观念、想法或组织的看法,了解所调研的事物与他们的生活的契合程度,以及在感情上的融合程度。 焦点小组访谈法远不止是一问一答

2015-02-02 13:55:32 33834

转载 如何基于数据来做用户体验设计

要找多少用户做测试才够? (研究得出)一条曲线,横轴是代表测试用户的数量,就是你测试了多少用户,纵轴就是你发现用户遇到的问题或者说用户遇到的困难,发现新问题的数量,你会发现这个曲线随着用户数量的增长,这个曲线逐渐趋于平缓,而它真正变成平缓的是在哪里?大概十个人左右。当然,这里的前提是你所找到的测试的这十几个人都正好是你的目标用户。 – 创新工场用户体验总监 吴卓浩设计和数据的一个故

2015-02-02 13:34:46 864

转载 UX engineer --Google

Google User ExperienceOur aspirationsThe Google User Experience team aims to create designs that are useful, fast, simple, engaging,innovative, universal, profitable, beautiful, trustworthy, and p

2015-02-02 13:33:25 562

转载 面试准备

From:http://www.kuqin.com/job/20130111/333954.htmlIT公司的笔试和面试的题量都不大(相对于企事业单位和银行动辄上百道选择题的题量,算是很少),一般十几道选择题,三四道大题就算题量很大。但计算机的东西实在又是太多,程序设计、数据结构、算法设计、操作系统、体系结构、编译原理、数据库、软件工程等分支,编译的话太难(一千个码农里也没几个人能在纸上写

2015-02-02 13:32:42 408

转载 R语言基本操作

From: http://blog.csdn.net/jack237/article/details/8210598前言:关于R在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built based on S language.)。R的源起

2015-01-24 16:01:30 3769

转载 qplot()函数的详细用法

From http://www.douban.com/note/210758237/?type=like参考文献:Hadley Wickham《ggplot2: Elegant Graphics for Data Analysis》第二章qplot()函数的详细用法:library(ggplot2)# 测试数据集,ggplot2内置的钻石数据qplot(cara

2015-01-22 21:37:25 4039

转载 R字符串操作

#字符串连接:paste() #paste(..., sep = " ", collapse = NULL)#字符串分割:strsplit() #strsplit(x, split, extended = TRUE, fixed = FALSE, perl = FALSE)#计算字符串的字符数:nchar()#字符串截取:substr(x, start, stop)

2015-01-22 17:49:00 488

转载 R语言扩展包dplyr笔记

From: http://bqnw.me/post/dplyr-note引言2014年刚到, 就在 Feedly 订阅里看到 RStudio Blog 介绍 dplyr 包已发布 (Introducing dplyr), 此包将原本 plyr 包中的 ddply() 等函数进一步分离强化, 专注接受dataframe对象, 大幅提高了速度, 并且提供了更稳健的与其它

2015-01-21 18:57:32 829

转载 An Easy Way to Make a Treemap

By NATHAN YAUIf your data is a hierarchy, a treemap is a good way to show all the values at once and keep the structure in the visual. This is a quick way to make a treemap in R.

2015-01-20 18:48:00 1828

转载 对数据分布进行可视化的方法

From: http://blog.csdn.net/zuoninger/article/details/28236169绘制简单直方图问题如何绘制直方图?方法运行geom_histogram() 函数并映射一个连续型变量到参数x(见图6-1):ggplot(faithful, aes(x=waiting)) +

2015-01-20 18:12:14 2162

转载 多维标度分析

1.MDS简介多维标度法(Multidimensional Scaling)是一种多维标度法是一类多元统计分析方法的总称,包含各种各样的模型和手段,其目的是通过各种途径把高维的研究对象转化成低维情形进行定位、分析和归类,同时又保留对象间的原始关系。同时也是一种可视化方法,实践中通常利用2D或3D的MDS 结果观察(投影后)点的分布和聚集来研究数据的性质。具体地说,多维标度法是以多绍

2015-01-11 21:03:42 21583

转载 支持向量机SVM(一)

From: http://www.cnblogs.com/jerrylead1 简介支持向量机基本上是最好的有监督学习算法了。最开始接触SVM是去年暑假的时候,老师要求交《统计学习理论》的报告,那时去网上下了一份入门教程,里面讲的很通俗,当时只是大致了解了一些相关概念。这次斯坦福提供的学习材料,让我重新学习了一些SVM知识。我看很多正统的讲法都是从VC 维理论和结构风险最小原理出发,然后引

2015-01-09 11:22:31 457

转载 小谈导数、梯度和极值

From: http://www.cnblogs.com/jerrylead记得在高中做数学题时,经常要求曲线的切线。见到形如之类的函数,不管三七二十一直接求导得到,这就是切线的斜率,然后就得到了处的切线。上大学又学习了曲面切线和法向量的求法,求偏导是法向量,然后套公式求出切线。一个经典例子如下:(来自web上某个《几何应用》ppt)其中的向量n是F(x,y,z)的偏导数。

2015-01-09 00:50:52 597

翻译 Sigmoid 函数

Sigmoid函数,即f(x)=1/(1+e-x)。是神经元的非线性作用函数。广泛应用在神经网络中。神经网络的学习是基于一组样本进行的,它包括输入和输出(这里用期望输出表示),输入和输出有多少个分量就有多少个输入和输出神经元与之对应。最初神经网络的权值(Weight)和阈值(Threshold)是任意给定的,学习就是逐渐调整权值和阈值使得网络的实际输出和期望输出一致。给定以下的总输入,我们

2015-01-08 15:17:07 32435 2

转载 一文读懂机器学习,大数据/自然语言处理/算法全有了...

From:http://www.cnblogs.com/subconscious/p/4107357.html作者:计算机的潜意识在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是 EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者

2015-01-07 23:39:43 2064 1

转载 网络分析与图简介

转自: http://cloga.info/sna/2012/12/24/socialgrpah/前面有介绍过使用Gephi来制作传播图,图是Social Network分析最常用的表现形式和方式,这篇文章介绍一下基本的相关知识。Graph的相关基本概念图(Graph):图是用来表示一组物体之间的关系的方式。节点(Node):节点是指要分析的物体,每一个物体就是一个节点,比如在

2014-12-29 22:09:48 3041

转载 距离和相似度度量

主要摘自: http://www.chinaz.com/web/2011/1008/212684.shtml,http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最

2014-12-28 00:18:44 3367

转载 特征分解与奇异值分解

部分内容转自http://blog.csdn.net/jinshengtao/article/details/18448355一、特征值与特征向量的几何意义1.     矩阵乘法在介绍特征值与特征向量的几何意义之前,先介绍矩阵乘法的几何意义。矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度的新向量。在这个变化过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对

2014-12-27 20:02:51 1289

转载 指针(Pointer)和引用(Reference)的区别

1.reference一定得代表某个对象,即reference必须有初值;而point没有这种要求,因此它可以有null pointers。2.没有所谓得null reference意味着references可能会比使用pointers更有效率,因为使用reference之前不需要测试其有效性。3.pointer可以被重新赋值,指向另外一个对象,而reference却总是指向它最初

2014-12-15 17:39:22 1016

转载 Processing学习笔记---基本结构

Basics of programming1. Coordinates2. Provide a command (which we will refer to as a “ function ” ) for the machine to follow entitled “ line. ” In addition, we specify some arguments for

2014-12-15 10:46:00 976

转载 Processing学习笔记--Difference of Processing from traditional programming languages

Learning Proccesing: A beginners guide to progamming images, animation, and interaction Traditionally, programmers are taught the basics via command line output: 1.   TEXT IN →You write your c

2014-12-14 21:51:55 572

转载 十二月可视化综述

http://www.tableausoftware.com/zh-cn/about/blog/2014/12/december-viz-round-34450?utm_campaign=APAC%20-%20zh-CN%20-%20December%202014%20Prospect%20Newsletter%20-%202014-12-01&utm_medium=email&utm_sourc

2014-12-11 15:57:18 565

转载 Stack的三种含义

作者: 阮一峰学习编程的时候,经常会看到stack这个词,它的中文名字叫做"栈"。理解这个概念,对于理解程序的运行至关重要。容易混淆的是,这个词其实有三种含义,适用于不同的场合,必须加以区分。含义一:数据结构stack的第一种含义是一组数据的存放方式,特点为LIFO,即后进先出(Last in, first out)。在这种数据结构中,数据像积木那样

2014-12-10 16:53:06 506

转载 数据可视化 六种基本图标

作者: 阮一峰"数据可视化"可以帮助用户理解数据,一直是热门方向。图表是"数据可视化"的常用手段,其中又以基本图表----柱状图、折线图、饼图等等----最为常用。用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据集)?恐怕答得上来的人就不多了。本文是电子书《Data Visualization with JavaScrip

2014-12-03 14:16:10 4548

转载 二十大数据可视化工具点评

From: http://www.ctocio.com/hotnews/8874.html二十大数据可视化工具点评作者:王萌 如今学习应用数据可视化的渠道有很多,你可以跟踪一些专家博客,但更重要的一点是实践/实操,你必须对目前可用的数据可视化工具有个大致了解。以下是Netmagzine列举的二十大数据可视化工具,无论你是准备制

2014-12-03 14:14:30 1246

转载 数据可视化:基本图表

转自:http://www.ruanyifeng.com/blog/2014/11/basic-charts.html"数据可视化"可以帮助用户理解数据,一直是热门方向。图表是"数据可视化"的常用手段,其中又以基本图表----柱状图、折线图、饼图等等----最为常用。用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据集)?恐怕答

2014-12-03 14:09:56 716

转载 数据分析师的知识结构

图2图1图3From: http://blog.sina.com.cn/s/blog_5f5c4da00101mons.html下面这篇文章介绍了数据分析需要什么知识,以及前景。你阅读的时候把其中的商业智能替换成数据分析也是可以的。 BI从业好几年,本文原本是写给自己看的,希望通过对BI的浅析,理清思路,找准方向,继续前行。现在觉得分享一

2014-11-26 14:01:55 1008

转载 数据分析师说他们每天都在干什么

目前在一家电商公司从事数据分析的工作。刚入门的时候都会从最基本的做起,也就是先做表格。先是学做日报。这是每天到公司做的第一件事,虽然很基本,步骤很统一,也很机械,但是每天的日报都能看出前一天的销售状况,整个月的销售走势,本月的任务完成程度,过去24小时内流量来源的对比,转化率的变化,客单价的涨幅等等,清晰且明了。近年来手机端流量的崛起,也为此单门添加无限端的流量、销售的分析,以及无线端

2014-11-26 13:54:08 3137

转载 干货:数据分析师的完整知识结构

From: http://www.36dsj.com/archives/17426作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知识结构。1. 数据采集了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控

2014-11-26 13:50:14 2542 1

转载 MySQL索引背后的数据结构及算法原理

From: http://blog.codinglabs.org/articles/theory-of-mysql-index.html摘要本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题。特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只

2014-11-26 10:41:37 432

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除