2016年08月_积微成著

12月 11月 10月 09月 08月 07月 05月 04月

原创 IPython Notebook介绍及在Ubuntu16.04下的安装使用

IPython Notebook简介IPython Notebook是web based IPython封装，但是可以展现富文本，使得整个工作可以以笔记的形式展现、存储，对于交互编程、学习非常方便。IPython Notebook使用浏览器作为界面，向后台的IPython服务器发送请求，并显示结果。在浏览器的界面中使用单元(Cell)保存各种信息。每个代码单元都有一个输出区域，在Code单元中

2016-08-31 13:26:58 10680

原创技巧：如何在CSDN博客中编辑公式

通常情况下，我们难免需要在CSND博客中编辑公式，而CSND自身并没有公式编辑器。那么问题来了，该怎么办呢？在word中编辑好，然后截屏、保存、上传到CSND？这样是能到达效果，但过于麻烦，且不美观。介于此，可以考虑试试下面的方法：打开网页：http://www.codecogs.com/latex/eqneditor.php 页面很简单：然后你就可以在这个黄色区域输入公式。你

2016-08-25 15:50:58 2688

转载机器学习经典算法详解及Python实现--决策树（Decision Tree）

（一）认识决策树1，决策树分类原理决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种，分类树对离散变量做决策树，回归树对连续变量做决策树。近来的调查表明决策树也是最经常使用的数据挖掘算法，它的概念非常简单。决策树算法之所以如此流行，一个很重要的原因就是使用者基本上不用了解机器学习算法，也不用深究它是如何工作的

2016-08-25 14:35:27 3521

原创社会统计分析—统计推断-估值

用抽样分布来代表抽样的变异性选民偏好是一个变量，不同选民的偏好是不同的。类似的，每个样本中支持某一个候选人的比例也是一个变量。也就是说：在获取变量之前，这个比例的取值是不知道的，而且在不同样本中，这个比例是不同的。抽样分布：一个统计量的抽样分布，说明了该统计量所有可能取值的发生概率。同一个总体中抽取的样本量相同的样本会产生取值不同的统计量。统计量本身是一个最基变量。统计量可以是样本均值、样本

2016-08-24 17:25:45 1400

翻译 Python基础篇—Pandas应用(一)

下面结合一个具体案例进一步了解pandas的应用。参考文章pandas-cookbook GitHub repository 在此，我们将利用一个新的数据集来演示如何用pandas处理更大的数据集。通过分析该数据集，找到最常见的投诉类型(数据可在ＧitＨub上下载)。导入数据首先来导入相关的库，并设置好参数：# The usual preamble%matplotlib inlineimpor

2016-08-23 20:39:13 24992

原创社会统计分析—概率分布

概率在一个岁随机样本或者随机试验中，一个观测值产生某一特定结果的概率实在长期的一系列观测中该结果出现的比例。长期的：你需要大量的观测试验才能对概率做出准确的估计。比例：概率是一个取值在０到１之间的数，当然也可用百分比表示，０到１００。长期观测法的局限性：１、没有条件展开长期观察；２、缺乏客观数据，你不得不借助主观判断。在这种相对主观的方式中，某个结果发生的概率是基于目前可获得的信

2016-08-22 20:35:41 1222

原创社会统计分析—描述统计

社会学概念的量化问题测量（Measurement）社会科学研究的一个重要议题是：如何将我们对社会现象的理解转化为量化数据。相对于自然科学而言，对社会现象、思想、态度的量化描述显得更具有挑战。我们需要为一些抽象概念开发从测量方法，如社会地位、能力、幸福感、健康、甚至爱情。社会科学不是科学？社会科学要求，对概念的测量应具有有效性，即效度（validity）。我们需要清楚地描述想要测量什么并可

2016-08-21 16:05:27 2758

原创社会统计分析—基础知识

进入大数据时代，我们被四面八方的数据围得水泄不通，我们需要一双更明亮的眼睛，了解数字背后的深意。我们需要统计学知识的帮助，需要学会从海量数据中提取关键信息、进行合理推断并作出正确决策，以更科学的角度欣赏我们生活的世界。统计学和社会统计学统计学（Statistics）统计学是一门关于收集、分析、解释、展示以及组织数据的学问。统计学是一套获取与分析数据的方法。具体而言，统计学是为设计（design

2016-08-20 10:36:29 2134

原创 K-近邻算法（KNN）

概述简单地说，K-近邻算法（K-Nearest-Neighbors Classification）采用测量不同特征值之间的距离方法进行分类。优点：精度高、对异常值不敏感、无数据输入假定缺点：计算复杂度高、空间复杂度高使用数据范围：数值型和标称型工作原理：要确定测试样本属于哪一类，就寻找所有训练样本中与该测试样本“距离”最近的前K个样本，然后看这K个样本大部分属于哪一类，那么就认为这个测试样本

2016-08-20 08:55:03 5635

蓝牙协议的体系结构

主要包括两方面内容： 1、蓝牙技术介绍蓝牙的起源、实质和蓝牙的技术特。 2、蓝牙协议体系介绍蓝牙协议、蓝牙协议的体系结构以及核心协议。

2016-05-02

Hadoop2.6.0集群环境搭建

1.linux系统:Ubuntu14.04 2.hadoop版本:hadoop-2.2.0 3.JDK版本:Jdk1.8.0_74

2016-04-28

CSDN中编写公式，为何公式后面有一个竖杠？

2016-09-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人