Python图形

Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。 https://python-graph-gallery.com/all-charts/ 1、折线图 import matplotlib.pyp...

2019-03-27 17:59:11

阅读数 71

评论数 0

python、pycharm、anaconda区别

1、python python自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包,需要我们安装pip来导入这些包才能进行相应运算(python3.5自带了get-pip.py,不需额外下载安装),在cmd终端输入:pip install numpy就...

2019-03-27 16:47:09

阅读数 94

评论数 0

Python数据的相关性和标准化

1、相关性分析 协方差:Cov(X,Y)=E(XY)-E(X)E(Y) 或cov(X, Y) = E(X-EX)(Y-EY),表示两个变量总体误差的期望,范围在负无穷到正无穷。协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小 公式简单翻译一下是:如果有X,Y两个变量,每...

2019-03-21 20:37:39

阅读数 116

评论数 0

Python数据抽样

1、数据的导入查看 参考参考 import pandas as pd f = open("E:/test.csv", encoding="utf-8") content = pd.read_csv(f,nrows=5) ##打印(读取)前5行 pr...

2019-03-20 17:10:10

阅读数 109

评论数 0

人工智能与数据挖掘

作为一个IT人,区分理解人工智能、机器学习、表示学习、深度学习、数据挖掘等是很有必要的~~~ 1、人工智能是机器或软件展示出的智能,也是研究如何让计算机或计算机软件有智能行为的一个学术领域,主要研究的是如何模拟和扩展人类的 智能。人工智能所涉及的范围甚广,例如自然语言处理、图像识别、语音识别等。...

2019-03-18 15:33:52

阅读数 8412

评论数 1

决策树算法的研究

先来一段决策树相关的小故事: 文献:周志华.机器学习[M].北京:清华大学出版社,2016: - 最初的决策树算法是心理学家兼计算机科学家E.B.Hunt 1962年在研究人类的概念学习过程时提出的CLS(Concept Learning System),这个算法确立了决策树“分而治之”的学习...

2019-03-18 15:32:49

阅读数 76

评论数 0

决策树划分与剪枝

1、决策树划分选择 决策树学习的关键——如何选择最优划分属性。我们所期望的是,随着划分过程的不断进行,希望决策树的分支结点所包含的的样本尽可能属于同一类别,即结点的“纯度”要尽可能的高。 1.1 信息增益 要说信息增益,我们先来了解一下信息熵。 “信息熵“是度量样本集合纯度最常用的一种指标...

2019-03-18 15:31:52

阅读数 59

评论数 0

Python数据清洗

1、缺失值的处理 准备:pandas、numpy、sklearn.preprocessing中的Imputer类 import pandas as pd import numpy as np from sklearn.preprocessing import Imputer data = ...

2019-03-17 12:14:38

阅读数 84

评论数 0

决策树模型(R语言)

R语言中最常用于实现决策树的有两个包,分别是rpart包和party包,其区别如下: rpart包的处理方式:首先对所有自变量和所有分割点进行评估,最佳的选择是使分割后组内的数据更为“一致”(pure)。这里的“一致”是指组内数据的因变量取值变异较小。rpart包对这种“一致”性的默认度量是Gi...

2018-11-11 15:56:13

阅读数 218

评论数 0

《机器学习》第四章决策树答案

1、证明对于不含冲突数据(即特征向量完全相同但标记不同)的训练集,必存在与训练集一致(即训练误差为0)的决策树 anser 1:假设不存在与训练集一致的决策树,那么训练集训练得到的决策树至少有一个节点上存在无法划分的多个数据(若节点上没有冲突数据,那么总是能够将数据分开的)。这与前提-不含冲突数...

2018-11-07 11:56:23

阅读数 331

评论数 0

数据可视化

数据和文字是抽象的,图形却是具体的,正所谓“能用图就不用表,能用表就不用文字”。好的图形或分析报告,应该直观易懂又不失专业性,数据跃然纸上,分析一语中的。在这里推荐几个作图软件:visio 、Echart、亿图、Tableau、BirdEye、Timeflow等 30种可视化工具了解和下载 ht...

2018-11-07 11:04:24

阅读数 154

评论数 0

R语言 回归

x-y对应叫法 x y 自变量(independent variable) 因变量(dependent variable) 解释变量(explanatory variable) 被解释变量(explained variable) 原因变量(causal variab...

2018-08-24 09:33:56

阅读数 160

评论数 0

R语言 特殊函数

1、统计函数 函数 描述 mean() 平均数 median() 中位数 sd() 标准差 var() 方差 mad() 绝对中位差,即原数据减去中位数后得到的新数据的绝对值的中位数 quantile(x,probs) 求分位数,...

2018-08-23 18:54:19

阅读数 476

评论数 0

R语言 图形

相较于数字和文字的表示,图形的展示更能引起客户的兴趣,可视化程度高,通过看图我们得以发现数据中的模式或是检查出数据中的异常值,也有助于在数以千计的零散信息中做出有意义的对比,提炼出使用其他方法时不那么容易发现的模式。 1、R图形需要掌握的基本要领: 图形的创建 图形的保存 自定义符号、线条...

2018-08-23 11:50:15

阅读数 168

评论数 0

R语言 函数因子列表

在开始之前,先来说说如何定义数据集的行和列,不同领域的大神往往叫法各异。 大神 行叫法 列叫法 统计学家 观测(observation) 变量(variable) 数据库分析师 记录(record) 字段(field) 数据挖掘(机器学习)师 ...

2018-08-20 23:49:07

阅读数 152

评论数 0

R语言的输出

R语言的输出函数有cat、sink、writeLines、write.table 1)cat cat函数即能输出到屏幕,也能输出到文件 cat(... , file = "", sep = " ", fill = FA...

2018-08-20 21:09:38

阅读数 1525

评论数 0

R语言的输入

R,作为一个非常灵活的平台,是专用于探索、展示和理解数据的语言,一种为统计计算和绘图而生的语言和环境,也是统计、预测分析和数据可视化的全球通用语言,它提供各种用于分析和理解数据的方法,从最基础的到最前沿的,无所不包。 1、包 包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上...

2018-08-20 00:01:02

阅读数 221

评论数 0

hello,java

目的:整理Java小知识 一、技术名词 1)JDBC JDBC(Java DataBase Connectivity数据库连接)提供连接各种关系数据库的统一接口,可以为多种关系数据库提供统一访问,它由一组用java语言编写的类和接口组成。JDBC为数据库开发人员提供了一个标准的API(应用程...

2018-08-11 12:50:32

阅读数 61

评论数 0

各种大型网站技术架构

引言近段时间以来,通过接触有关海量数据处理和搜索引擎的诸多技术,常常见识到不少精妙绝伦的架构图。除了每每感叹于每幅图表面上的绘制的精细之外,更为架构图背后所隐藏的设计思想所叹服。个人这两天一直在搜集各大型网站的架构设计图,一为了一饱眼福,领略各类大型网站架构设计的精彩之外,二来也可供闲时反复琢磨体...

2018-07-29 23:00:12

阅读数 163

评论数 0

需求分析的经验之谈

首先,最重要的一个问题就是,为什么要做需求分析,或者说需求分析的意义是什么?每个人对这个问题可能都会有不同的体会。我的看法是,需求分析的意义在于准确无歧义地表达项目需要交付的产品,并且获得需求方的认可,从而为整个项目建立一个基准。指望需求不变化是几乎不可能的,不管是开发者还是需求方都有可能随着项目...

2018-07-08 00:05:27

阅读数 317

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭