数据分析
文章平均质量分 92
人工智能时代的大数据分析
powerlwj
这个作者很懒,什么都没留下…
展开
-
Matlab2016做曲线拟合(Curve Fitting)(1)
今天来分享如何用MATLAB2016进行曲线拟合:在这个系列,将利用官网提供的样例和接口,主要结合我自己的数据进行曲线拟合。 Curve Fitting:作用将曲线和曲面与数据相匹配拟合 曲线拟合应用程序提供了一个灵活的界面, 学者可以在其中交互式地将曲线和曲面与数据和视图图形相拟合。 具体包括: - 创建、绘制和比较多个匹配项; - 使用线性或非线性回归、插值、平滑和自定义方程; ...原创 2018-04-29 15:40:36 · 30655 阅读 · 2 评论 -
Matlab2016做曲线拟合(Curve Fitting)(2)
Polynomial Models(多项式模型)常见多项式的基本模型: 其中 n + 1 是多项式的阶, n 是多项式的维度, 1 ≤ n ≤9。该顺序给出了合适的系数个数, 并给出了预测变量最高的维度。 在本文中, 多项式按其度来描述。例如, 三维 (立方) 多项式表示如下: 当需要一个简单的经验模型时, 通常使用多项式。我们可以使用多项式模型进行插值或外推, 或者使用全局拟合...原创 2018-04-29 16:53:04 · 22672 阅读 · 2 评论 -
Matlab做数据拟合中的(Results,SSE,R-square,Adjusted R-square,RMSE)
做Curve Fitting的时候通常会有以下信息,大家不解其意,在此做简单介绍。Results :显示当前拟合的详细结果, 包括拟合类型 (模型、样条或插值函数)、拟合系数以及参数匹配的95% 置信范围, 以及适合统计的这些优点; SSE: 错误的平方和。此统计量测量响应的拟合值的偏差。接近0的值表示更好的匹配。 R-square 表示:多重测定系数。数值的大小在0到1之间,越接近1...原创 2018-05-03 15:03:18 · 34404 阅读 · 1 评论 -
Matlab分析拟合Excel中的数据(1)---数据的导入
前言:office的表格文件也就是xls文件,本质上就是一个二维矩阵,二维矩阵是用来保存数据的最佳方式,所以在日常工作中,我们从其它地方获取的数据通常都被保存为xls格式,但处理数据时,我们却需要把xls文件的数据导入到matlab里进行处理。 如果你只处理一个文件并且只做一次的话,你可以手动来拷贝粘贴,这花费不了你太多时间。如果有很多xls文件,或者你的xls文件的内容可能随时被修改,那么下面的...原创 2018-05-04 17:34:09 · 17349 阅读 · 1 评论 -
详解:Python2.x与3.x版本区别
Python的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。 为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下相容。 许多针对早期Python版本设计的程式都无法在Python 3.0上正常执行。 为了照顾现有程式,Python 2.6作为一个过渡版本,基本使用了Python 2.x的语法和库,同时考虑了向...原创 2018-07-28 10:33:30 · 363 阅读 · 0 评论 -
机器学习实例----美国人口收入分析
Sklearn–(1)原创不易,如需转载,请标明出处。 首先通过官网的图片简单了解Sklearn: 可以看到他的主要作用有:分类,回归,聚类,降维,模型选择,预处理。 今天我将利用Adult数据集进行演示。Adult 该数据从美国1994年人口普查数据库抽取而来,可以用来预测居民收入是否超过50k/year。该数据集类变量为年收入是否超过50k,属性变量包含年龄,工种,学历,职...原创 2018-03-23 14:18:08 · 8339 阅读 · 1 评论 -
机器学习中的特征处理--onehot编码
Sklearn–(2)首先介绍数据标准化工具onehot[独热编码]:One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。以手写数字识别为例,我们需要将0-9共十个数字标签转化成onehot标签。例如:数字标签“6”转化为onehot标签就是[0,0,0,0,0,0,1,0,0,0]. 我第一...原创 2018-04-25 20:12:48 · 2364 阅读 · 0 评论 -
机器学习中的特征相关性分析
原创不易,如需转载,请标明出处。常用数据分析步骤1.导入基本工具库:import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlineimport seaborn as snsimport typesimport plotly.graph_objs as gofr...原创 2018-04-13 22:32:41 · 13705 阅读 · 1 评论 -
Sklearn(3)
今天给大家带来的是商品预测案例: 文件描述:sales_train.csv - the training set. Daily historical data from January 2013 to October 2015.test.csv - the test set. You need to forecast the sales for these shops and prod...原创 2018-05-14 15:18:42 · 20251 阅读 · 0 评论 -
机器学习实例(2)
接上节: 接下来我们要做的工作是缕清楚数据集的各个特征的特点,针对不同的特征提出不同的处理方法:由于机器学习处理的都是都是数值信息,但是数据集有一部分是文本信息,这就需要对不同的文本信息进行不同的处理了。即下一步工作: 1. 特征的类别信息age:连续性数值变量;可能的处理方法:分年龄段;workcass: Private, Self-emp-not-inc, Self-emp-i...原创 2018-08-10 15:35:35 · 3887 阅读 · 4 评论 -
机器学习实例(3)
接上节机器学习实例2 上一节我们对所要处理的数据进行了分类(训练集和测试集),本节的主要目的是特征处理,关于数据集的特征信息我们已经在上一节详细介绍,这次直接进行处理:from sklearn.feature_extraction import DictVectorizerdict_vect=DictVectorizer(sparse=False)以上代码的目的:接着X_t...原创 2018-08-19 19:30:29 · 3072 阅读 · 3 评论