机器学习
文章平均质量分 95
oxuzhenyi
这个作者很懒,什么都没留下…
展开
-
Numpy 使用教程 4
Numpy 使用教程--Numpy 数学函数及代数运算一、实验介绍1.1 实验内容如果你使用 Python 语言进行科学计算,那么一定会接触到 Numpy。Numpy 是支持 Python 语言的数值计算扩充库,其拥有强大的高维度数组处理与矩阵运算能力。除此之外,Numpy 还内建了大量的函数,方便你快速构建数学模型。1.2 实验知识点Numpy 数学函数Numpy 代数运转载 2017-09-18 23:58:32 · 5907 阅读 · 0 评论 -
Numpy 使用教程 3
Numpy 使用教程--Numpy 数组操作及随机抽样一、实验介绍1.1 实验内容如果你使用 Python 语言进行科学计算,那么一定会接触到 Numpy。Numpy 是支持 Python 语言的数值计算扩充库,其拥有强大的高维度数组处理与矩阵运算能力。除此之外,Numpy 还内建了大量的函数,方便你快速构建数学模型。1.2 实验知识点Numpy 数组的基本操作1.3转载 2017-09-18 23:56:58 · 1369 阅读 · 0 评论 -
Numpy 使用教程 2
Numpy 使用教程--Numpy 多维数组创建及属性一、实验介绍1.1 实验内容如果你使用 Python 语言进行科学计算,那么一定会接触到 Numpy。Numpy 是支持 Python 语言的数值计算扩充库,其拥有强大的高维度数组处理与矩阵运算能力。除此之外,Numpy 还内建了大量的函数,方便你快速构建数学模型。1.2 实验知识点Numpy 数组 ndarraynda转载 2017-09-18 23:55:50 · 867 阅读 · 0 评论 -
Numpy 使用教程 1
Numpy 使用教程--Numpy 安装及数值类型介绍一、实验介绍1.1 实验内容如果你使用 Python 语言进行科学计算,那么一定会接触到 Numpy。Numpy 是支持 Python 语言的数值计算扩充库,其拥有强大的多维数组处理与矩阵运算能力。除此之外,Numpy 还内建了大量的函数,方便你快速构建数学模型。1.2 实验知识点Numpy 安装Numpy 数值类型介绍转载 2017-09-18 23:54:45 · 968 阅读 · 2 评论 -
Matplotlib 及 Seaborn 使用教程 1
Matplotlib 绘图教程一、实验介绍1.1 实验内容Matplotlib 是支持 Python 语言的开源绘图库,因为其支持丰富的绘图类型、简单的绘图方式以及完善的接口文档,深受 Python 工程师、科研学者、数据工程师等各类人士的喜欢。这是 Matplotlib 绘图课程的第一章节,将带你了解如何使用 Matplotlib 绘制 2D 图像。1.2 实验知识点Ma转载 2017-08-30 19:23:11 · 3173 阅读 · 0 评论 -
Matplotlib 及 Seaborn 使用教程 4
一、实验介绍--高级 API 绘图库 Seaborn 使用1.1 实验内容Matplotlib 是支持 Python 语言的开源绘图库,因为其支持丰富的绘图类型、简单的绘图方式以及完善的接口文档,深受 Python 工程师、科研学者、数据工程师等各类人士的喜欢。这是 Matplotlib 绘图课程的第 4 章节,将带你了解以 Matplotlib 为核心库的高级绘图库 Seaborn,无需转载 2017-08-30 19:43:49 · 6523 阅读 · 0 评论 -
Matplotlib 及 Seaborn 使用教程 3
一、实验介绍--使用 Matplotlib 绘制 3D 图1.1 实验内容Matplotlib 是支持 Python 语言的开源绘图库,因为其支持丰富的绘图类型、简单的绘图方式以及完善的接口文档,深受 Python 工程师、科研学者、数据工程师等各类人士的喜欢。这是 Matplotlib 绘图课程的第 3 章节,将带你了解 3D 图像绘制。1.2 实验知识点Matplotlib转载 2017-08-30 19:42:01 · 3120 阅读 · 0 评论 -
Matplotlib 及 Seaborn 使用教程 2
一、实验介绍--使用 Matplotlib 绘制 2D 图(进阶)1.1 实验内容Matplotlib 是支持 Python 语言的开源绘图库,因为其支持丰富的绘图类型、简单的绘图方式以及完善的接口文档,深受 Python 工程师、科研学者、数据工程师等各类人士的喜欢。这是 Matplotlib 绘图课程的第 2 章节,将带你学会如何使用参数绘出更复杂的 2D 图像。1.2 实验知识点转载 2017-08-30 19:24:52 · 2107 阅读 · 0 评论 -
Pandas 使用教程 5
Pandas 使用教程--Pandas 时间序列分析一、实验介绍1.1 实验内容Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。这是 Pandas 使用教程的第 5 章节,将了解 Pandas 针对时间序列分析和处理的相关方法。1转载 2017-09-13 21:32:50 · 2859 阅读 · 0 评论 -
Pandas 使用教程 4
Pandas 使用教程--Pandas 进行缺失值处理一、实验介绍1.1 实验内容Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。这是 Pandas 使用教程的第 4 章节,将学会 Pandas 完成对数据集缺失值的处理工作。1.转载 2017-09-13 21:31:22 · 5590 阅读 · 0 评论 -
Numpy 使用教程 5
Numpy 使用教程--Numpy 数组索引及其他用法一、实验介绍1.1 实验内容如果你使用 Python 语言进行科学计算,那么一定会接触到 Numpy。Numpy 是支持 Python 语言的数值计算扩充库,其拥有强大的高维度数组处理与矩阵运算能力。除此之外,Numpy 还内建了大量的函数,方便你快速构建数学模型。1.2 实验知识点Numpy 数组索引Numpy 其他用转载 2017-09-18 23:59:32 · 776 阅读 · 0 评论 -
Superset 数据分析平台搭建及使用 1
Superset 数据分析平台搭建一、实验介绍1.1 实验内容Superset 是 Airbnb 开源的数据分析与可视化平台,同时也是由 Python 语言构建的轻量级 BI 系统。Superset 可实现对 TB 量级数据进行处理,兼容常见的数十种关系或非关系型数据库,并在内部实现 SQL 编辑查询等操作。除此之外,基于 Web 服务的 Superset 可实现多用户协使用,并可针对转载 2017-09-22 13:57:23 · 4933 阅读 · 0 评论 -
Python3 色情图片识别
Python 3 色情图片识别一、实验简介本实验将使用 Python3 去识别图片是否为色情图片,我们会使用到 PIL 这个图像处理库,会编写算法来划分图像的皮肤区域1.1. 知识点Python 3 的模块的安装Python 3 基础知识肤色像素检测与皮肤区域划分算法Pillow 模块的使用argparse 模块的使用1.2. 效果展示转载 2017-02-12 13:01:49 · 11824 阅读 · 5 评论 -
Superset 数据分析平台搭建及使用 2
Superset 数据分析平台使用一、实验介绍1.1 实验内容Superset 是 Airbnb 开源的数据分析与可视化平台,同时也是由 Python 语言构建的轻量级 BI 系统。Superset 可实现对 TB 量级数据进行处理,兼容常见的数十种关系或非关系型数据库,并在内部实现 SQL 编辑查询等操作。除此之外,基于 Web 服务的 Superset 可实现多用户协使用,并可针对转载 2017-09-22 13:58:12 · 15918 阅读 · 2 评论 -
Pandas 使用教程 3
Pandas 使用教程--Pandas 数据选择与过滤一、实验介绍1.1 实验内容Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。这是 Pandas 使用教程的第 3 章节,将学会使用 Pandas 对数据进行选择与变换。1.2转载 2017-09-13 21:30:12 · 1131 阅读 · 0 评论 -
Pandas 使用教程 2
Pandas 使用教程--Pandas 常用的基本方法一、实验介绍1.1 实验内容Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。这是 Pandas 使用教程的第 2 章节,将学会 Pandas 中的一些常用的基本方法。1.2 实转载 2017-09-13 21:28:33 · 1349 阅读 · 0 评论 -
Pandas 使用教程 1
Pandas 使用教程--Pandas 安装与数据结构一、实验介绍1.1 实验内容Pandas 是非常著名的开源数据处理库,我们可以通过它完成对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。这是 Pandas 使用教程的第 1 章节,将学会安装它,并了解 Pandas 的数据结构。1.2转载 2017-09-13 20:53:09 · 5940 阅读 · 0 评论 -
scikit-learn 实战之非监督学习 1
K-Means聚类算法一、实验介绍1.1 实验内容非监督学习(英语:Unsupervised learning)是机器学习中十分重要的一个分支。这是实验课程的第一章节,将带你了解什么是非监督学习?并学会用 K-Means 算法完成一个聚类实验。1.2 实验知识点非监督学习概念K-Means 聚类1.3 实验环境python2.7Xfce 终端ipython 终端转载 2017-08-04 13:49:51 · 1610 阅读 · 0 评论 -
基于R语言的多元线性回归--我国经济增长的定量研究
基于R语言的多元线性回归--我国经济增长的定量研究一、实验介绍1.1 实验内容经济增长一直以来都是我国宏观经济政策的目标之一,研究影响经济增长的因素对促进我国经济快速发展有着重要意义。本实验运用 R 语言编写代码拟合多元线性回归模型,对模型拟合结果进行诊断,即对假设前提进行检验,并选择最优模型,最终进行区间预测,定性的研究影响我国经济增长的因素。1.2 实验知识点多元回归模转载 2017-08-10 12:53:19 · 19880 阅读 · 6 评论 -
R语言实现金融数据的时间序列分析及建模
R语言实现金融数据的时间序列分析及建模一、实验介绍1.1 实验内容本实验主要探讨了几种时间序列的预测模型,首先带领大家对时间序列有一个初步的认识再在这个基础之上,向读者介绍当下最常用的 ARIMA 模型来预测时间序列,接着为读者展示几种指数平滑的方法来预测,最后通过几种模型的对比,让大家可以从中选择出一个最佳的模型来实现预测。为了保证可以在实验楼环境中完成本次实验,我们在实验基转载 2017-08-03 12:17:25 · 39436 阅读 · 7 评论 -
R 语言实现股票数据的预处理及分析
基于 R 语言的股票数据分析一、实验介绍1.1 实验内容本实验是以股票数据作为分析背景,股票数据如何从雅虎财经板块上获取,观察股票每日价格和成交量数据开始,接着计算某一支股票数据中比较重要的日度收益率。然后通过各种股票线图进行技术分析,最后在一支股票的基础上同时分析多支股票的成交量,涨幅时间点,最后得出它们之间的相关性等数据特征。1.2 实验知识点股票数据抓取股票数据线转载 2017-08-08 13:58:32 · 29032 阅读 · 6 评论 -
scikit-learn 实战之监督学习 2
scikit-learn 实战之监督学习一、实验介绍1.1 实验内容监督学习(英语:Supervised learning)是机器学习中最为常见、应用最为广泛的分支之一。本次实验将带你了解监督学习中较为基础的广义线性模型,并学会使用 scikit-learn 来构建预测模型,用于解决实际问题。1.2 实验知识点广义线性回归模型介绍。训练一个广义线性回归模型。训练一个广义线性转载 2017-08-01 12:28:16 · 807 阅读 · 0 评论 -
scikit-learn 实战之监督学习 3
scikit-learn 实战之监督学习一、实验介绍1.1 实验内容监督学习(英语:Supervised learning)是机器学习中最为常见、应用最为广泛的分支之一。本次实验将带你了解监督学习中运用十分广泛的支持向量机,并学会使用 scikit-learn 来构建预测模型,用于解决实际问题。1.2 实验知识点支持向量机理论基础使用支持向量机进行线性分类使用支持向量机进行转载 2017-08-01 12:29:14 · 583 阅读 · 0 评论 -
scikit-learn 实战之监督学习 4
常见的监督学习模型对比评价一、实验介绍1.1 实验内容监督学习(英语:Supervised learning)是机器学习中最为常见、应用最为广泛的分支之一。本次实验将带你了解监督学习中常见的分类方法,并学会使用 scikit-learn 来构建预测模型,用于解决实际问题。1.2 实验知识点了解常见的监督学习方法使用多个方法进行分类预测比较1.3 实验环境转载 2017-08-01 12:34:52 · 1450 阅读 · 0 评论 -
scikit-learn 实战之监督学习 1
scikit-learn 实战之监督学习一、实验介绍1.1 实验内容监督学习(英语:Supervised learning)是机器学习中最为常见,且应用最为广泛的分支之一。这是实验课程的第一章节,将带你了解什么是监督学习?1.2 实验知识点监督学习概念常见的监督学习方法1.3 实验环境python2.7Xfce 终端ipython1.4 适合人群本课程难转载 2017-08-01 12:27:19 · 1127 阅读 · 0 评论 -
决策树实战项目-鸢尾花分类
决策树实战项目-鸢尾花分类一、实验介绍1.1 实验内容决策树是机器学习中一种简单而又经典的算法。本次实验将带领了解决策树的基本原理,并学习使用 scikit-learn 来构建一个决策树分类模型,最后使用此模型预测鸢尾花的种类。1.2 实验知识点决策树的基本原理。决策树在生成和修剪中使用的 ID3, C4.5 及 CART 算法。使用 scikit-learn 中提供的决策转载 2017-07-31 13:13:57 · 45820 阅读 · 7 评论 -
Kmeans 聚类算法评估足球比赛
Spark MLlib 机器学习—Kmeans 聚类算法分析足球比赛一、实验介绍1.1 内容介绍K-means 算法采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means 算法以欧式距离作转载 2017-07-10 14:47:46 · 5997 阅读 · 2 评论 -
scikit-learn 实战之非监督学习 2
K 值选择与聚类评估一、实验介绍1.1 实验内容非监督学习(英语:Unsupervised learning)是机器学习中十分重要的一个分支。这是本实验课程的第 2 章节,将带你了解如何对聚类效果进行评估。1.2 实验知识点肘部法则轮廓系数1.3 实验环境python2.7Xfce 终端ipython 终端1.4 适合人群本课程难度为一般,属于初级级别课转载 2017-08-04 13:52:05 · 791 阅读 · 0 评论 -
R语言分析股票指数的GARCH效应
R语言分析股票指数的GARCH效应一、实验说明1.1 实验内容GARCH模型是对金融数据波动性进行描述的方法,为大量的金融序列提供了有效的分析方法,它是迄今为至最常用的、最便捷的异方差序列拟合模型。本次实验运用R语言利用上海证券综合指数进行GARCH模型的分析,包括计算股票指数的收益率,实现收益率的可视化 ,计算一些基本统计量,绘制股指收益率的ACF和PACF图,检验收益率序列的ARC转载 2017-09-05 13:44:40 · 77825 阅读 · 19 评论 -
R语言建立VAR模型分析联合内生变量的动态关系
VAR模型分析联合内生变量的动态关系一、实验介绍1.1 实验内容VAR模型是向量自回归模型的简称,是基于数据的统计性质建立的一种常用的计量经济模型,它把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。本实验运用 R 语言来建立两变量的向量自回归模型,首先是检验两变量序列的平稳性,然后进行协整检验转载 2017-09-05 13:40:38 · 63977 阅读 · 18 评论 -
R语言对高频交易订单流进行建模分析 4
一、实验介绍--订单流模型拟合1.1 实验知识点指数核 hawkes 过程拟合正反馈强度分析订单量影响分析1.2 实验环境R 3.4.1Rstudio二、订单流模型拟合在上节中我们对订单流数据做了一些统计分析 , 对交易的一些特征有了一些粗浅的理解 , 在本节中 我们要做的是利用实际数据来拟合 hawkes 过程 ,看一看真实数据的订单流动力学中有什么特征。首先转载 2017-08-25 20:05:57 · 5644 阅读 · 1 评论 -
R语言对高频交易订单流进行建模分析 3
一、实验介绍--订单流数据描述分析1.1 实验知识点订单流数据表示订单间隔分析订单信息率平稳性研究订单流动性研究限价单相对价格分析1.2 实验环境R 3.4.1Rstudio二、订单流数据描述分析2.1 订单流数据表示当我们在金融市场上做交易时 , 可以看到一个委托单簿,上面陈列着买价和卖价以及它们对应的量 ,举个例子,比特币市场的订单簿:可以看到红转载 2017-08-25 20:04:06 · 3708 阅读 · 1 评论 -
R语言对高频交易订单流进行建模分析 2
一、实验介绍--hawkes过程参数估计1.1 实验知识点hawkes过程模拟加速最大似然估计 hawkes 最优参数1.2 实验环境R 3.4.1Rstudio二、Hawkes 过程参数估计2.1 指数核 Hawkes 过程模拟优化在上一章中,我们对指数核函数的 Hawkes 过程进行了模拟 , 但是当我们把 事件个数调大时,比如从 100 调到 1000 时转载 2017-08-25 13:58:35 · 2705 阅读 · 1 评论 -
R语言对高频交易订单流进行建模分析 1
一、实验介绍1.1 实验知识点泊松过程及其模拟Hawkes 过程及其模拟1.2 实验环境R 3.4.1Rstudio二、点过程基础假设你蹲在一个交通站台后面,看着人来人往。你觉得乘客的到达似乎存在某种数学规律, 于是你把每个人到达的时刻记录了下来。有什么办法可以对这些人到达的时刻进行建模?你渐渐进入了沉思状态。也许提炼这些点形成的集合所具有的特征是一个好办法转载 2017-08-25 13:55:40 · 3825 阅读 · 2 评论 -
使用R语言基于新浪股票数据分析金融数据的“统计常识”
使用 R 语言基于新浪股票数据分析金融数据的“统计常识”一、实验介绍1.1 实验内容本实验课程以网络上的新浪股票数据为代表,研究金融数据的一些简单的统计性质。首先介绍相关的理论基础,然后在 R 上进行相关的操作,这些主要包括加载所需要的 R 包,在网络上直接载入股票数据,绘制股票数据的一些典型图形以及最终对股票的收益进行一些简单的分析,为简单的金融数据分析打下一些基础。1.2 实验转载 2017-07-28 23:06:37 · 24046 阅读 · 5 评论 -
scikit-learn 实战之非监督学习 4
主成分分析(PCA 降维)一、实验介绍1.1 实验内容非监督学习(英语:Unsupervised learning)是机器学习中十分重要的一个分支。这是本实验课程的第 4 章节,将带你认识主成分分析,并学会使用 scikit-learn 完成数据降维操作。1.2 实验知识点主成分分析PCA 降维1.3 实验环境python2.7Xfce 终端ipython 终端转载 2017-08-04 13:55:22 · 553 阅读 · 0 评论 -
scikit-learn 实战之非监督学习 3
聚类算法对比与选择一、实验介绍1.1 实验内容非监督学习(英语:Unsupervised learning)是机器学习中十分重要的一个分支。这是本实验课程的第 3 章节,将带你了解更多聚类算法,并完成聚类算法对照实验。1.2 实验知识点Mini Batch K-Means 等其他聚类算法聚类算法对比1.3 实验环境python2.7Xfce 终端ipython转载 2017-08-04 13:53:52 · 1266 阅读 · 0 评论 -
使用决策树算法预测森林植被
Spark MLlib 机器学习—决策树算法用于预测森林植被一、实验介绍1.1 内容介绍决策树算法就是通过对已有明确结果的历史数据进行分析,寻找数据中的特征,并以此为依据对新产生的数据结果进行预测。决策树主要由下面三部分组成:决策节点:每个决策节点表示一个待分类的数据类别或属性,其中最顶部的是根决策节点。分支:每一个分支都有一个新的决策节点。叶子节点:每个叶子节点表示一种结果。转载 2017-07-14 22:28:56 · 5451 阅读 · 3 评论