- 博客(6)
- 资源 (14)
- 收藏
- 关注
转载 ROC和AUC介绍以及如何计算AUC
ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对两者的简单介绍见这里。这篇博文简单介绍ROC和AUC的特点,以及更为深入地,讨论如何作出ROC曲线图以及计算AUC。ROC曲线需要提前说明的是,我们这里只讨论二值分类器。对于分类器,或者说分类算法,评价指标主要有precision,rec...
2018-04-24 13:53:18 2381
转载 使用PCA对特征数据进行降维
使用PCA对特征数据进行降维2017年3月9日 BY 蓝鲸 1 COMMENTPCA(Principal Component Analysis)是机器学习中对数据进行降维的一种方法。主要目的是在不丢失原有数据信息的情况下降低机器学习算法的复杂度,及资源消耗。本篇文章将使用python对特征进行降维。PCA通过线性变换将原始数据中可能相关的数据转换为一组线性不
2018-04-23 09:29:25 5901
转载 主成分分析(Principal components analysis)-最大方差解释
主成分分析(Principal components analysis)-最大方差解释 在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做Principal factor a
2018-04-19 11:44:01 598
原创 机器学习世界的“特征”
特征——算法眼中的世界——摘自“机器学习系统设计”一书1. 特征的类型特征有三种不同的类型:定量特征、有序特征和分类特征。还可以认为有第四种特征类型,即布尔类型。按信息量由高到低排序依次为:定量特征、有序特征、分类特征和布尔型特征。2. 运算和统计特征可以由其可行运算来定义,我们可以将特征的可行计算范围称为特征的统计。这些统计描述了数据的三个不同的方面—
2018-04-19 11:42:44 554
原创 使用Sklearn机器学习库对Iris进行训练和测试
from sklearn.linear_model import LogisticRegressionimport pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerimport pandas as pdimpor
2018-04-19 09:23:30 659
原创 python网页抓取多年水文数据解析并存入mysql数据库
import requestsimport chardetfrom bs4 import BeautifulSoupimport pandas as pdimport pymysql.cursorsfrom sqlalchemy.orm import sessionmakerfrom scray.models import *# 连接MySQL数据库ip='127.0.0.1'...
2018-04-01 16:16:50 4035
arccatalog使用手册
2010-07-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人