自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 一文搞懂python2/3 from __future__ import absolute_import

干货当py文件作为***模块***被调用的时候,可以直观的看出导入和未导入absolute_import的效果差别py文件(例如a.py)作为***模块***被调用的情况可以是1. 在其他py文件导入import a2. 通过python -m xxx.yyy 其中xxx是某个python的package, yyy是package下的某个模块absolute_import的作用是改变模...

2019-09-10 23:03:22 1091

原创 API详解:sklearn.model_selection.cross_validate

为了防止过拟合,通常的做法是将数据集分成训练集(train set)和测试集(test set)。 假设我们现在有个既定的模型。简单来说就拿LinearRegression() 来说。我们有一系列的可选超参。我们希望找到最优的一组超参。按照常规,我们的做法是先在train set 中训练模型,然后拿test set 去测试,找到R2R2R^2 值最好的那个模型。 但是这样跳出来的模型,真的就是最好...

2018-03-08 21:04:12 6961

原创 API详解:sklearn.pipeline.Pipeline

在sklearn中提供了Pipeline(管道操作) 可以将多个estimators组装成一个。对于固定流程的一个项目来说,在一个Pipline中可以定义一些列的操作例如(特征提取,标准化,分类)并将它定义成一个estimator,实现便捷的代码附用。总的来说pipline的意义有:便捷:只需要使用fit和predict两个methods,就可以基于定义好的Pipeline对数据进行一...

2018-03-08 00:05:49 2842

原创 API详解:sklearn.preprocessing.PolynomialFeatures

标准的线性回归,无法考虑输入参数features之间的关系 毕竟模型很简单y=∑i=0nθixiy=∑i=0nθixiy=\sum_{i=0}^{n} \theta_{i} x_{i} 其中θθ\theta 为系数,xixix_{i} 为输入的各个features但是有时候我们需要考虑,features之间的相互作用关系。 这时候多项式扩展就是一个很好的选择。 简单的来说: 比如说...

2018-03-07 18:55:30 1446

原创 API详解:sklearn.linear_model.LinearRegression

基于最小二乘法的线性回归。非常基础。那么相应的API 的调用参数有哪些呢?调用方法: 老套路,先定义一个线性回归对象lr = sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=1)fit_intercept : 默认为True,是否计算该模型的截距...

2018-03-07 00:06:22 21314 3

翻译 API详解sklearn.preprocessing.StandardScaler

数据在前处理的时候,经常会涉及到数据标准化。将现有的数据通过某种关系,映射到某一空间内。常用的标准化方式是,减去平均值,然后通过标准差映射到均至为0的空间内。系统会记录每个输入参数的平均数和标准差,以便数据可以还原。很多ML的算法要求训练的输入参数的平均值是0并且有相同阶数的方差例如:RBF核的SVM,L1和L2正则的线性回归sklearn.preprocessing.StandardSc...

2018-03-06 21:21:12 13895 5

翻译 API详解:sklearn.model_selection.train_test_split

试想现在收手拿到了数据集,希望做有监督训练。 需要将数据集分成训练集和测试集。 你会怎么做?rand一个不重复的序列,然后按照比例截断。按照序列找到对应的行数作为训练集或者数据集。好吧,你是按照np array的格式写的。万一来了个dataframe的格式。 嗯把他转换一下,要么就用iloc定个位。 可是万一数据集格式不确定呢?来了个list。 想想都烦躁是不是。 这时候,你需要一个划分数...

2018-03-05 22:22:28 1600

翻译 API:详解 pandas.read_csv

pandas.read_csv 作为常用的读取数据的常用API,使用频率非常高,但是API中可选的参数有哪些呢? pandas项目代码 答案是:.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=Fa...

2018-03-03 23:52:40 43061 3

原创 贝叶斯决策理论

《模式识别》(第二版) 边肇祺 清华大学出版社引言贝叶斯( Bayes ) 决策理论方法分类时要求: 1.各类别总体的概率分布是已知的 例子: 研究的分类问题有 c 个类别, 各类别状态用 ω 来表示 1.1先验概率 P ( ωi ) 1.2类条件概率密度函数p ( xi | ωi ) wi 类别 xi 特征 已知 2.要决策分类的类别数是一定的。常用决策规则最小错误率计算p(w

2017-07-04 17:40:43 534

原创 模式识别绪论

《模式识别》(第二版) 边肇祺 清华大学出版社模式识别和模式的概念我们把通过对具体 的个别事物进行观测所得到的具有时间和空间分布的信息 称为模式, 而把模式所属的类别或同一类中模式的总体称为模式类( 或简称为类) 也有人习惯于把模式类称为模式, 而把个别具体的模式称为样本模式识别系统两种基本方法: 1.统计模式识别 数据获取, 预处理, 特征提取和选择, 分类决策 2.结构模式识别 两个过

2017-07-04 16:22:10 591

原创 简单支持向量机推导和结论

目标寻找一个超平面,能够很好的区分一个二分类问题目标函数argmaxw,b(min(1||wT|||wTxi+b))argmax_{w,b}(min(\frac{1}{||w^T||}|w^{T}x_i+b)) xi属于Xx_i属于X X.shape=(D,N)X.shape=(D,N) N为输入个数,D为输入维度N为输入个数,D为输入维度 w.shape=(D,1)w.shape=(D,

2017-06-23 03:40:43 312

原创 回归算法注意点

1.回归算法的基本假设是:误差是独立且有相同分布,通常情况下服从高斯分布其均值为0。2.回归算法的推导原理。极大似然估计3.线性回归θ=(XTX)−1XTy\theta=(X^TX)^{-1}X^Ty 其中X.shape=(N,D)X.shape=(N,D) N为样本个数 D为输入维度 θ.shape=(D,d)\theta.shape=(D,d) D为输入维度

2017-06-21 04:53:09 321

原创 Filter and Digital Image Processing

本文为课堂笔记,严禁转载本文为了方便自己复习记录,如有理解不对的地方还望指正。Purpose of Digital Image ProcessingImage procssing IImage Enhancement (Improving subjective image quality e.g image contrast) Image Restoration(Improving objecti

2017-06-20 19:47:55 462

原创 图像处理介绍

本文为课堂笔记,严禁转载图像来源光学(通常的照片) EM-Waves(星体探测) 红外线 X射线 Synthetic Aperture Radar 电子显微镜扫描 磁共振成像 声纳 超声波什么是数字图像3D世界通过 1.Image Formation e.g pinhole camera 2.Digitization (by sampling)Continues to discr

2017-06-20 09:01:29 4042

原创 图像处理动机(课堂笔记)

本文为课堂笔记,严禁转载研究热点Computer Vision形状抓取 图形分割,聚类 物体识别AIMLP/ConvNets 随机森林 概率模型Remote SensingPoISAR Optical Imagery 物体识别Photogrammetric CV3D 重构综上所诉 主要内容有 1.Image Processing Image to Image Image to

2017-06-20 08:13:32 294

转载 Merge

转载地址合并数据集pandas对象中的数据能够通过一些内置的方式进行合并:pandas.merge可依据一个或多个键将不同DataFrame中的行连接起来。SQL或其它关系型数据库的用户对此应该会比較熟悉,由于它实现的就是数据库的连接操作。pandas.concat能够沿着一条轴将多个对象堆叠到一起。实例方法combine_first能够将反复数据编接在一起,用一个对象中的值填充还有一个对象中的缺失

2017-06-20 07:21:48 347

原创 Pandas入门笔记

笔记参照课程唐宇迪python数据分析与机器学习实战 笔记方便自己今后回顾和查看,需要详细了解各自Pandas操作,建议学习上述课程 Pandas数据结构pandas是基于numpy的数据处理库。其数据的基本结构从小到大依次为numpy.array,pandas.core.series.Series以及pandas.core.frame.DataFrame. 简单的pandas特有的结构为seri

2017-06-20 00:41:58 1414

转载 Numpy 入门笔记

Numpy 入门笔记笔记参照课程唐宇迪python数据分析与机器学习实战 笔记方便自己今后回顾和查看,需要详细了解各自numpy操作,建议学习上述课程 代码https://github.com/Jingyaozhou/numpy_introduction.git基础操作matrix 和 vector 定义import numpy as np#define vectorvertor=np.ar

2017-06-15 04:30:12 438

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除