自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Nicole的博客

记录机器学习中遇到的问题

  • 博客(27)
  • 资源 (12)
  • 收藏
  • 关注

转载 Python嵌套列表转一维(压平嵌套列表)

       前一段去云英面试,技术官很”不厚道“了问了一个非常简单的问题:如何将多维列表转化了一维的?当时虽然想到了使用迭代或者列表生成式可以做到,但是可以没能可行的代码,回来后一顿后悔。     对于规范的且嵌套维度较低的多维列表,python中有很多方法可以...

2018-04-24 09:55:34 3222 1

转载 四、降维——流形学习 (manifold learning)

zz from prfans............................... dodo:流形学习 (manifold learning)dodo流形学习是个很广泛的概念。这里我主要谈的是自从2000年以后形成的流形学习概念和其主要代表方法。自从2000年以后,流形学习被认为属于非线性降维的一个分支。众所周知,引导这一领域迅速发展的是2000年Science杂志上的两篇文章: ...

2018-04-23 18:45:17 6079 1

转载 R语言中的scale函数

scale函数是将一组数进行处理,默认情况下是将一组数的每个数都减去这组数的平均值后再除以这组数的均方根。其中有两个参数,center=TRUE,默认的,是将一组数中每个数减去平均值,若为false,则不减平均值;                            scale=TRUE:默认的,是将一组数中每个数除以均方根()并不是均方根,而是为了计算方差而设计的一个类似样本方差的东西,所以计...

2018-04-23 18:18:21 35035

转载 三、降维——PCA, 3d可视化以及R聚类

 导入数据数据使用的是iris数据包:data(iris)iris$Species <- factor(iris$Species, levels = c("Versicolor", "virginica", "setosa"))可以使用head(iris)来查看数据情况。可以简单看看数据的拟合情况:round(cor(iris[,1:4]),2主成分分析P...

2018-04-23 18:16:13 5217

转载 二、降维——流形学习-高维数据的降维与可视化

1.流形学习的概念流形学习方法(Manifold Learning),简称流形学习,自2000年在著名的科学杂志《Science》被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数...

2018-04-23 18:12:29 4424

转载 一、降维——机器学习笔记——降维(特征提取)

目录 一、为什么要降维1、降维的分类2、示例二、第一部分,线性降维方法  1、【PCA】主成分分析2、【LDA】判别分析3、【MDS】多维尺度分析三、第二部分,非线性降维方法1、【流形学习】2、【ISOMAP】等距特征映射3、【LLE】局部线性嵌入四、总结什么时候使用哪种降维技术 一、为什么要降维维数灾难:在给定精度下,准确地对某些变量的函数...

2018-04-23 17:47:00 28554 3

转载 一、特征选择常用算法综述

1 综述 (1)什么是特征选择特征选择 ( FeatureSelection )也称特征子集选择(Feature Subset Selection , FSS ) ,或属性选择( AttributeSelection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。 (2)为什么要做特征选择       在机器学习的实际应用中,特征数量往往较多,其中可能存在不...

2018-04-23 16:41:04 378

转载 数据库的内连接、外连接(左外连接、右外连接、全外连接)以及交叉连接

SQL数据库的连接:内连接、和外连接(左外连接、右外连接、和全连接)本次实验在MySQL数据库中进行,数据库初始表如下:一、内连接:结果仅包含符合连接条件的两表中的行。如下:二、外连接:结果包含符合条件的行,同时包含不符合条件的行(分为左外连接、右外连接和全外连接)1、左外连接:左表全部行+右表匹配的行,如果左表中某行 在右表中没有匹配的行,则右表该行显示NULL。如下:2、右外连接:和左外连接相...

2018-04-21 18:01:46 458

转载 《利用python进行数据分析》读书笔记

《利用python进行数据分析》读书笔记--第四章 numpy基础:数组和矢量计算第四章 Numpy基础:数组和矢量计算第一部分:numpy的ndarray:一种多维数组对象实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于:用于数据整理和清理、子集构造和过...

2018-04-17 11:32:06 600

转载 NumPy的详细教程(官网手册翻译)

先决条件在阅读这个教程之前,你多少需要知道点Python。如果你想从新回忆下,请看看Python Tutorial.如果你想要运行教程中的示例,你至少需要在你的电脑上安装了以下一些软件:PythonNumPy这些是可能对你有帮助的:ipython是一个净强化的交互Python Shell,对探索NumPy的特性非常方便。matplotlib将允许你绘图Scipy在NumPy的基础上提供了很多科学模...

2018-04-17 11:29:00 198

转载 四、Python中scatter函数参数详解

最近开始学习Python编程,遇到scatter函数,感觉里面的参数不知道什么意思于是查资料,最后总结如下:1、scatter函数原型2、其中散点的形状参数marker如下:3、其中颜色参数c如下:4、基本的使用方法如下:[python] view plain copy#导入必要的模块   import numpy as np   import matplo...

2018-04-17 11:26:36 4848

转载 python装饰器–原来如此简单

python装饰器–原来如此简单今天整理装饰器,内嵌的装饰器、让装饰器带参数等多种形式,非常复杂,让人头疼不已。但是突然间发现了装饰器的奥秘,原来如此简单。。。。# -*- coding:gbk -*-'''示例1: 使用语法糖@来装饰函数,相当于“myfunc = deco(myfunc)”但发现新函数只在第一次被调用,且原函数多调用了一次'''def deco(func): p...

2018-04-17 11:18:41 8973 4

转载 python中os模块用法

一、os模块概述Python os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。(一语中的)二、常用方法1、os.name输出字符串指示正在使用的平台。如果是window 则用'nt'表示,对于Linux/Unix用户,它是'posix'。2、os.ge...

2018-04-17 11:10:17 63020 5

原创 怎样理解 REST、RESTful

本文虽然是参考别人的内容,但是是作者花很多心思整理出来,整理本文章的目的是为了自己可以好理解REST和方便其他人理解,如果要转载,请征求作者意见!一、什么是API?    为了解释清楚REST,必须理解API。API(Application Programming Interface,应用程序编程接口),通俗来讲就是像一个公司比如腾讯、阿里之类,他们可以提供一个API,然后我们或者其他的小公司可以...

2018-04-11 18:02:21 3706 1

转载 python set集合运算(交集,并集,差集,对称差集)

版权声明:本文为转载文章,原文地址:https://blog.csdn.net/sxingming/article/details/51922776点击打开链接1》交集>>> x={1,2,3,4}>>> y={3,4,5,6}>>> xset([1, 2, 3, 4])>>> yset([3, 4, 5, 6])>&g

2018-04-09 15:24:30 2002

转载 Python类中的 私有变量和私有方法

版权声明:转载请标注出处。 原文章地址:点击打开链接。https://blog.csdn.net/sxingming/article/details/52875125默认情况下,Python中的成员函数和成员变量都是公开的(public),在python中没有类似public,private等关键词来修饰成员函数和成员变量。在python中定义私有变量只需要在变量名或函数名前加上 ”__“两...

2018-04-09 14:07:38 1837 2

转载 Python学习笔记(1)__name__变量

Python使用缩进对齐组织代码的执行,所有没有缩进的代码,都会在载入时自动执行。每个文件(模块)都可以任意写一些没有缩进的代码,并在载入时自动执行。为了区分 主执行代码和被调用文件,Python引入了变量:__name__。1)当文件是被调用时,__name__的值为模块名;2)当文件被执行时,__name__的值为 ‘__main__’。基于此特性,为测试驱动开发提供了很好的支持,...

2018-04-09 10:55:27 197

转载 python中的接口

什么是接口 ?接口只是定义了一些方法,而没有去实现,多用于程序设计时,只是设计需要有什么样的功能,但是并没有实现任何功能,这些功能需要被另一个类(B)继承后,由 类B去实现其中的某个功能或全部功能。个人的理解,多用于协作开发时,有不同的人在不同的类中实现接口中的各个方法。在python中接口由抽象类和抽象方法去实现,接口是不能被实例化的,只能被别的类继承去实现相应的功能。个人觉得接...

2018-04-09 09:05:37 363

转载 Python Pandas与Numpy中axis参数的二义性

Stackoverflow.com是程序员的好去处,本公众号将以pandas为主题,开始一个系列,争取做到每周一篇,翻译并帮助pandas学习者一起理解一些有代表性的案例。今天的主题就是Pandas与Numpy中一个非常重要的参数:axis.(轴)Stackoverflow问题如下:python中的axis究竟...

2018-04-08 13:51:16 218

原创 numpy基础:数据和矢量计算

NumPy基础:数组和矢量计算numpy(numerical python的简称)是高性能科学计算和数据分析的基础包,其主要功能如下: 1.快速高效的多维数组对象 ndarray; 2.直接对数组执行数学运算及对数组执行元素级计算的函数; 3.线性代数运算、随机数生成; 4.将 C、C++、Fortran 代码集成到 Python 的工具等。一、numpy中的nda...

2018-04-05 17:02:39 1305

原创 python简介

Python是一种解释性,面向对象,动态数据类型的搞基程序设计语言1.特点 1.解释性语言:开发过程中没有了变异环节,类似于PHP 2.交互式语言:可以在一个Python提示符,直接互动执行程序 3.面向对象语言:支持面向帝乡的风格或者代码封装在对象的编程技术 4.初学者的语言 2.发展历史 1.在80年代末90年代初设计出来的 2.Python本身是诸多起亚语言发展来的 3.现在由一个核心开发团...

2018-04-05 12:02:00 153

原创 pandas的层次化索引

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt一、pandas的层次化索引层次化索引是pandas的一项重要功能,它使你能够在一个轴上拥有多个(两个以上)索引级别。换句话来说,它能够让你以低纬度的形式处理高纬度数据。1.Series的层次化索引¶(1)生成数据 data = pd....

2018-04-04 14:38:17 2319

原创 python 数据结构(Data Structure)

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt一、Data Structure1.List列表是Python自带的数据结构,是一个按照定顺序存储对象的数据结构。通常通过索引访问列表,索引从0开始。(1)修改列表:给列表赋值x = [1,1,1]x[1] = 2 #使用索引法给特定位置...

2018-04-04 10:56:18 8668

转载 二、python可视化——箱线图

数据描述参数介绍 plt.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, meanline=None, showmeans=None, ...

2018-04-04 10:48:08 4679

转载 一、python可视化——热力图

热力图1、利用热力图可以看数据表里多个特征两两的相似度。参考官方API参数及地址:seaborn.heatmap(data, vmin=None, vmax=None,cmap=None, center=None, robust=False, annot=None, fmt=’.2g’, annot_kws=None,linewidths=0, linecolor=’white’, cba...

2018-04-04 10:41:57 265069 29

转载 python merge、concat合并数据集

数据规整化:合并、清理、过滤pandas和python标准库提供了一整套高级、灵活的、高效的核心函数和算法将数据规整化为你想要的形式!本篇博客主要介绍:合并数据集:.merge()、.concat()等方法,类似于SQL或其他关系型数据库的连接操作。合并数据集1) merge 函数参数参数 说明left 参与合并的左侧DataFrameright 参与合并的右侧DataFramehow 连...

2018-04-04 10:07:54 331

原创 10 Minutes to pandas(pandas官方网站的翻译)

本文主要参考官方网站对pandas的介绍,加上自己的理解,有不对的地方多多包涵哈!!!pandas模块介绍 ##通常会加载以下模块import pandas as pdimport numpy as npimport matplotlib.pyplot as plt一、创建对象1.通过列表的值创建Series Series是pandas提供的以为数组,它类似于numpy中的...

2018-04-04 09:21:10 2717

随机森林原理、示例、应用

本资源主要简单介绍随机森林的原理,随机森林的应用特点,以及它的实例和在python上的实现。

2018-10-16

数理统计——基本概念及专题-李泽慧等译

《数理统计习题教程(上下)》为《数理统计——基本概念及专题》的配套习题解答。主要内容包括概率论中的一些课题、统计模型、估计方法、估计的比较——最优化理论、从估计到置信区间和假设检验、最优化检验与置信区间——似然比检验及有关方法,线性模型——回归和方差分析,离散数《数理统计习题教程(上下)》可供大专院校有关专业作为数理统计课程的配套教材和参考书。

2018-06-09

统计学_David Freedman

非常有名的统计学经典书籍,这本书读起来是比较轻松的,因为不需要太多的概率论基础,也没有很复杂的推导或公式。本书采用概率论的频率理论来讨论统计学,重视统计思想及引导如何应用统计学解决实际问题。书中所采用的例子和习题采用的数据绝大多数都是实际的数据(与国内教材的造的数据与例子形成鲜明对比,有点遗憾的数据几乎都是美国的)。除每章的复习题外,所有的习题都有答案。约95%的习题是简单的,做它们可以很好地复习教材内容;但另外5%的习题却只是貌似简单而已,思考它们将使我们受益。第四部分概率有概率论基础的人可以快速略过。

2018-06-09

R数据分析与案例详解

《R数据分析--方法与案例详解(双色)》是一本R 语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R 语言的基本使用以及编程技巧。

2018-06-09

R语言编程艺术

《R语言编程艺术》是R语言领域公认的经典著作,由著名计算机科学家兼统计学家撰写,Amazon五星级畅销书。它是一本面向R语言开发者的纯编程类书籍,不需要读者具备统计学基础,从编程角度而非统计学角度系统讲解了R语言的数据结构、编程结构、语法、TCP/IP网络编程、并行计算、代码调试、程序性能优化、编程技巧以及R语言与其他语言的接口等所有与R编程相关的知识,几乎面面俱到。本书的实用性也非常强,44个精选的扩展案例,充分展示了R语言在数据处理和统计分析方面的强大能力。 全书一共16章:第1章介绍了学习R语言需要掌握的预备知识以及它的一些重要数据结构;第2~6章详细讲解了R语言的主要数据结构,包括向量、矩阵、数组、列表、数据框和因子;第7~13章全面讲解了R语言的语法,包括编程结构、面向对象特性、数学运算与模拟、输入与输出、字符串处理、绘图,以及R语言的调试方法。第14~16章讲解了R语言编程的高级内容,如执行速度和性能的提升、R语言与C/C++或Python的混合编程,以及R语言的并行计算等。

2018-06-09

pandas模块的常用

压缩包中主要有5个文档,主要介绍pandas的数据结构、结冰功能、pandas的汇总和统计描述、处理缺失值和pandas的层次化索引。有兴趣的小伙伴可以下载!!!!

2018-06-08

logistic回归二分类的python实现博文的数据

logistic回归二分类的python实现博文的源数据,想要对着代码来操作一遍的伙伴们可以在这里下载!

2018-06-08

《Machine Learning A Probabilistic Perspective》

机器学习非常推荐的一本书,能够兼顾深度和广度、并且比较适合拥有计算机科学或其它相关领域基础的初学者的教材

2018-06-08

利用python进行数据分析

用python做数据分析非常推荐的一本书!!书中讲解了pandas、numpy、matplotlib包的使用,非常适合初学者使用!!

2018-06-08

logistic regression实现多类别分类的实现数据集

logistic regression实现多类别分类的实现数据集的源数据

2018-06-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除