自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 EM算法原理总结

EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。1. EM算法要解决的问题    我们经常会从样本观察数据中,找出样本的模型参数。 最常用的方法就是极大化模型分布的对数似然函数。    但是在一些情况下,我们得到的观察数据...

2018-05-26 11:58:39 654

转载 python merge、concat合并数据集

数据规整化:合并、清理、过滤pandas和python标准库提供了一整套高级、灵活的、高效的核心函数和算法将数据规整化为你想要的形式!本篇博客主要介绍:合并数据集:.merge()、.concat()等方法,类似于SQL或其他关系型数据库的连接操作。合并数据集1) merge 函数参数参数 说明left 参与合并的左侧DataFrameright 参与合并的右侧DataFramehow 连...

2018-05-25 14:28:17 414

转载 Python 基础——range() 与 np.arange()

range()返回的是range object,而np.nrange()返回的是numpy.ndarray() range尽可用于迭代,而np.nrange作用远不止于此,它是一个序列,可被当做向量使用。range()不支持步长为小数,np.arange()支持步长为小数两者都可用于迭代两者都有三个参数,以第一个参数为起点,第三个参数为步长,截止到第二个参数之前的不包括第二个参数的数据序列 某种意...

2018-05-23 14:46:11 5786

转载 python文件和目录操作方法大全

一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()2.返回指定目录下的所有文件和目录名:os.listdir()3.函数用来删除一个文件:os.remove()4.删除多个目录:os.removedirs(r“c:\python”)5.检验给出的路径是否是一个文件:os.path....

2018-05-23 13:13:21 160

转载 Python 中的比较:is 与 ==

在 Python 中会用到对象之间比较,可以用 ==,也可以用 is 。但是它们的区别是什么呢?is 比较的是两个实例对象是不是完全相同,它们是不是同一个对象,占用的内存地址是否相同。莱布尼茨说过:“世界上没有两片完全相同的叶子”,这个is正是这样的比较,比较是不是同一片叶子(即比较的id是否相同,这id类似于人的身份证标识)。== 比较的是两个对象的内容是否相等,即内存地址可以不一样,内容一样就...

2018-05-18 20:02:46 425

转载 ML重要概念:梯度(Gradient)与梯度下降法(Gradient Descent)

引言 机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归、逻辑回归、Softmax回归、神经网络和SVM等等,主要学习资料来自网上的免费课程和一些经典书籍,免费课程例如Standford Andrew Ng老师在Coursera的教程以及UFLDL Tutorial,经典书籍例如《统计学习方法》等,同时也参考了大量网上的相关资料(在后面列出)。     前言 ...

2018-05-18 10:45:23 4352

转载 python 列表、元组、字典 增删改查 等常用操作

#coding=utf-8    #列表  string  = 'list'  #字符串->列表  list1 = list(string) # ['l', 'i', 's', 't']  #列表->字符串  string1 = ''.join(list1) #list    #列表的增删改查  list1 = list('this is a list')  #增加  list1.ap...

2018-05-13 21:56:16 304

转载 python 单下划线及双下划线使用总结

python 用下划线作为变量前缀和后缀指定特殊变量/方法。主要存在四种情形object # public__object__ # special, python system use, user should not define like it__object # private (name mangling during runtime) _object # obey python co...

2018-05-10 14:43:40 649

转载 Python 用下划线作为变量前缀和后缀指定特殊变量

_xxx   :保护变量,意思是只有类对象和子类对象能够访问到这些变量(尽量避免在类外部直接修改)__xxx__ :系统定义名字__xxx  :类中的私有变量名核心风格:避免用下划线作为变量名的开始。因为下划线对解释器有特殊的意义,而且是内建标识符所使用的符号,我们建议程序员避免用下划线作为变量名的开始。一般来讲,变量名_xxx被看作是“私有 的”,在模块或类外不可以使用(是可以使用的,但是一般不...

2018-05-10 14:27:59 671

转载 Python中lambda表达式学习

lambda只是一个表达式,函数体比def简单很多。lambda的主体是一个表达式,而不是一个代码块。仅仅能在lambda表达式中封装有限的逻辑进去。lambda表达式是起到一个函数速写的作用。允许在代码内嵌入一个函数的定义。如下例子:定义了一个lambda表达式,求三个数的和。再看一个例子:用lamb...

2018-05-09 19:48:48 99

转载 利用map函数与zip(*)函数对数组转置

在Python的numpy中,对类似array=[[1,2,3],[4,5,6],[7,8,9]];的二维数组的转置,就一句话array.T。其实不使用numpy,单纯使用Python,代码也不长,同样也是一行。不过在此之前,先说明Python中map函数与zip(*)的使用。一、map函数首先Python中的map函数是很简单的。意为将第二个参数(一般是数组)中的每一个项,处理为第一个参数的类型...

2018-05-09 14:30:22 1098

原创 dict与set的区别:

dict 1. dict其实就是Java中的map,dict是一个键值对集合(key-value),它可以根据键来唯一确定对应的值的内存地址,具有极快的查询和插入速度,不会随着数据的增加而变慢 2. key存放的顺序与内部存放的顺序是没有关系的 3. 需要占用大量的内存,造成资源浪费 4. dict的key值是不可变的 附录:可变数据类型:列表list和字典dict;不可变数据类型:整型...

2018-05-09 11:19:50 1708

原创 python中,字典、列表、元组的区别也就是花括号,中括号,小括号的区别

Python主要有三种数据类型:字典、列表、元组。其分别由花括号,中括号,小括号表示。 列表/元组/集合/字典的理解(1)列表是任意对象的序列。列表用方括号表示。(2)将一组值打包到一个对象中,称为元组。元组用小括号表示。元组和列表的大部分操作相同。但是,列表是不固定的,可以随时插入,删除;而元组一旦确认就不能够再更改。所以,系统为了列表的灵活性,就需要牺牲掉一些内存;而元组就更为紧凑。(注意,元...

2018-05-09 11:02:42 4534

转载 NumPy数组(1、数组初探)

NumPy数组(1、数组初探)更新目前我的工作是将NumPy引入到Pyston中(一款Dropbox实现的Python编译器/解释器)。在工作过程中,我深入接触了NumPy源码,了解其实现并提交了PR修复NumPy的bug。在与NumPy源码以及NumPy开发者打交道的过程中,我发现当今中文NumPy教程大部分都是翻译或参考英文文档,因此导致了许多疏漏。比如NumPy数组中的broadcast功能...

2018-05-09 10:44:10 308

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除