自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 【转】奇异值分解(SVD)

转载:http://redstonewill.com/1529/普通方阵的矩阵分解(EVD)我们知道如果一个矩阵 A 是方阵,即行列维度相同(mxm),一般来说可以对 A 进行特征分解:其中,U 的列向量是 A 的特征向量,Λ 是对角矩阵,Λ 对角元素是对应特征向量的特征值。举个简单的例子,例如方阵 A 为:那么对其进行特征分解,相...

2019-09-13 09:40:00 179

转载 【转】协方差与相关系数

转载:http://redstonewill.com/1511/什么是协方差(Covariance)?1 协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于...

2019-09-13 09:39:00 374

转载 梯度下降法

在应用机器学习算法时,我们通常采用梯度下降法来对采用的算法进行训练。其实,常用的梯度下降法还具体包含有三种不同的形式,它们也各自有着不同的优缺点。下面我们以线性回归算法来对三种梯度下降法进行比较。一般线性回归函数的假设函数为:对应的代价函数为:下图作为一个二维参数(,)组对应能量函数的可视化图:下面我们来分别讲解三种梯度下降法批...

2019-08-30 22:31:00 191

转载 Pathlib模块

Python 文件路径处理问题由于许多不同的原因,使用文件和与文件系统交互很重要。 最简单的情况可能只涉及读取或写入文件,但有时候会有更复杂的任务。 也许你需要列出给定类型的目录中的所有文件,查找给定文件的父目录,或者创建一个尚不存在的唯一文件名。一般情况,Python 使用常规文本字符串表示文件路径。 一般在使用 os,glob 和 shutil 等库的时候会使用到路径拼接的操...

2019-08-24 21:21:00 269

转载 【Numpy】数组的操作2

比较、掩码和布尔逻辑当想基于某些准则来抽取,修改,计数或对一个数组中的值进行其他操作时,掩码就派上用场了例如,统计数组中有多少值大于某个给定值,或者删除所有超过某些门限值的异常点在numpy中,布尔掩码通常是完成此类任务的最高效方式比较操作Numpy实现了如<小于和>大于的逐元素比较的通用函数,这些比较运算的结果是一个布尔数据类型的数组共有6中不同的比...

2019-08-24 21:20:00 220

转载 【Numpy】数组的计算2

1. 聚合:最小值、最大值和其他值当面对大量数据时,第一个步骤通常是计算相关数据的概括统计值,最常用的概括统计值可能是均值和标准差,这两个值都能让你分别概括数据集中的“经典”值,但是其他一些形式的聚合也是很有用的(如求和,乘积,中位数,最大值和最小值,分位数等)numpy有非常快速的内置聚合函数可用于数组1.1 数组值求和计算一个数组所有元素的和,可以使用Python本...

2019-08-24 21:19:00 146

转载 【Numpy】数组的计算1

Numpy数组的计算:通用函数Numpy数组的计算有时非常快,有时也非常慢,使Numpy变快的关键是利用向量化的操作,通常在Numpy的通用函数中实现,提高数组元素的重复计算的效率缓慢的循环Pythom的默认实现(被称为Cpython)处理某种操作时非常慢,一部分原因是该语言的动态性和解释性-数据类型的灵活特性决定了序列操作不能像C语言和Fortan语言一样被编译成有效的机器...

2019-08-24 21:18:00 177

转载 【Numpy】数组的操作1

python中的固定类型数组python提供的内置的数组array模块可以用于创建同一类型的密集数组1 import array2 3 l = list(range(10))4 5 a = array.array("i", l)6 7 a8 Out[20]: array('i', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])...

2019-08-24 21:18:00 346

转载 词向量技术原理及应用详解(一)

文本表示是自然语言处理中的基础工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。在自然语言处理研究领域,文本向量化是文本表示的一种重要方式。顾名思义,文本向量化就是将文本表示成一系列能够表达文本语义的向量。无论中文还是英文,词语都是表达文本处理的最基本单元。当前阶段,对文本向量化都是通过词向量化实现的。当然也有将文章或者句子作为文本处理的基本单元,像doc2...

2019-08-24 21:16:00 195

转载 词向量技术原理及应用详解(二)

当前文本向量化主流的方式是word2vec词向量技术,从基于统计的方法,到基于神经网络的方法,掌握word2vec词向量技术是学习文本向量化的最好的方式下面是Tomas MIkolov的三篇有关word embedding的文章: 1、Efficient Estimation of Word Representation in Vector Space, ...

2019-08-24 21:16:00 436

转载 wordcloud 入门

wordcloud 安装pip安装1 python3.6 -m pip install wordcloud -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.comconda安装1 conda install -c conda-forge wordcloud...

2019-08-24 21:15:00 151

转载 哈工大pyltp

介绍LTP(Language Technology Platform)为中文语言技术平台,是哈工大社会计算与信息检索研究中心开发的一整套中文语言处理系统。LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(Dynamic Link Library,DLL)的应用程...

2019-08-24 14:04:00 253

转载 Flask框架学习

快速入门1 from flask import Flask2 app = Flask(__name__)3 4 @app.route('/')5 def hello_world():6 return 'Hello World!'7 8 if __name__ == '__main__':9 app.run()把它保存为he...

2019-08-21 09:22:00 232

转载 python logging模块

日志记录的重要性在开发过程中,如果程序运行出现了问题,我们是可以使用我们自己的 Debug 工具来检测到到底是哪一步出现了问题,如果出现了问题的话,是很容易排查的。但程序开发完成之后,我们会将它部署到生产环境中去,这时候代码相当于是在一个黑盒环境下运行的,我们只能看到其运行的效果,是不能直接看到代码运行过程中每一步的状态的。在这个环境下,运行过程中难免会在某个地方出现问题,甚至这个问...

2019-08-21 09:18:00 72

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除