数据科学
Big_quant
热爱技术,改变世界。
展开
-
Pytorch实践中文教程(1)
前言PyTorch 是一个基于Torch框架的开源Python机器学习库,用于NLP,CV等深度学习应用。它的开发人员是 Facebookd的人工智能小组,它不仅可以利用GPU加速,同时还实现了动态神经网络,这点和现在流行的主流框架如TensorFlow不同。 PyTorch同时还有两个高级功能: 张量计算(如Numpy) 和自动求导。除了Facebook之外,Twitter、GMU和Salesforce等机构也都采用了PyTorch。TensorFlow和Caffe都是命令式的静态编程语言,,首先原创 2020-06-09 21:24:13 · 859 阅读 · 0 评论 -
转载PLMN ISDN PSTN
PLMN公众陆地移动电话网(PLMN) public land mobile network 由政府或它所批准的经营者,为公众提供陆地移动通信业务目的而建立和经营的网路。该网路必须与公众交换电话网(PSTN)互连,形成整个地区或国家规模的通信网。===========================================================================...原创 2020-03-31 17:57:13 · 612 阅读 · 0 评论 -
机器学习--CART分类回归树
许多问题都是非线性的,用线性模型并不能很好的拟合数据,这种情况下可以使用树回归来拟合数据。因此本文特别介绍一下CART, 树剪枝,模型树等等算法。1.CART回归树简介传统决策树是一种贪心算法,在给定时间内做出最佳选择,不关心是否达到全局最优。切分过于迅速,特征一旦使用后面将不再使用。不能处理连续型特征,进行离散化可能会破坏连续变量的内在特征。CART 分类回归树,既能分类又能回归。CRA...原创 2019-12-29 12:57:17 · 717 阅读 · 0 评论 -
PyTorch torchvision.models小结
前言PyTorch框架中有一个非常重要且好用的包:torchvision,该包主要由3个子包组成,分别是:torchvision.datasetstorchvision.modelstorchvision.transforms笔记官网介绍 源码本文介绍 torchvision.models 如何使用。以 vgg16为例子导入预训练模型:import torchvisi...原创 2019-12-29 12:55:08 · 2879 阅读 · 0 评论 -
机器学习导论(张志华)笔记
介绍人工智能最近发展的如火如荼,要想本质掌握这门技术,离不开优秀资源的支撑。北京大学的张志华老师,发布在网上的视频可以说是经典资源,特此分享给大家。正文张志华 ,北京大学数学科学学院教授,北京大数据研究院教授。曾经先后任教于上海交通大学和浙江大学。主要从事统计机器学习与人工智能领域的研究和教学,是国际机器学习旗舰刊物JMLR的执行编委,并多次受邀担任国际人工智能顶级学术会议的程序委员或...原创 2019-11-18 19:48:06 · 1122 阅读 · 0 评论 -
统计自然语言处理笔记
前言学习技术离不开经典技术材料,目前深度学习的自然语言处理如火如荼,了解一下之前的统计自然语言处理也是很有必要的。课程介绍男,1970年生,黑龙江省宁安市人。博士,教授,博士生导师。AAAS会员,ACM会员,IEEE高级会员,中国计算机学会高级会员,中国自动化学会会员。主要研究方向:医疗健康信息学、网络挖掘、自然语言处理及电子商务。提出具有重大理论突破意义的系统相似度测度理论,面向移动平台的...原创 2019-11-18 15:27:34 · 388 阅读 · 0 评论 -
python 报ImportError: Install xlrd >= 1.0.0 for Excel support错误
前言在使用tensorflow过程中会遇到各种各样的问题,在此记录一下,有助于自己回顾和后来人的学习问题描述在调用pandas遇到了这样一个问题:Traceback (most recent call last): File "D:\Anaconda\envs\dl\lib\site-packages\pandas\io\excel.py", line 391, in __init__...原创 2019-06-19 10:24:51 · 7119 阅读 · 0 评论 -
吴恩达 coursera ML 第七课总结+作业答案
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文模型引入神经网络模型表示模型表示2例子和图示例子与图示2作业答案正文本节主要讨论神经网络及其强大的功能模型引入非线性分类问题会带来超多的参数,也就是参数爆炸这一问题。一个典型的例子,计算机视觉目标识别问题。通过训练分类器,我们可以很好的确定一个像素对应的是不是汽车。神经网络神经网路的发...原创 2019-04-24 11:32:13 · 500 阅读 · 0 评论 -
吴恩达 coursera ML 第六课总结+作业答案
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文问题引入正则化正则化逻辑回归作业答案正文本节主要探讨过拟合以及如何使用l2正则化抑制过拟合问题引入在使用面积预测房价这个问题上,如何选择模型的阶数?过拟合的结局方案。直观展示解决方法对模型的影响正则化通过添加参数的正则化项,从而抑制了过拟合的现象。正则化详解。正则化的超参数是λ\...原创 2019-04-24 10:38:38 · 439 阅读 · 0 评论 -
吴恩达 coursera ML 第五课总结+作业答案
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文模型引入决策边界误差函数多分类问题作业答案正文本节学习内容主要为逻辑回归-分类。模型引入问题引入,收到一封邮件后,电脑如何自动判断将其归类为垃圾邮件,节约我们看邮件的时间。例子,根据肿瘤尺寸对癌症的良性和恶性进行分类,假设计算的值》=0.5,则认为肿瘤是恶性的。因为,我们想要0<y(...原创 2019-04-23 23:24:03 · 479 阅读 · 0 评论 -
吴恩达 coursera ML 第四课总结+作业答案
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章文章目录前言文章正文模型引入多元梯度下降技巧1 特征压缩梯度下降2:学习率多项式回归补充内容正文本节学习内容主要为多元线性回归模型引入引入问题,上次那个一元线性回归模型还是过于简略,并不符合实际情况,毕竟实际上我们买房的时候会考虑,楼层啊,地段等等之类的因素,而不是只考虑面积这一个因素。多元回归的模型,为...原创 2019-04-23 21:47:04 · 556 阅读 · 0 评论 -
吴恩达 coursera ML 第三课总结
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文矩阵和向量正文本节学习内容主要为复习线性代数矩阵和向量## 矩阵运算## 标量乘法## 矩阵乘法##矩阵相乘## 注意细节## 单位矩阵## 矩阵求逆## 矩阵转置...原创 2019-04-22 21:14:10 · 271 阅读 · 0 评论 -
吴恩达 coursera ML 第二课总结+作业答案
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文线性模型模型判断准则损失函数解析损失函数解析2梯度下降梯度下降解析应用梯度下降的线性模型术语补充编程作业ex1.mcomputeCost.mfeatureNormalize.mgradientDescent.mcomputeCostMultigradientDescentMulti.m正文本周学习...原创 2019-04-22 16:25:42 · 988 阅读 · 1 评论 -
吴恩达 coursera ML 第十五课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文基于内容的推荐协同过滤实现细节:均值归一化正文本章主要讲述推荐系统预测电影评分。基于内容的推荐通过属性以及偏好的乘积获得评分。问题形式。优化目标。优化算法协同过滤问题动机问题形式化计算流程优化目标。协同过滤协同过滤算法算法流程图向...原创 2019-06-14 11:29:37 · 239 阅读 · 0 评论 -
吴恩达 coursera ML 第十六课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文随机梯度下降小规模批量下降在线学习大数据系统正文本章主要讨论大规模数据学习数据为王根据误差曲线来判断是过拟合还是欠拟合随机梯度下降使用梯度下降实现的线性回归。比较批梯度下降以及随机梯度下降。随机梯度下降方法图示。小规模批量下降批量太大,s...原创 2019-06-14 16:30:26 · 355 阅读 · 0 评论 -
吴恩达 coursera ML 第十七课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文正文文字字符识别问题工作流程工作流水线文本检测行人检测的有监督学习。滑动窗口检测文本检测文本识别文字识别1维滑动窗口文本识别## 字符识别字符识别人工数据合成增强。人工合成数据通过扰动增强数据通过扰动增强数据。获得更多数据的方...原创 2019-06-14 17:22:28 · 215 阅读 · 0 评论 -
吴恩达 coursera AI 第一课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文神经网络初探规模驱动的神经网络正文本章主要介绍深度学习相关知识,并引入话题。AI会像电力一样革新这个世界。总计五门专项课程神经网络与机器学习提升神经网络性能结构化机器学习项目卷积神经网络自然语言处理:序列模型神经网络初探房价预测房价预测的...原创 2019-06-16 08:39:23 · 1763 阅读 · 0 评论 -
吴恩达 coursera AI 第二课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文梯度下降导数计算图逻辑回归的梯度下降正文本章主要引入典型问题,图像二值分类。图像二分类问题,是否有猫## 逻辑回归典型算法 逻辑回归,设定图象阈值,判断0-1问题。逻辑回归代价函数。梯度下降算法目标是找到最优的参数使得代价函数最小。梯度下降算法...原创 2019-06-16 11:09:02 · 403 阅读 · 0 评论 -
关于情感分析
前言选择了nlp作为自己从事的职业,开始继续提升自己的能力,今天看了一个别人总结的情感分析的帖子,特此分享给大家。目录文章目录前言目录正文一点历史Supervised LearningUnsupervised Learning有关中文关于未来正文最近关于NLP(Natural Language Processing)中情感分析的问题做了一些调研,现在记录一下有关的知识点以便总结和以后复习...转载 2019-07-04 10:48:19 · 1205 阅读 · 0 评论 -
吴恩达 coursera AI 专项四第一课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文正文深度计算机视觉计算机视觉问题大规模图像上的深度学习计算机视觉问题水平边缘检测水平边缘检测问题。水平边缘检测例子水平和垂直边缘检测学会检测边缘。边缘填充确认和同步验证。填充操作卷积的总结相关性和交叉卷积的区别RGB图像上的卷积操...原创 2019-07-28 14:31:58 · 271 阅读 · 0 评论 -
吴恩达 coursera AI 专项四第三课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文目标检测正文目标检测什么是目标定位和检测?使用定位进行分类确定 目标标签y。地标检测车辆检测例子滑动窗口检测将全连接层变成卷积层使用滑动窗口实现卷积滑动窗口的卷积实现。评估目标定位。非极大值抑制非极大值抑制例子非极大值抑制例子非极...原创 2019-08-22 08:38:12 · 195 阅读 · 0 评论 -
机器学习导论(张志华):渐近性质
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。basic conceptsa two-class problem can be assumped as a Bernoulli distributionZ‾&nbsp;&nbsp;M(z∣θ,n1+nm)\overline Z ~~ M(z|\theta,n_1+n_m)Z&...原创 2018-09-24 20:54:19 · 510 阅读 · 0 评论 -
吴恩达 coursera ML 第一课总结
前言学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文无监督学习总结正文基础材料都来自公开的课件。第一堂课主要是简短的介绍了一下机器学习的相关概念。## 序言## 机器学习定义## 机器学习分类## 监督学习例子1 通过已知的面积和房价的关系预测一套新房(已知面积)和它的售价。例子2 通过已知的肿瘤尺寸和它的良性恶性的关系预测一个新肿...原创 2019-04-22 11:18:52 · 445 阅读 · 0 评论 -
吴恩达 coursera ML 第八课总结+作业答案
前言吴恩达的课程堪称经典,有必要总结一下。学以致用,以学促用,通过笔记总结,巩固学习成果,复习新学的概念。目录文章目录前言目录正文反向传播算法前向传播过程反向传播算法图解实现技巧参数合一梯度检查参数随机初始化总结正文本节主要讨论,神经网络的误差函数。神经网络图示逻辑回归和神经网络的误差函数。反向传播算法计算误差和误差的导数(梯度)前向传播过程梯度计算的前向传播过程误差反向...原创 2019-04-25 21:25:42 · 541 阅读 · 0 评论 -
机器学习导论(张志华):核定义
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。Reproducing Kernel (2000-2010)K:x∗x−&gt;RK:x*x-&gt;RK:x∗x−>Rx⊂R2x \subset R^2x⊂R2cauchy-schwartz inequalityK2(xi,xj)≤K(xi,xj)K(x...原创 2018-09-26 21:32:59 · 362 阅读 · 0 评论 -
机器学习导论(张志华):主元分析
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。basic conceptsexp(−tz12)=∫exp(−tuz)dF(u)exp(-tz^{\frac{1}{2}}) =\int exp(-tuz) dF(u)exp(−tz21)=∫exp(−tuz)dF(u)z=∣∣x∣∣2z=||x||^2z=∣∣x∣∣2exp(...原创 2018-10-02 08:54:25 · 1138 阅读 · 0 评论 -
奇异值分解讨论及其实现的计算步骤
前言在看一个教程的发现对奇异值分解不太熟悉,因此从新搜索了相关资料,然后,总结成这个咯。一般来说,想要获得低维的子空间,最简单的是对原始的高维空间进行线性变换(当然了,非线性也是可以的,如加入核函数,比较著名的就是KPCA)。SVD和PCA呢,都实现了降维与重构,但是呢,思路不太一样,老师课上提了一次,以前看的迷迷糊糊的,这次下定决心,怎么都要搞清楚这两个概念。SVD(singular va...原创 2018-10-01 20:54:05 · 19284 阅读 · 5 评论 -
时间序列分析相关概念
1. 在时间序列分析中, 数学模型是什么?数学公式又是什么?数学推导过程又是什么?… …一句话:用数学公式后者符号来表示现实存在的意义。数学是“万金油”的科学,它是作为工作和分析方法运用到某个学科当中。比如在物理学中,数学公式或者数学符号也是表示现实存在的意义,G表示重力,再比如用什么表示分子,这些东西都是现实存在,而通过在数学层面的公式计算或者推导,就能够得到某种结果反推到现实中存在的意义是...转载 2018-10-01 20:24:18 · 3615 阅读 · 0 评论 -
机器学习导论(张志华):正定核应用
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。basic conceptsIf a function is positive definite,then matrix is P.S.D.x1,,,,xn⊂X=&gt;K0(xi,xj)=g(xi)g(xj){x_1,,,,x_n} \subset X =&g...原创 2018-09-30 20:41:36 · 500 阅读 · 0 评论 -
机器学习导论(张志华):多元高斯分布及应用
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。基本概念这件课就是在推公式了,推了半天的公式,进行矩阵化简,降低计算量重要公式(A−BD−1C)−1=A−1+A−1B(D−(A−1B)−1)A−1 (A-BD^{-1}C)^{-1}=A^{-1} +A^{-1}B(D-(A^{-1}B)^{-1})A^{-1} (A−...原创 2018-09-24 10:14:48 · 654 阅读 · 0 评论 -
MYsql:net start mysql 失败 发生系统错误5
前言安装好,mysql后遇到了这样的问题,在第二次开启的时候: 正文仔细一想是运行cmd的时候,没有开启管理者模式。 在重新运行cmd的时候,使用管理者模式,就好了。...原创 2018-06-23 21:46:32 · 393 阅读 · 0 评论 -
数据分析:JSON格式数据
前言最近使用tensorflow入门深度学习,找到了一个风格转移图片的神经网络感觉还蛮好玩风格转移,想要自己做点儿其他风格的模型,但是尴尬的发现,它需要使用MS coco数据集,下载地址为ms coco下载 学以致用,以学促用。输出检验,完整闭环。怕什么真理无穷,进一寸有一寸的欢喜——胡适 所以,总结一下学习收获,写下这篇稿子,介绍一下这个数据格式JSONJSON...原创 2018-06-01 21:52:14 · 2984 阅读 · 0 评论 -
数据分析:主成分分析(PCA)1
目录:前言主成分分析1K-L变换(卡洛南-洛伊(Karhunen-Loeve)变换):最优正交变换2pca分析前言 怕什么真理无穷,进一寸有一寸的欢喜——胡适学以致用,以学促用。最近在分析数据,发现几大分析方法,PCA,ICA,CCA,又因为光学是没用的,还要有输出检验,因此,开始写这个系列的帖子了。主成分分析之前对PCA算法有过一段...原创 2018-05-31 16:30:35 · 7635 阅读 · 0 评论 -
机器学习导论(张志华):多项式分布
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术。基本概念两个矩阵相似:两个矩阵特征值一样。两个矩阵合同:矩一样,就是个数一样。#高斯分布的特性知道μ和σ \mu 和\sigmaμ和σ就可以确定这个分布,是它的信息量。流形学习(manifold learning)学习的是空间局部点之间的关系。多项式分布The mult...原创 2018-09-23 08:59:34 · 592 阅读 · 0 评论 -
机器学习导论(张志华):核定义(2)
前言这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术basic conceptstensor productsvd decomposition is important for high dimensional matrix calculation....原创 2018-09-27 21:52:11 · 282 阅读 · 0 评论 -
机器学习:分类器介绍
目录[@TOC]一 softmax 简介计算loss时,预测值要与真实值分布在相同的数据区间内,例如真实值在[0,1]区间内,那么神经网络的预测值最好也要在相同的区间(0,1)内;这样在计算loss是才会有较好的效果。在做二分类时,可在网络的输出层使用激活函数sigmoid(),将输出压缩在(0,1)区间,softmax可看做是对sigmoid的扩展,是用于多分类的激活函数,softma...原创 2019-03-18 19:50:54 · 1740 阅读 · 0 评论 -
机器学习笔记GBDT(一):原理
目录文章目录目录前言1. GBDT概述2. GBDT的负梯度拟合3. GBDT回归算法1) 初始化弱学习器2) 对于迭代轮数t=1,2,...,T有:3) 得到强学习器f(x)的表达式:4. GBDT分类算法4.1 二元GBDT分类算法4.2 多元GBDT分类算法5. GBDT常用损失函数6. GBDT的正则化7. GBDT小结GBDT的主要优点有:GBDT的主要缺点是:问题一:Adaboost...原创 2019-03-18 16:02:44 · 1384 阅读 · 0 评论 -
自然语言处理笔记7-哈工大 关毅
目录文章目录目录前言句法分析技术1句法分析技术2句法分析技术3句法分析技术4前言硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论。自然语言处理是一个非常难的问题,同时是人工智能皇冠上的明珠。接下来会记录一系列自然语言处理的笔记,来自于哈工大老师关毅。句法分析技术1基于规则+统计结合的句法分析判定输入的词序列是否合法,短语结构树,有向无环图。句子:{主『定语,中心...原创 2019-01-13 11:02:38 · 602 阅读 · 0 评论 -
matlab 层次聚类
MATLAB的统计工具箱中的多元统计分析中提供了聚类分析的两种方法:1.层次聚类 hierarchical clustering2.k-means聚类这里用最简单的实例说明以下层次聚类原理和应用发法。层次聚类是基于距离的聚类方法,MATLAB中通过pdist、linkage、dendrogram、cluster等函数来完成。层次聚类的过程可以分这么几步:(1) 确定对象(实际上就是数据集...转载 2018-12-10 20:07:11 · 17926 阅读 · 5 评论 -
自然语言处理笔记3-哈工大 关毅
目录文章目录目录前言汉语的分词与频度统计(1)汉语词汇的特点汉语的分词与频度统计(2)汉语的分词与频度统计(3)汉语的分词与频度统计(4)汉语的分词与频度统计(5)汉语的分词与频度统计(6)汉语的分词与频度统计(7)前言硕士生涯结束,开始专心做一件自己觉得有用的工具,先做工程,后搞理论。自然语言处理是一个非常难的问题,同时是人工智能皇冠上的明珠。接下来会记录一系列自然语言处理的笔记,来自...原创 2018-12-12 21:07:14 · 710 阅读 · 0 评论