- 博客(26)
- 资源 (14)
- 收藏
- 关注
原创 数学笔记10——拉格朗日中值定理
拉格朗日中值定理又称拉氏定理,是微分学中的基本定理之一,它反映了可导函数在闭区间上的整体的平均变化率与区间内某点的局部变化率的关系。
2017-09-26 18:01:41 17616
原创 数学笔记9——牛顿迭代法
牛顿迭代法(Newton's method)又称为牛顿-拉夫逊(拉弗森)方法(Newton-Raphson method),它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。示例1:求解平方根 先来看如何用牛顿迭代法求解5的平方根。在计算器上的结果是2.236067… 问题可以看作解方程x2=5,下面尝试用牛顿迭代法求解。 首先令f(x)= x2 – 5 ...
2017-09-25 18:22:21 62698 4
原创 数学笔记8——最值问题
寻找最值 在上篇文章曲线构图中,我们可以非常容易地从图上找到函数的最值点。想要求得一个函数的最值点,自然会联想到通过构图寻找,但是构图并不是一个轻松的过程。观察最值点在函数曲线上的位置,可以得出结论:最值点可能存在于临界点、无限远端或驻点。因此仅需要知道这几个点便可以知道函数的最值点。正方形的最大面积之和 很多情况下最值问题会以文字叙述的形式出现,下面是一个典型的例子:
2017-09-20 18:23:56 3195
原创 软件的社交能力
首先回顾一下《变身博士》中著名的精神病,他的发病起因大抵可归结为一条——人格分裂。再来思考一下自己是否有分裂的迹象,当然,我没有,至少我不会当众承认。然而澄清的世界在互联网面前改变了,任何人都可以申请N个不同的帐号来扮演不同的角色,这不是人格分裂又是什么?既然计算机只认得0和1,它就不会在乎你的长相,你是否是个变异的澳大利亚袋鼠,更不会在乎你是财务部发票管理员还是分公司发票管理员,但是,我们是否有
2017-09-14 11:38:52 622 1
原创 数学笔记6——线性近似和二阶近似
线性近似 假设一般函数上存在点(x0, f(x0)),当x接近基点x0时,可以使用函数在x0点的切线作为函数的近似线。函数f(x)≈f(x0)+f'(x0)(x- x0)即称为函数f在x0点的线性近似或切线近似。f(x) ≈ f(x0) + f'(x0)(x- x0)公式来源几何意义 线性近似求解的是近似值,其几何意义是在基点的切线近似于原函数的
2017-09-12 11:38:22 17809 3
原创 经历与经验
我知道一个简单的恶作剧:如果你在网上看到一篇令你不爽的文章,或者仅仅因为字体不是你习惯的“宋体小四”,你都可以对这个站点的Internet服务供应商进行投诉,说根据DMCA协议,这篇文章侵犯了你的版权,其作者未经允许擅自引用了你小学时的一篇作文——你不必知道DMCA和蛋黄派有什么区别——然后等着瞧吧,不久之后这篇文章就会下架。难道他们在下撤销令之前不会调查吗?不会,没有人有...
2017-09-08 11:19:47 514
原创 西子湖畔
当年的《新白娘子传奇》红透了半边天,我在心中多次勾勒“春雨如酒柳如烟”的画面,泛舟西湖,品尝美酒佳肴,沉醉在群山碧水之中……这些美丽的风景是革命先烈用生命换来了,我要好好学习,加入到社会主义建设的大潮中,为早日实现四个现代化做出自己的贡献! 我上小学时写的作文,其结尾必定喊一下口号以提升高度,但是直到初中我才知道什么是四个现代化,那时候我已经不喊口号了,响应了老师的号召:“为自己而读书”。
2017-09-08 11:18:24 613
原创 梦回长安
我曾无数次梦见深埋地下的秦俑,楚汉争霸的往事,昭君出塞的老路,丝绸之路的传奇,充满韵味的唐风……终于,我来到了梦想之地——古都西安! 西安古名长安,乃长久安宁之意,可惜几千年来中华大地分分合合,几经战火,又怎能长久安宁?即使今天,中国仍没有完全统一。历代君王为巩固江山在这里高筑城墙,但厚实的城墙并没有让帝国永存,今天,这些遗址成为西安的景点,让人们凭吊历史的兴衰。 我有幸来到临潼,
2017-09-08 11:17:10 430
原创 酒罢问君三语
你为什么要开发Erlang? Armstrong博士:纯属巧合。我本来没打算发明一门新的编程语言。当时,我想找一种更好的方式来编写电信交换控制软件。我先试了试Prolog。Prolog是一门绝妙的语言,但它无法完全满足我的需要,既然如此,我就开始瞎倒腾Prolog。我琢磨着:“如果改变一下Prolog的编程方式,那会怎样?”于是,我写了个Prolog的元解释器,给它加上了并行进程,还加上了
2017-09-08 11:16:21 597
原创 后缀表达式
我经常不厌其烦地向开发人员强调数据结构的重要性,也经常和团队分享一些常见算法。也许是大家写惯了业务代码,往往对数据结构的知识并不太在意。可不是嘛,只需要玩转QUID就能解决90%以上的问题,还费脑细胞学习基础知识干什么?当然,所有人都会回答“基础知识很重要,数据结构很重要”。然而,当你发现工作几年的开发人员甚至不知道Array和List的区别时,也许会觉得他们当初是在说谎。这是真的,我发现大部分人
2017-09-08 11:12:50 635
原创 数学笔记——导数5(指数函数和对数函数的导数)
指数函数的性质 先来复习一下中学的课程:指数函数的导数 对f(x) = ax求导: ax右侧的那个极限似乎没有办法继续简化了,如果这个极限看作关于a的函数(之所以将极限看作关于a的函数,是因为在这个极限中,a是未知的,Δx是已知的): 函数在某一点导数的几何意义是该点处切线的斜率,所以M(a)也就是ax在x=0处切线的斜率。 如果y=2x,...
2017-09-08 11:08:55 80291 2
原创 数学笔记——导数4(反函数的导数)
什么是反函数 一般地,设函数y=f(x)(x∈A)的值域是C,若找得到一个函数g(y)在每一处g(y)都等于x,这样的函数x= g(y)(y∈C)叫做函数y=f(x)(x∈A)的反函数,记作y=f-1(x) 。反函数y=f-1(x)的定义域、值域分别是函数y=f(x)的值域、定义域。最具有代表性的反函数就是对数函数与指数函数。 例1:y=2x-1的反函数是y=0.5x+0.5
2017-09-08 11:07:52 22562 1
原创 数学笔记——导数3(隐函数的导数)
幂函数的扩展形式 f(x) = xn的导数:f’(x) = nxn-1,n是整数,该公式对f(x) = xm/n, m,n 是整数同样适用。 推导过程:什么是隐函数 引自知乎: “如果方程F(x,y)=0能确定y是x的函数,那么称这种方式表示的函数是隐函数。 “本质上F(x,y)=0函数y=f(x)是一样的,但是在数学理论中,总有一
2017-09-08 11:06:19 11488
原创 数学笔记——导数2(求导法则和高阶导数)
和、差、积、商求导法则 设u=u(x),v=v(x)都可导,则:(Cu)’ = Cu’, C是常数 (u ± v)’ = u’ ± v’ (uv)’ = u’v + uv’ (u/v)’ = (u’v – uv’) / v2 1、2不解释,下面给出3、4的推导过程乘法法则的推导过程 乘法法则可扩展:除法法则的推导过程示例1:f'(1/x)...
2017-09-08 11:05:08 35063
原创 数学笔记——导数1(导数的基本概念)
什么是导数 导数是高数中的重要概念,被应用于多种学科。 从物理意义上讲,导数就是求解变化率的问题;从几何意义上讲,导数就是求函数在某一点上的切线的斜率。 我们熟知的速度公式:v = s/t,这求解的是平均速度,实际上往往需要知道瞬时速度: 当t趋近于t0,即t-t0趋近于0时,得到的就是顺时速度。设Δt=t-t0,s是t的函数s=f(t),瞬时速度用
2017-09-08 11:03:58 15633 4
原创 FP-growth算法发现频繁项集(二)——发现频繁项集
上篇介绍了如何构建FP树,FP树的每条路径都满足最小支持度,我们需要做的是在一条路径上寻找到更多的关联关系。抽取条件模式基 首先从FP树头指针表中的单个频繁元素项开始。对于每一个元素项,获得其对应的条件模式基(conditional pattern base),单个元素项的条件模式基也就是元素项的关键字。条件模式基是以所查找元素项为结尾的路径集合。每一条路径其实都是一条前辍路径(
2017-09-08 11:01:03 901
原创 FP-growth算法发现频繁项集(一)——构建FP树
常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FP-growth。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数太多,效率比较低下。FPGrowth不同于Apriori的“试探”策略,算法只需扫描原始数据两遍,通过FP-tree数据结构对原始数据进行压缩,效率较高。
2017-09-08 10:56:15 1278
原创 使用Apriori进行关联分析(二)
书接上文(使用Apriori进行关联分析(一)),介绍如何挖掘关联规则。发现关联规则 我们的目标是通过频繁项集挖掘到隐藏的关联规则。 所谓关联规则,指通过某个元素集推导出另一个元素集。比如有一个频繁项集{底板,胶皮,胶水},那么一个可能的关联规则是{底板,胶皮}→{胶水},即如果客户购买了底板和胶皮,则该客户有较大概率购买胶水。这个频繁项集可以推导出6个关联规则:
2017-09-08 10:51:40 707
原创 使用Apriori进行关联分析(一)
大型超市有海量交易数据,我们可以通过聚类算法寻找购买相似物品的人群,从而为特定人群提供更具个性化的服务。但是对于超市来讲,更有价值的是如何找出商品的隐藏关联,从而打包促销,以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系?当然可以使用穷举法,但代价高昂,所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。
2017-09-08 10:48:24 718
原创 k最邻近算法——加权kNN
加权kNN 上篇文章中提到为每个点的距离增加一个权重,使得距离近的点可以得到更大的权重,在此描述如何加权。反函数 该方法最简单的形式是返回距离的倒数,比如距离d,权重1/d。有时候,完全一样或非常接近的商品权重会很大甚至无穷大。基于这样的原因,在距离求倒数时,在距离上加一个常量: weight = 1 / (distance + const) 这种方
2017-09-08 10:45:46 3506
原创 k最邻近算法——使用kNN进行手写识别
上篇文章中提到了使用pillow对手写文字进行预处理,本文介绍如何使用kNN算法对文字进行识别。基本概念 k最邻近算法(k-Nearest Neighbor, KNN),是机器学习分类算法中最简单的一类。假设一个样本空间被分为几类,然后给定一个待分类的特征数据,通过计算距离该数据的最近的k个样本来判断这个数据属于哪一类。如果距离待分类属性最近的k个类大多数都属于某一个特定的类,那
2017-09-08 10:42:40 710
原创 图像识别的前期工作——使用pillow进行图像处理
pillow是个很好用的python图像处理库,可以到官方网站下载最新的文件。如果官网的任何PIL版本都不能与自己的python版本对应,或安装成功后发现运行出错,可以尝试从一个非官方的whl网站下载:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy 这个网站的内容相当丰富,而且版本齐全。打开图片from PIL import
2017-09-08 10:27:27 1196
原创 朴素贝叶斯
朴素贝叶斯分类是基于贝叶斯概率的思想,假设属性之间相互独立,求得各特征的概率,最后取较大的一个作为预测结果(为了消弱罕见特征对最终结果的影响,通常会为概率加入权重,在比较时加入阈值)。朴素贝叶斯是较为简单的一种分类器。 属性独立性:事件B的发生不对事件A的发生造成影响,这样的两个事件叫做相互独立事件。然而其属性独立性假设在现实世界中多数不能成立,例如: “spring”的后面更有可能跟着
2017-09-08 10:24:11 785
原创 集成学习之AdaBoost
当做出重要决定时,大家可能会考虑吸取多个专家而不只是一个人的意见,机器学习也是如此,这就是集成学习的基本思想。使用集成方法时有多种形式:可以是不同算法的集成,也可以是同一算法在不同设置下的集成,还可以是数据集不同部分分配给不同分类器之后的集成。 由于集成学习有效地考虑了多个不同的模型,一般而言能够获得较好的性能,因此在很多注重算法性能的场合,集成学习一般是首选。例如,在很多数据挖掘的竞赛
2017-09-08 10:06:42 925
原创 隐马尔可夫模型(一)
隐马尔可夫模型(Hidden Markov Model,HMM)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的统计工具。
2017-09-08 09:49:19 1453
Python数据可视化编程实战pdf_ 颛清山译
2018-04-04
数学之美.pdf
2017-09-21
统计学习方法-李航 pdf
2017-09-21
Erlang OTP并发编程实战-中文版 pdf
2017-09-19
Go语言圣经 高清 pdf
2017-09-15
机器学习实战(中文+高清英文+源码)pdf
2017-09-13
struts2权威指南pdf
2017-09-13
java并发编程实战pdf及源码
2017-09-12
Python网络数据采集 ([美] 米切尔) 中文pdf
2017-09-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人