2017年09月_我是8位的

12月 11月 10月 09月

原创数学笔记10——拉格朗日中值定理

拉格朗日中值定理又称拉氏定理，是微分学中的基本定理之一，它反映了可导函数在闭区间上的整体的平均变化率与区间内某点的局部变化率的关系。

2017-09-26 18:01:41 17616

原创数学笔记9——牛顿迭代法

　　牛顿迭代法（Newton's method）又称为牛顿-拉夫逊（拉弗森）方法（Newton-Raphson method），它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。示例1：求解平方根　　先来看如何用牛顿迭代法求解5的平方根。在计算器上的结果是2.236067…　　问题可以看作解方程x2=5，下面尝试用牛顿迭代法求解。　　首先令f(x)= x2 – 5 ...

2017-09-25 18:22:21 62698 4

原创数学笔记8——最值问题

寻找最值　　在上篇文章曲线构图中，我们可以非常容易地从图上找到函数的最值点。想要求得一个函数的最值点，自然会联想到通过构图寻找，但是构图并不是一个轻松的过程。观察最值点在函数曲线上的位置，可以得出结论：最值点可能存在于临界点、无限远端或驻点。因此仅需要知道这几个点便可以知道函数的最值点。正方形的最大面积之和　　很多情况下最值问题会以文字叙述的形式出现，下面是一个典型的例子：

2017-09-20 18:23:56 3195

原创数学笔记7——曲线构图

本文介绍了曲线构图相关的基本概念，包括函数的凹凸性、极值点、驻点、拐点等信息，展示如何根据这些信息构图

2017-09-19 15:41:58 2054 1

首先回顾一下《变身博士》中著名的精神病，他的发病起因大抵可归结为一条——人格分裂。再来思考一下自己是否有分裂的迹象，当然，我没有，至少我不会当众承认。然而澄清的世界在互联网面前改变了，任何人都可以申请N个不同的帐号来扮演不同的角色，这不是人格分裂又是什么？既然计算机只认得0和1，它就不会在乎你的长相，你是否是个变异的澳大利亚袋鼠，更不会在乎你是财务部发票管理员还是分公司发票管理员，但是，我们是否有

2017-09-14 11:38:52 622 1

原创数学笔记6——线性近似和二阶近似

线性近似　　假设一般函数上存在点(x0, f(x0))，当x接近基点x0时，可以使用函数在x0点的切线作为函数的近似线。函数f(x)≈f(x0)+f'(x0)(x- x0)即称为函数f在x0点的线性近似或切线近似。f(x) ≈ f(x0) + f'(x0)(x- x0)公式来源几何意义　　线性近似求解的是近似值，其几何意义是在基点的切线近似于原函数的

2017-09-12 11:38:22 17809 3

原创经历与经验

我知道一个简单的恶作剧：如果你在网上看到一篇令你不爽的文章，或者仅仅因为字体不是你习惯的“宋体小四”，你都可以对这个站点的Internet服务供应商进行投诉，说根据DMCA协议，这篇文章侵犯了你的版权，其作者未经允许擅自引用了你小学时的一篇作文——你不必知道DMCA和蛋黄派有什么区别——然后等着瞧吧，不久之后这篇文章就会下架。难道他们在下撤销令之前不会调查吗？不会，没有人有...

2017-09-08 11:19:47 514

原创西子湖畔

当年的《新白娘子传奇》红透了半边天，我在心中多次勾勒“春雨如酒柳如烟”的画面，泛舟西湖，品尝美酒佳肴，沉醉在群山碧水之中……这些美丽的风景是革命先烈用生命换来了，我要好好学习，加入到社会主义建设的大潮中，为早日实现四个现代化做出自己的贡献！我上小学时写的作文，其结尾必定喊一下口号以提升高度，但是直到初中我才知道什么是四个现代化，那时候我已经不喊口号了，响应了老师的号召：“为自己而读书”。

2017-09-08 11:18:24 613

原创梦回长安

我曾无数次梦见深埋地下的秦俑，楚汉争霸的往事，昭君出塞的老路，丝绸之路的传奇，充满韵味的唐风……终于，我来到了梦想之地——古都西安！西安古名长安，乃长久安宁之意，可惜几千年来中华大地分分合合，几经战火，又怎能长久安宁？即使今天，中国仍没有完全统一。历代君王为巩固江山在这里高筑城墙，但厚实的城墙并没有让帝国永存，今天，这些遗址成为西安的景点，让人们凭吊历史的兴衰。我有幸来到临潼，

2017-09-08 11:17:10 430

原创酒罢问君三语

你为什么要开发Erlang？ Armstrong博士：纯属巧合。我本来没打算发明一门新的编程语言。当时，我想找一种更好的方式来编写电信交换控制软件。我先试了试Prolog。Prolog是一门绝妙的语言，但它无法完全满足我的需要，既然如此，我就开始瞎倒腾Prolog。我琢磨着：“如果改变一下Prolog的编程方式，那会怎样？”于是，我写了个Prolog的元解释器，给它加上了并行进程，还加上了

2017-09-08 11:16:21 597

原创后缀表达式

我经常不厌其烦地向开发人员强调数据结构的重要性，也经常和团队分享一些常见算法。也许是大家写惯了业务代码，往往对数据结构的知识并不太在意。可不是嘛，只需要玩转QUID就能解决90%以上的问题，还费脑细胞学习基础知识干什么？当然，所有人都会回答“基础知识很重要，数据结构很重要”。然而，当你发现工作几年的开发人员甚至不知道Array和List的区别时，也许会觉得他们当初是在说谎。这是真的，我发现大部分人

2017-09-08 11:12:50 635

原创数学笔记——导数5（指数函数和对数函数的导数）

指数函数的性质　　先来复习一下中学的课程：指数函数的导数　　对f(x) = ax求导：　　ax右侧的那个极限似乎没有办法继续简化了，如果这个极限看作关于a的函数（之所以将极限看作关于a的函数，是因为在这个极限中，a是未知的，Δx是已知的）：　　函数在某一点导数的几何意义是该点处切线的斜率，所以M(a)也就是ax在x=0处切线的斜率。　　如果y=2x，...

2017-09-08 11:08:55 80291 2

原创数学笔记——导数4（反函数的导数）

什么是反函数　　一般地，设函数y=f(x)(x∈A)的值域是C，若找得到一个函数g(y)在每一处g(y)都等于x，这样的函数x= g(y)(y∈C)叫做函数y=f(x)(x∈A)的反函数，记作y=f-1(x) 。反函数y=f-1(x)的定义域、值域分别是函数y=f(x)的值域、定义域。最具有代表性的反函数就是对数函数与指数函数。　　例1：y=2x-1的反函数是y=0.5x+0.5

2017-09-08 11:07:52 22562 1

原创数学笔记——导数3（隐函数的导数）

幂函数的扩展形式　　f(x) = xn的导数：f’(x) = nxn-1，n是整数，该公式对f(x) = xm/n, m,n 是整数同样适用。　　推导过程：什么是隐函数　　引自知乎：　　“如果方程F(x,y)=0能确定y是x的函数，那么称这种方式表示的函数是隐函数。　　“本质上F(x,y)=0函数y=f(x)是一样的，但是在数学理论中，总有一

2017-09-08 11:06:19 11488

原创数学笔记——导数2(求导法则和高阶导数)

和、差、积、商求导法则　　设u=u(x),v=v(x)都可导，则：(Cu)’ = Cu’, C是常数 (u ± v)’ = u’ ± v’ (uv)’ = u’v + uv’ (u/v)’ = (u’v – uv’) / v2　　1、2不解释，下面给出3、4的推导过程乘法法则的推导过程　　乘法法则可扩展：除法法则的推导过程示例1：f'(1/x)...

2017-09-08 11:05:08 35063

原创数学笔记——导数1(导数的基本概念)

什么是导数　　导数是高数中的重要概念，被应用于多种学科。　　从物理意义上讲，导数就是求解变化率的问题；从几何意义上讲，导数就是求函数在某一点上的切线的斜率。　　我们熟知的速度公式：v = s/t，这求解的是平均速度，实际上往往需要知道瞬时速度：　　当t趋近于t0，即t-t0趋近于0时，得到的就是顺时速度。设Δt=t-t0，s是t的函数s=f(t)，瞬时速度用

2017-09-08 11:03:58 15633 4

原创 FP-growth算法发现频繁项集（二）——发现频繁项集

上篇介绍了如何构建FP树，FP树的每条路径都满足最小支持度，我们需要做的是在一条路径上寻找到更多的关联关系。抽取条件模式基　　首先从FP树头指针表中的单个频繁元素项开始。对于每一个元素项，获得其对应的条件模式基（conditional pattern base)，单个元素项的条件模式基也就是元素项的关键字。条件模式基是以所查找元素项为结尾的路径集合。每一条路径其实都是一条前辍路径（

2017-09-08 11:01:03 901

原创 FP-growth算法发现频繁项集（一）——构建FP树

常见的挖掘频繁项集算法有两类，一类是Apriori算法，另一类是FP-growth。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集，需要多次扫描原始数据，当原始数据较大时，磁盘I/O次数太多，效率比较低下。FPGrowth不同于Apriori的“试探”策略，算法只需扫描原始数据两遍，通过FP-tree数据结构对原始数据进行压缩，效率较高。

2017-09-08 10:56:15 1278

原创使用Apriori进行关联分析（二）

书接上文（使用Apriori进行关联分析（一）），介绍如何挖掘关联规则。发现关联规则　　我们的目标是通过频繁项集挖掘到隐藏的关联规则。　　所谓关联规则，指通过某个元素集推导出另一个元素集。比如有一个频繁项集{底板,胶皮,胶水}，那么一个可能的关联规则是{底板,胶皮}→{胶水}，即如果客户购买了底板和胶皮，则该客户有较大概率购买胶水。这个频繁项集可以推导出6个关联规则：

2017-09-08 10:51:40 707

原创使用Apriori进行关联分析（一）

大型超市有海量交易数据，我们可以通过聚类算法寻找购买相似物品的人群，从而为特定人群提供更具个性化的服务。但是对于超市来讲，更有价值的是如何找出商品的隐藏关联，从而打包促销，以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系？当然可以使用穷举法，但代价高昂，所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。

2017-09-08 10:48:24 718

原创 k最邻近算法——加权kNN

加权kNN　　上篇文章中提到为每个点的距离增加一个权重，使得距离近的点可以得到更大的权重，在此描述如何加权。反函数　　该方法最简单的形式是返回距离的倒数，比如距离d，权重1/d。有时候，完全一样或非常接近的商品权重会很大甚至无穷大。基于这样的原因，在距离求倒数时，在距离上加一个常量：　　weight = 1 / (distance + const)　　这种方

2017-09-08 10:45:46 3506

原创 k最邻近算法——使用kNN进行手写识别

上篇文章中提到了使用pillow对手写文字进行预处理，本文介绍如何使用kNN算法对文字进行识别。基本概念　　k最邻近算法（k-Nearest Neighbor, KNN），是机器学习分类算法中最简单的一类。假设一个样本空间被分为几类，然后给定一个待分类的特征数据，通过计算距离该数据的最近的k个样本来判断这个数据属于哪一类。如果距离待分类属性最近的k个类大多数都属于某一个特定的类，那

2017-09-08 10:42:40 710

原创图像识别的前期工作——使用pillow进行图像处理

pillow是个很好用的python图像处理库，可以到官方网站下载最新的文件。如果官网的任何PIL版本都不能与自己的python版本对应，或安装成功后发现运行出错，可以尝试从一个非官方的whl网站下载：http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy 这个网站的内容相当丰富，而且版本齐全。打开图片from PIL import

2017-09-08 10:27:27 1196

原创朴素贝叶斯

朴素贝叶斯分类是基于贝叶斯概率的思想，假设属性之间相互独立，求得各特征的概率，最后取较大的一个作为预测结果（为了消弱罕见特征对最终结果的影响，通常会为概率加入权重，在比较时加入阈值）。朴素贝叶斯是较为简单的一种分类器。　　属性独立性：事件B的发生不对事件A的发生造成影响，这样的两个事件叫做相互独立事件。然而其属性独立性假设在现实世界中多数不能成立，例如： “spring”的后面更有可能跟着

2017-09-08 10:24:11 785

原创集成学习之AdaBoost

当做出重要决定时，大家可能会考虑吸取多个专家而不只是一个人的意见，机器学习也是如此，这就是集成学习的基本思想。使用集成方法时有多种形式：可以是不同算法的集成，也可以是同一算法在不同设置下的集成，还可以是数据集不同部分分配给不同分类器之后的集成。　　由于集成学习有效地考虑了多个不同的模型，一般而言能够获得较好的性能，因此在很多注重算法性能的场合，集成学习一般是首选。例如，在很多数据挖掘的竞赛

2017-09-08 10:06:42 925

原创隐马尔可夫模型（一）

隐马尔可夫模型（Hidden Markov Model，HMM）是一种统计模型，广泛应用在语音识别，词性自动标注，音字转换，概率文法等各个自然语言处理等应用领域。经过长期发展，尤其是在语音识别中的成功应用，使它成为一种通用的统计工具。

2017-09-08 09:49:19 1453

Python数据可视化编程实战pdf_ 颛清山译

本书是一本使用Python实现数据可视化编程的实战指南，介绍了如何使用Python最流行的库，通过60余种方法创建美观的数据可视化效果。全书共8章，分别介绍了准备工作环境、了解数据、绘制并定制化图表、学习更多图表和定制化、创建3D可视化图表、用图像和地图绘制图表、使用正确的图表理解数据以及更多matplotlib知识。本书适合那些对Python编程有一定基础的开发人员，可以帮助读者从头开始了解数据、数据格式、数据可视化，并学会使用Python可视化数据。

2018-04-04

数学之美.pdf

吴军博士，毕业于清华大学（本科、硕士）和美国约翰·霍普金斯大学（博士）。在清华大学和约翰·霍普金斯大学期间，吴军博士致力于语音识别、自然语言处理，特别是统计语言模型的研究。他曾获得1995年全国人机语音智能接口会议的最佳论文奖和2000年Eurospeech的最佳论文奖。曾任腾讯公司主管搜索、在线广告和云计算基础架构的副总裁，在加入腾讯之前，在谷歌工作，2013年离开腾讯，回到谷歌。

2017-09-21

统计学习方法-李航 pdf

《统计学习方法》是计算机及其应用领域的一门重要的学科。《统计学习方法》全面系统地介绍了统计学习的主要方法，特别是监督学习方法，包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外，每章介绍一种方法。叙述从具体问题或实例入手，由浅入深，阐明思路，给出必要的数学推导，便于读者掌握统计学习方法的实质，学会运用。为满足读者进一步学习的需要，书中还介绍了一些相关研究，给出了少量习题，列出了主要参考文献。

2017-09-21

Erlang OTP并发编程实战-中文版 pdf

《Erlang/OTP并发编程实战》主要分为三大部分：第一部分讲解Erlang编程及OTP基础；第二部分讲解如何在实际开发中逐一添加OTP高级特性，从而完善应用，作者通过贯穿本书的主项目——加速Web访问的分布式缓存应用，深入浅出地阐明了实践中的各种技巧；第三部分讨论如何将代码与其他系统和用户集成，以及如何进行性能调优。

2017-09-19

Go语言圣经高清 pdf

Kernighan合作编写。Go语言被誉为21世纪的C语言,如果说K&R所著的《The C Programming Language》是圣经的旧约,那么D&K所著的这本书必将成为圣经的新约。

2017-09-15

机器学习实战（中文+高清英文+源码）pdf

机器学习是人工智能研究领域中的一个极其重要的方向。在现今大数据时代的背景下捕获数据并从中萃取有价值的信息或模式使得这一过去为分析师与数学家所专属的研究领域越来越为人们瞩目。本书通过精心排的实例切入日常工作任务摒弃学术化语言利用高效可复用的Python 代码阐释如何处理统计数据进行数据分析及可视化。读者可从中学到一些核心的机器学习算法并将其运用于某些策略性任务中如分类、预测及推荐等。本书适合机器学习相关研究人员及互联网从业人员学习参考。

2017-09-13

struts2权威指南pdf

《Struts2权威指南:基于WebWork核心的MVC开发》介绍的Struts 2已经完全超出了Struts 1框架原有的高度，Struts 2建立在Struts 1和WebWork两个框架整合的基础之上，因此提供了更多优秀的机制。虽然Struts 1目前还未被完全淘汰，但Struts 1所表现出来的缺陷已经处处制约着开发者的手脚。在2007年上半年，Struts 2终于在众多开发者期盼中，发布了第一个稳定版本：2.0.6。为了让众多Struts学习、工作者快速掌握Struts 2的开发，笔者精心编著了本书。本书按Struts 2的架构体系，细致地介绍了Struts 2各个知识点。在介绍过程中，笔者依照读者的学习规律，首先介绍基本概念和基本操作，然后对内容进行深入讲解。笔者在介绍Struts 2框架时，既照顾到Struts 2初学者的能力，对每个知识点都给出简单的快速上手的示例；同时也考虑到开发者在日后开发中可能遇到的问题，详细讲解了每个知识点的各种用法，本书覆盖到Struts 2近80%的API。因此，本书完全可以作为Struts 2框架的权威手册，以供开发者在实际开发过程中参考。

2017-09-13

java并发编程实战pdf及源码

《Java并发编程实战》深入浅出地介绍了Java线程和并发，是一本完美的Java并发参考手册。书中从并发性和线程安全性的基本概念出发，介绍了如何使用类库提供的基本并发构建块，用于避免并发危险、构造线程安全的类及验证线程安全的规则，如何将小的线程安全类组合成更大的线程安全类，如何利用线程来提高并发应用程序的吞吐量，如何识别可并行执行的任务，如何提高单线程子系统的响应性，如何确保并发程序执行预期任务，如何提高并发代码的性能和可伸缩性等内容，最后介绍了一些高级主题，如显式锁、原子变量、非阻塞算法以及如何开发自定义的同步工具类。

2017-09-12

Python网络数据采集 ([美] 米切尔) 中文pdf

Python网络数据采集采用简洁强大的Python语言，介绍了网络数据采集，并为采集新式网络中的各种数据类型提供了全面的指导。第1部分重点介绍网络数据采集的基本原理：如何用Python从网络服务器请求信息，如何对服务器的响应进行基本处理，以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站，自动化处理，以及如何通过更多的方式接入网络。