自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 高等数学——讲透求极限两大方法,夹逼法与换元法

本文始发于个人公众号:TechFlow今天的文章聊聊高等数学当中的极限,我们跳过极限定义以及一些常用极限计算的部分。我想对于一些比较常用的函数以及数列的极限,大家应该都非常熟悉。大部分比较简单的函数或者数列,我们可以很直观地看出来它们的极限。比如1n\frac{1}{n}n1​,当n趋向于无穷大的时候,1n\frac{1}{n}n1​的极限是0,再比如当n趋向于无穷大的时候,n2n^2n2...

2020-01-31 08:04:14 2436

原创 书籍推荐——一本老书,吴军老师《数学之美》

本文始发于个人公众号:TechFlow1这几天春节,因为疫情和拜年,所以文章停更了四天。但是这四天里我并没有偷懒,我利用间歇的时间读了一本久仰大名但是一直没有时间阅读的书。它就是吴军老师的著作——《数学之美》。之前早在我还在上大学的时候,就听线性代数的老师给我们推荐过这本书。但是当时并没有什么印象,也没有读书的习惯,所以当年并没有读这本书。以我现在的眼光来看,当时如果读了,也未必能够读...

2020-01-30 08:43:56 749

原创 概率统计——期望、方差与最小二乘法

本文始发于个人公众号:TechFlow今天这篇文章和大家聊聊期望和方差。期望期望这个概念我们很早就在课本里接触了,维基百科的定义是:它表示的是一个随机变量的值在每次实验当中可能出现的结果乘上结果概率的总和。换句话说,期望值衡量的是多次实验下,所有可能得到的状态的平均结果。我们举两个简单的例子,第一个例子是掷骰子。我们都知道一个骰子有6个面,分别是1,2,3,4,5,6。我们每次...

2020-01-24 16:59:25 2493 1

原创 算法浅谈——递归算法与海盗分金问题

本文始发于个人公众号:TechFlow最近看到一道很有意思的问题,分享给大家。还是老规矩,在我们聊算法问题之前,先来看一个故事。传说中,有5个海盗组成了一支无敌的海盗舰队,他们在最后一次的寻宝当中找寻到了100枚价值连城的金币。于是,很自然的,这群海盗面临分赃的问题。为了防止海盗内讧,残忍的海盗们制定了一个奇怪的规则:他们决定按照功劳大小对五个人进行编号,由编号小的海盗先提出分配方案...

2020-01-23 08:37:10 488

原创 机器学习基础——带你实战朴素贝叶斯模型文本分类

本文始发于个人公众号:TechFlow上一篇文章当中我们介绍了朴素贝叶斯模型的基本原理。朴素贝叶斯的核心本质是假设样本当中的变量服从某个分布,从而利用条件概率计算出样本属于某个类别的概率。一般来说一个样本往往会含有许多特征,这些特征之间很有可能是有相关性的。为了简化模型,朴素贝叶斯模型假设这些变量是独立的。这样我们就可以很简单地计算出样本的概率。想要回顾其中细节的同学,可以点击链接回到...

2020-01-22 08:36:12 988 1

原创 线性代数精华——从正交向量到正交矩阵

本文始发于个人公众号:TechFlow向量内积这个基本上是中学当中数学课本上的概念,两个向量的内积非常简单,我们直接看公式回顾一下:X⋅Y=∑i=1nxi∗yiX \cdot Y = \sum_{i=1}^n x_i*y_iX⋅Y=i=1∑n​xi​∗yi​这里X和Y都是n维的向量,两个向量能够计算内积的前提是两个向量的维度一样。从上面公式可以看出来,两个向量的内积就等于两个向量对应各...

2020-01-21 08:28:37 2986

原创 LeetCode10 Hard,带你实现字符串的正则匹配

本文始发于个人公众号:TechFlow这是LeetCode的第10题,题目关于字符串的正则匹配,我们先来看题目相关信息:LinkRegular Expression MatchingDifficultyHardDescriptionGiven an input string (s) and a pattern (p), implement regular expressionmat...

2020-01-20 08:33:09 186

原创 分布式初探——讲透分布式系统一致性模型

本文始发于个人公众号:TechFlow在计算机系统的领域,一致性可以说是一个高频词,可能出现的场景很多。从分布式系统到数据库的事务,都有它的身影。之前我们在介绍数据库事务的时候,谈到过事务的一致性。在数据库当中,一致性是一种目的,不是一种手段。数据库希望控制事务的原子性、隔离性和持久性来保证数据的一致性。这里的一致性更多的指的是实际和我们观念的一致。也就是说结果都在我们预期之内。而在分布式系统...

2020-01-18 09:02:18 1680

原创 概率统计——讲透最经典的三种概率分布

本文始发于个人公众号:TechFlow这一讲当中我们来探讨三种经典的概率分布,分别是伯努利分布、二项分布以及多项分布。在我们正式开始之前,我们先来明确一个概念,我们这里说的分布究竟是什么?无论是在理论还是实际的实验当中,一个事件都有可能有若干个结果。每一个结果可能出现也可能不出现,对于每个事件而言出现的可能性就是概率。而分布,就是衡量一个概率有多大。伯努利分布明确了分布的概念之后,我...

2020-01-17 07:54:32 2805

原创 算法浅谈——怎么样才最有可能选中真命天子呢?

本文始发于个人公众号:TechFlow正文开始之前,我们先来讲一个故事。在很久很久以前,有一个万人迷。她从18岁开始就有数不完的追求者,追她的男生一个个在她的窗前排起了长队。但是她挑来挑去,终究不觉得满意。终于,这个万人迷一天天长大,年老色衰,在她门口排队的男生也越来越少。她开始后悔拒绝男生时的轻率,怀念起了从前的荣光。她也不知道,最后她是会向现实妥协,选择一个看起来远不是那么好的男生共度...

2020-01-16 07:59:02 187

原创 机器学习基础——让你一文学会朴素贝叶斯模型

今天这篇文章和大家聊聊朴素贝叶斯模型,这是机器学习领域非常经典的模型之一,而且非常简单,适合初学者入门。朴素贝叶斯模型,顾名思义和贝叶斯定理肯定高度相关。之前我们在三扇门游戏的文章当中介绍过贝叶斯定理,我们先来简单回顾一下贝叶斯公式:P(A∣B)=P(A)P(B∣A)P(B)P(A|B)=\frac{P(A)P(B|A)}{P(B)}P(A∣B)=P(B)P(A)P(B∣A)​我们把P(A)...

2020-01-15 08:08:19 247

原创 线性代数精华——向量的线性相关

这一篇文章和大家聊聊向量。向量与平面向量这个概念我们在高中就接触到了,它既指一个点在空间中的坐标,也表示一个有向线段,如果我们加入复数概念的话,它还能表示一个数。在线性代数当中,向量就是指的n个有次序的数a1,a2,⋯ ,ana_1, a_2, \cdots, a_na1​,a2​,⋯,an​组成的数组。向量可以写成一行,也可以写成一列。写成一列的称为列向量,例如:a=[a1a2⋮an...

2020-01-14 08:11:16 1616 1

原创 LeetCode 6 蛇形矩阵,一道简单的模拟题

题意The string “PAYPALISHIRING” is written in a zigzag pattern on a given number of rows like this: (you may want to display this pattern in a fixed font for better legibility)https://leetcode.com/...

2020-01-13 08:00:35 464

原创 LeetCode 5 迅速判断回文串的曼切斯特算法

题意Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.Link: https://leetcode.com/problems/longest-palindromic-substring/翻译给定一个字符串s,...

2020-01-12 10:07:32 253

原创 分布式系统为什么CAP无法同时达到?

从前有一户夫妻,他们生了两个孩子。已知其中一个是女孩,那么另一个孩子也是女孩的概率是多少呢?这是一道概率论课本上的经典问题,一开始的时候,很多人会觉得两个孩子的性别是独立事件,我们知道其中一个孩子的性别,应该对另一个孩子没有影响。但实际上并不是这样,我们可以列出两个孩子性别的所有可能:孩子1孩子2男女男男女女女男从上面这个表格里,我们可以看出...

2020-01-10 08:04:02 700

原创 算法浅谈——怪盗基德的珠宝选择问题与贪心算法

本文始发于个人公众号:TechFlow1在开始今天的文章之前,我们先来讲一个故事:在一个月黑风高的夜晚,怪盗基德潜入了一个著名的珠宝会馆。他面前有三个装着珠宝的柜子,这三个规则分别是A、B和C。每个柜子里装了一个珠宝,这三个珠宝的体积分别是6,5,5,价值分别是10,5, 6。基德每次只能打开一个柜子,他需要将偷出来的珠宝放进随身携带的包里。他的包的体积是10,那么请问,基德应该采取什么策...

2020-01-09 08:34:09 254

原创 机器学习基础——倒排索引与搜索引擎

今天的文章,我们继续探讨搜索引擎,和大家聊聊搜索引擎最重要的一环——倒排索引。在介绍倒排索引之前,我们先来看看什么是索引。索引是数据库当中的概念,维基百科中的说法是“数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据”。可以简单地把索引当成是字典里的检索目录,我们比如我们要查一个叫“index”的单词,通过目录,可以快速地找到字母i开始的位置。索引也是一样,不过...

2020-01-08 08:28:13 301

原创 线性代数精华——讲透矩阵的初等变换与矩阵的秩

本文始发于公众号:TechFlow矩阵的初等变换这个概念可能在很多人听来有些陌生,但其实我们早在初中的解多元方程组的时候就用过它。只不过在课本当中,这种方法叫做消元法。我们先来看一个课本里的例子:{2x1−x2−x3+x4=2,(1)x1+x2−2x3+x4=4,(2)4x1−6x2+2x3−2x4=4,(3)3x1+6x2−9x3+7x4=9.(4)\begin{cases}2x_1-x...

2020-01-07 08:16:31 1440

原创 LeetCode3 一题学会尺取算法

本文始发于个人公众号:TechFlow今天和大家聊的问题叫做最长不重复子串,这道题很有意思,我们先来看题面:Given a string, find the length of the longest substring without repeating characters.翻译题目只有一句话:给定一个字符串,要求返回不包含重复字符的最长子串的长度。样例Example...

2020-01-05 09:32:55 306

原创 一文讲透数据库事务的四原则

说到数据库,以前我老师有一句很经典的话。你可以不会写SQL,但是一定不能不知道ACID。在工业领域,SQL可以说是应用最广泛的技术。从后端到算法,从数据到DBA,再到产品,甚至连一些运营也会基本的SQL。所以如果你现在还不太会的话,我建议你用一个下午的时间找个网站好好学一下。原本我是想直接写些Hbase相关的内容,但是我发现要想讲清楚Hbase,必须要讲noSQL数据库。如果将noSQL,则又...

2020-01-04 08:28:59 810

原创 概率统计——三扇门游戏与贝叶斯定理

本文首发于公众号:TechFlow在概率论的课本上有一个经典的问题,一直困扰我很久。有很多次我以为我想明白了,过了一段时间却又会糊涂。这个问题学过概率论的同学想必都知道,就是著名的三扇门问题。说是之前在美国有一个著名的综艺节目,这个节目里有三扇关闭着的门。其中有两扇的后面是山羊,有一扇则放着一辆豪车。主持人会让嘉宾做出选择,嘉宾做出选择之后,主持人会打开其中错误的一扇门,询问嘉宾:伙计,你有一...

2020-01-03 08:29:44 3839 2

原创 算法浅谈——一文讲透三分算法

本文始发于个人公众号:TechFlow之前的文章当中我们详细阐述了二分法,尤其是讨论了我们在编写代码时候的边界问题。传送门:算法浅谈——人人皆知却很多人写不对的二分法今天这一篇文章,我们继续来讲算法,我们不讲二分法了。来讲讲二分法的进阶版——三分法。是的,你们没有看错,这不是我任性起的名字,而是实实在在的有这个算法。不过如果去搜索引擎里搜,大概率会搜到摄影的三分构图法,而很难搜索三分查找的...

2020-01-02 08:17:01 848

原创 机器学习基础——一文讲懂中文分词算法

在前文当中,我们介绍了搜索引擎的大致原理。有错过或者不熟悉的同学,可以点击下方的链接回顾一下前文的内容。ML基础——搜索引擎基本原理在介绍爬虫部分的时候,我们知道,爬虫在爬取到网页的内容之后,会先进行一些处理。首先要做的就是过滤掉HTML当中的各种标签信息,只保留最原生的网页内容。之后,程序会对这些文本内容提取关键词。今天我们就来讲讲关键词提取当中最重要的一个部分——中文分词。在世界上众...

2020-01-01 08:56:35 1405

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除