算法
文章平均质量分 57
数据结构算法 和 机器学习算法
Linky1990
这个作者很懒,什么都没留下…
展开
-
归并排序时间复杂度为什么是NlgN
归并排序算法设置归并排序所化时间为 T(N)T(N)T(N),其中 NNN 为输入数据长度1、当 n == 1 时,返回,时间复杂度 1112、排序好左边 N2\frac{N}{2}2N 个元素,时间复杂度 T(N/2)T(N/2)T(N/2)3、排序好右边 N2\frac{N}{2}2N 个元素,时间复杂度 T(N/2)T(N/2)T(N/2)4、归并排序好的左边和右边元素,时间复杂度 θ(N)\theta(N)θ(N)设置归并排序所化时间为 T(N)T(N)T(N),其中 NNN 为输入原创 2021-09-20 20:16:17 · 1070 阅读 · 0 评论 -
快速排序 Quick Sort 的 思维过程
实现升序排序的 python 代码def sort(nums): quit_sort(nums, 0, len(nums) - 1) return numsdef quit_sort(nums, l, r): if r <= l: return # 现在左右两边找到分割点,使得分割点左边都比较小,分割点右边都比较大 j = partition(nums, l, r) quit_sort(nums, l, j - 1) q原创 2020-08-12 10:27:22 · 152 阅读 · 0 评论 -
NLP 从零开始实现 词袋(BOW) 和 TFIDF 文本表示模型(二)
经过之前的文本处理步骤后,我们得到了一个从令牌到数字的映射表 word_to_int。下面我们就用这个映射表,将 语料库 中的每个文本用一个相同长度的数字向量表示。假设我们语料库中的某个文本为:Undocumented Catalina file access change,经过预处理后得到一个令牌向量:['undocu', 'catalina', 'file', 'access', 'chan...原创 2019-12-20 10:13:39 · 355 阅读 · 1 评论 -
NLP 从零开始实现 词袋(BOW) 和 TFIDF 文本表示模型(一)
一、获取文本这里使用的是 hacker news 前 20 条新闻的标题,使用该网站提供的 API: https://hacker-news.firebaseio.com/v0/topstories.json?print=pretty。这一步只需执行一次,保存到本地后,后续可以直接从第二步开始from urllib import requestimport jsonfrom tqdm im...原创 2019-12-20 10:13:21 · 599 阅读 · 0 评论 -
NLP 对词袋(BOW)的理解
一般的机器学习问题的样本数据如下: rank gre gpa admit0 3 380 3.61 01 3 660 3.67 12 1 800 4.00 13 4 640 3.19 14 4 520 2.93 0这是一个根据学生的学习成绩来预测学生是否会被学校录取的分类学习问题的样本数据。对于每个学生,都有三个特征与之对应,分别是 rank,gre...原创 2019-12-11 15:23:38 · 470 阅读 · 0 评论 -
贝叶斯公式的机器学习理解视角
继续分析例题吸毒者检测假设一个吸毒检测器的准确率为99%,也就是说,当被检者吸毒时,每次检测呈阳性(+)的概率为99%。而被检者不吸毒时,每次检测呈阴性(-)的概率为99%。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知0.5%的雇员吸毒。我们想知道,每位检测呈阳性的雇员吸毒的概率有多高?令 D 为雇员吸毒事件,~D 为雇员不吸毒事件,+为检测呈阳性事件。用离散贝叶斯定理对一个例子...原创 2019-12-03 11:19:35 · 346 阅读 · 0 评论 -
用离散贝叶斯定理对一个例子的分析
分析例子来自参考:https://baike.baidu.com/item/贝叶斯定理/1185949?fr=aladdin吸毒者检测假设一个常规的检测结果的敏感度与可靠度均为99%,也就是说,当被检者吸毒时,每次检测呈阳性(+)的概率为99%。而被检者不吸毒时,每次检测呈阴性(-)的概率为99%。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知0.5%的雇员吸毒。我们想知道,每位检...原创 2019-11-29 17:19:07 · 503 阅读 · 0 评论 -
算法成本模型
排序成本模型在研究排序算法时,我们需要计算 比较 和 交换 的数量,对于不交换元素的算法,计算访问数组的次数选择排序1、找到最小的,和第一个元素交换位置2、然后找到第二小的,和第二个元素交换位置,如此反复,直到整个数组排序比较次数交换次数N22\frac{N^2}{2}2N2NNN特点:运行时间和输入无关数据移动最少插入排序情况比较次数...原创 2019-11-26 11:22:08 · 819 阅读 · 0 评论