自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 chapter10 聚类(机器学习实战)

完全可以复制黏贴使用哒,文件夹的目录如下import numpy as npfrom collections import Counterimport matplotlib.pyplot as pltdef load_dataset(filename): df = pd.read_csv(filename,sep="\t",header=None) matrix = df.to_numpy() return matrixdef cal_dist(dataset,

2022-01-30 17:04:34 1770

原创 西瓜书第二章个人总结

过拟合和欠拟合的概念应该算是最经常出现的一对概念了上面的2幅图就是欠拟合,模型过于简单,左下的就是一个合理的训练出来的模型,右下就是一个过拟合的例子划分训练集合测试集的方法留出法,直接将所有样本分为训练集和测试集,这时需要这两者尽可能保持数据的一致性,即他们的分布要尽可能一样,k折交叉,将数据集划分为k份,做k次训练,每次取其中一个子集做测试集,其余做训练集,k次训练后求均值即为测试结果自助法,每次从数据集中随机有放回的取一个样本,m次后即可形成大小为m的测试集性能度量对分类问题的度量方式为错

2022-01-11 18:40:17 333

原创 机器学习实战第2章-knn

本文的代码基于机器学习实战,然后修改了一些部分,以适应3.x的Python首先是用到的库import pandas as pdimport numpy as npimport heapqfrom collections import Counterimport os读数据def file2matrix(filename): df = pd.read_csv(filename,sep="\t",header=None) matrix = df.to_numpy()

2021-12-13 20:13:12 1691

原创 400.第N位数字

题目描述给你一个整数 n ,请你在无限的整数序列 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, …] 中找出并返回第 n 位数字。链接:https://leetcode-cn.com/problems/nth-digit/1 <= n <= 231 - 1分析一道经典的数学急转弯题,我们先来算一下,位数为1,2,3…的数字总共有多少位位数为1的有9个数字,共91=9位位数为2的有90个数字,共902=180位位数为3的有900个数字,共900*3=270

2021-11-30 17:37:49 166

原创 458.可怜的小猪

题目有 buckets 桶液体,其中 正好 有一桶含有毒药,其余装的都是水。它们从外观看起来都一样。为了弄清楚哪只水桶含有毒药,你可以喂一些猪喝,通过观察猪是否会死进行判断。不幸的是,你只有 minutesToTest 分钟时间来确定哪桶液体是有毒的。喂猪的规则如下:选择若干活猪进行喂养可以允许小猪同时饮用任意数量的桶中的水,并且该过程不需要时间。小猪喝完水后,必须有 minutesToDie 分钟的冷却时间。在这段时间里,你只能观察,而不允许继续喂猪。过了 minutesToDie 分钟后,所

2021-11-26 17:35:53 93

原创 生产者消费者

华工计算机辅修OS的实验二的问题1,不让用Python写不过还是写了~~~import threadingimport timeimport random#假设初始时无货物,货物架大小为30n=30empty,full,mutex=threading.Semaphore(30),threading.Semaphore(0),threading.Semaphore(1)def producer(i,goods): while(1): empty.acquire()

2021-11-26 14:36:04 507

原创 423.从英文中重建数字

题目给你一个字符串 s ,其中包含字母顺序打乱的用英文单词表示的若干数字(0-9)。按 升序 返回原始的数字。输入:s = “owoztneoer”输出:“012”https://leetcode-cn.com/problems/reconstruct-original-digits-from-english/分析这里首先是建一个字典不用说,接着我们看看,既然s是由zero,one等英文单词构成的,那么它一定是由各个英文单词构成的线性组合后打乱的,什么意思呢,以上面的输入输出为例子,输出是0

2021-11-24 12:09:44 80

原创 55.跳跃游戏

题目给定一个非负整数数组 nums ,你最初位于数组的 第一个下标 。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标。链接:https://leetcode-cn.com/problems/jump-game/分析这里我一开始就直接往动态规划的方向去想,首先构造了一个dp数组,初始化为False,第一个为True,然后遍历每一个元素,将其能到达的范围的dp数组全部置为True,遍历完后看看dp[-1],后来一想,不对呀,根本就不用这么麻烦,既然都已经知道在某一个

2021-11-23 20:25:30 2583

原创 1218.最长定差子序列

题目描述给你一个整数数组 arr 和一个整数 difference,请你找出并返回 arr 中最长等差子序列的长度,该子序列中相邻元素之间的差等于 difference 。子序列 是指在不改变其余元素顺序的情况下,通过删除一些元素或不删除任何元素而从 arr 派生出来的序列。链接:https://leetcode-cn.com/problems/longest-arithmetic-subsequence-of-given-difference分析最朴素的方法,就是对每个元素,都向后遍历,看看有没

2021-11-21 00:17:45 266

原创 594.最长和谐子序列

描述和谐数组是指一个数组里元素的最大值和最小值之间的差别 正好是 1 。现在,给你一个整数数组 nums ,请你在所有可能的子序列中找到最长的和谐子序列的长度。数组的子序列是一个由数组派生出来的序列,它可以通过删除一些元素或不删除元素、且不改变其余元素的顺序而得到。分析这里肯定是要先得到每个数字的频率的,否则就算不出来嘛然后就是如何保存频率,不用说,为了效率肯定是哈希表接着,对哈希表里的每个元素,查查看有没有比他大1的数,有就更新一下ans,没有就跳过不用看比他小1的数是因为会造成重复,比如

2021-11-20 22:55:00 92

原创 397.整数替换

题目描述给定一个正整数 n ,你可以做如下操作:如果 n 是偶数,则用 n / 2替换 n 。如果 n 是奇数,则可以用 n + 1或n - 1替换 n 。n 变为 1 所需的最小替换次数是多少?链接:https://leetcode-cn.com/problems/integer-replacement分析很明显的,按照题目所给的意思我们可以很容易地写出递归地代码但递归的最大缺点在于,有多个子问题被重复的调用了比如说n=3,计算它时会递归进入n=4和n=2,而n=4里面又需要n=2的答

2021-11-20 22:48:11 222

原创 563.二叉树的坡度

题目描述给定一个二叉树,计算 整个树 的坡度 。一个树的 节点的坡度 定义即为,该节点左子树的节点之和和右子树节点之和的 差的绝对值 。如果没有左子树的话,左子树的节点之和为 0 ;没有右子树的话也是一样。空结点的坡度是 0 。整个树 的坡度就是其所有节点的坡度之和。分析涉及到了这种左右节点操作的,基本上dfs都能解决dfs说到底,就是递归的思想那递归又是什么思想呢我只要子问题的解,你子问题咋得到解的,我不关心,就是这么霸道也就是说,只要调用参数为左结点的dfs就能得到左结点的子树值之和了

2021-11-18 22:47:02 66

原创 318.最大单词长度乘积

**题目描述****分析**题目就是要我们去找到互相没有重复的单词,怎么找呢笔者刚刚学过net里的码分复用,它设计的每个站点的比特序列之间的点乘是0,即互相之间是正交的那么这里我们可以用这种正交关系找到互相无重复的单词自然地,我们就想到用0101的序列来表示单词,1表示该位有字母,同时每个序列最低位是a,最高位是出现的最大字母用01比特去表示单词的好处在于,异运算的时间复杂度是O(1),所以这里可以迅速判断是否有重复字母时间复杂度上看,构造单词序列为O(n),比较需要n(n-1)/2

2021-11-17 22:47:03 193

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除