自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (1)
  • 收藏
  • 关注

原创 K-Means

之前我们接触的算法,都是监督学习,即训练数据是包含我们要预测的结果(训练数据中是含有样本的标签)。我们对含有标签的训练集建立模型,从而能够对未知标签的样本进行预测。与监督学习对应的,聚类属于无监督学习,即训练数据中是不含有标签的。聚类的目的是根据样本数据内部的特征,将数据划分为若干个类别,每个类别就是一个簇。结果为,使得同一个簇内的数据,相似度较大,而不同簇内的数据,相似度较小。聚类也称为“无监督的分类”。其样本的相似性是根据距离来度量的。K-Mean算法,即 均值算法,是最常见的一种聚类算法。

2024-06-06 21:13:33 598

原创 hadoop对象序列化与反序列化

基本序列化类型往往不能满足所有需求,比如在Hadoop框架内部传递一个自定义bean对象,那么该对象就需要实现Writable序列化接口。因为我们在排序时调用Comparble函数时把相同大小数据归为一类key导致数据重叠。注意Reducer类的kv类型一定要与Mapper类对齐。在序列化对象调用Comparble函数。同时Reuducer类也进行相应改变。所以需用迭代器value区别值。序列化Writable接口。本函数顺序是由大到小。

2024-05-02 10:54:26 287 4

原创 刷题总计题解

当顾客想买 11 个包子时,大叔就会选 2 笼 3 个的再加 1 笼 5 个的(也可能选出 1 笼 3 个的再加 2 笼 4 个的)。假设小怂的起始点是 (1,1),他可以移动无数次,每次移动只能移动到当前水洼上下左右四个方向的相邻小水洼上,并且需要满足相邻小水洼水量大于 0,即如果新的小水洼水量为零,小怂就不能走到这个小水洼上。如果起始点的水洼中有水,他会收集那些水。小蓝是一位有名的漆匠,他的朋友小桥有一个漆房,里面有一条长长的走廊,走廊两旁有许多相邻的房子,每间房子最初被涂上了一种颜色。

2024-04-07 11:47:23 1769

原创 hdfs客户端Api上传下载查看文件信息

代码设置的值>用户自定义配置文件>服务器默认配置。通过对代码的运行进行验证是否是正确的。其中我们可以通过代码修改副本参数。

2024-04-07 11:44:10 170

原创 hdfs-client 客户端连接

在pom.xml中导入相关依赖包:hadoop_hdfs,hadoop_common,hadoop_client。在resources中创建log4j.properties文件控制日志数量。在maven resporitry官网。切记:本地目录不能带中文名字会出错。4.在idle创建maven项目。在web_url中验证是否创建。给hdfs目录所有权限可读可写。也可以导入相关日志管理。在项目中创建Java。

2024-04-04 15:32:00 471 1

原创 leetcode刷题(python)回溯法理论基础 && 77. 组合

回溯法也可以叫做回溯搜索法,它是一种搜索的方式。在二叉树系列中,我们已经不止一次,提到了回溯,回溯是递归的副产品,只要有递归就会有回溯。

2023-11-04 01:06:02 45 1

原创 leetcode刷题(python)110.平衡二叉树& 257. 二叉树的所有路径 &404.左叶子之和

后序遍历递归,最关键是判断左子树与右子树的左叶子之和,关键判断终止条件。回溯法有意思但挺难,需多巩固。递归后序遍历-左右中。

2023-10-28 01:01:38 41 1

原创 leetcode刷题(python)10.层序遍历&226.翻转二叉树&101.对称二叉树

构造队列解决,使用先序遍历或者后序遍历较简单。使用先序遍历,中左右 ,运用递归法。使用后序遍历,递归法解决问题。

2023-10-27 00:28:27 41 1

原创 239. 滑动窗口最大值&347.前 K 个高频元素

构造小顶栈因为pop的是队列中最小值,所以要倒叙赋值才是从从大到小的结果。先构造单调队列再从总体思路出发。

2023-10-24 17:08:56 32

原创 leetcode刷题:20. 有效的括号&1047. 删除字符串中的所有相邻重复项&150. 逆波兰表达式求值

注意‘/’python除数与数学计算有些不同,列6/(-126)= -1 而不是0,所以要引用int达到解题。栈解题法只要知道怎么构建以及原理就能很好解决问题。1047. 删除字符串中的所有相邻重复项。150. 逆波兰表达式求值。

2023-10-22 02:47:19 49 1

原创 232.用栈实现队列& 225. 用队列实现栈

两栈实现队列,将栈先近后出变换为队列先进先出。用一个队列实现栈,简化代码运行。

2023-10-21 16:22:28 29 1

原创 28. 实现 strStr()&459.重复的子字符串&字符串总结 &双指针回顾

【代码】28. 实现 strStr()&459.重复的子字符串&字符串总结 &双指针回顾。

2023-10-20 01:23:26 26 1

原创 leetcode刷题:(python)344.反转字符串& 541. 反转字符串II&剑指Offer 05.替换空格&151.翻转字符串里的单词& 剑指Offer58-II.左旋转字符串

python使用转换字符串或列表顺序so easy。由于字符串不用考虑上下界超出所以问题变得简答起来。

2023-10-18 21:50:36 43 1

原创 leetcode刷题● 454.四数相加II ● 383. 赎金信 ● 15. 三数之和 ● 18. 四数之和

也可以用字典法但时间复杂度较高很难在正规场合使用。四分二减小时间负杂度,由n**4变为n**2。注意去重循环很简单但去重很复杂很考验思维。

2023-10-17 23:54:15 30

原创 leetcode刷题:242.有效的字母异位词&349. 两个数组的交集 & 202. 快乐数&1. 两数之和 (python)

哈希表数组法对数值进行编制标签哈希表便于寻找是关键字典法因为是交集的元素所以不能重复用集合退出的循环关键也是循环,一直是循环值,只要再次有循环值就退出,系铃还需系铃人。

2023-10-17 00:03:29 26

原创 24. 两两交换链表中的节点 &19.删除链表的倒数第N个节点&面试题 02.07. 链表相交&142.环形链表II

【代码】24. 两两交换链表中的节点 &19.删除链表的倒数第N个节点&面试题 02.07. 链表相交&142.环形链表II。

2023-10-15 23:07:51 78 1

原创 203.移除链表元素&707.设计链表&206.反转链表

脑海里要有思维导图,当时没有写pre更换值,且把cur.next搞反。类属性一定要加self,边界值考虑清楚。

2023-10-14 13:37:00 26 1

原创 Day2:977.有序数组的平方 &209.长度最小的子数组&59.螺旋矩阵II

个人:不要太在乎别人的看法,活出精彩。学会了if,else新用法。

2023-10-13 01:26:56 44

原创 Day1:704. 二分查找&27. 移除元素

没有写l-=1 原因:因为已经删除了元素###被替换了所以后一个元素替换到当前位置,位置不变。2.mid没有+1导致循环超时思路应该是后一个新值。理清思路以后就比较简单,思路清晰很关键。Python解题代码如下:双指针法。Python解题代码如下:双指针法。因循环查值外有l+1所以不改变-1。1.没有写left两边都在变。

2023-10-11 23:49:08 135

原创 新安人才网爬虫数据—使用BeautifulSoup方法

关于Beautifulsoup如何使用。ps:也可以自行转化为csv文件。以新安人才网网址为例。

2023-08-25 00:09:27 812

原创 Java程序设计—ATM柜员机模拟程序(eclipse使用)

作者笔语: 首先感谢大家能够阅读我的文章,本次程序实验设计功能主要是简洁和功能便捷而且便于操作,便于读者阅读和学习,也便于读者对我的设计进行升华与改进,我会在文章末尾留下代码文档便于参考,如有问题和大胆想法与创新设计也可跟我交流。目录一、简述:(1)设计功能要求:(2) 开发环境:(3)实验设计的目的: 二、程序的实现与设计(1)程序中的类及关系 (2)程序设计流程以及描述图(3)运行程序与调试三、功能的实现与运行1.用户登录功能:2.进入ATM柜员机系统:(1)取款功能 (2)修改密码功能(3) 亮点功能

2023-08-22 10:39:00 2674

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除