先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
-
创建远程仓库并clone到本地。
-
规划好自己的目录结构,push到远程仓库。
-
在宿舍学会使用clone与pull。
参考资料:
二.线性表
=====
1. 顺序表
目标:
熟悉顺序表的定义及其上的常用操作。
任务:
-
PTA:区间删除
-
使用typedef定义List与SqList类型
-
基本考核:CreateList、DispList。
-
**指导:**指导学生逐步完成CreateList再完成DispList。确认无误的基础上,再完成删除区间元素。
-
删除区间元素
-
PTA:顺序表插入
参考代码:
顺序表定义
#define MaxSize 100000
using namespace std;
typedef int ElemType;
typedef struct
{
ElemType data[MaxSize]; //存放顺序表元素
int length ; //存放顺序表的长度
} List;
typedef List *SqList;
2. 链表
目标:
- 熟悉链表的定义及其上的常用操作
任务:
-
手动创建链表(基础中的基础,重点掌握)
-
创建头结点(LinkList head),然后创建3个节点(LNode* n1,n2,n3),然后将这些节点连成一个链表(head->n1->n2->n3)
-
编写
void DispLinkList(LinkList linklist)
,使用while
遍历输出刚才手动创建的链表。 -
编写头插法创建链表并输出(考核)。
-
PTA:头插法、尾插法创建链表。(请保存创建链表的代码,留待以后使用)
-
定义输出链表函数、定义创建链表函数。(考核)
-
尾插法:可定义q指针变量,指向上一次插入的节点。(考核)
-
销毁链表(看懂)
-
PTA:单链表逆置
-
PTA:有序链表的插入删除
难点:
部分学生对于指针变量指向某个节点没有直观认识。不能将移动指针操作转化为代码,也不能从代码看出其对应的指针移动、指向操作。
参考代码:
单链表定义
typedef int ElemType;
typedef struct LNode //定义单链表结点类型
{
ElemType data;
struct LNode *next; //指向后继结点
} LNode, *LinkList;
3. 栈和队列
目标:
-
掌握栈和队列的基本存储结构
-
熟练掌握栈和队列的基本使用
-
熟悉栈和队列的一些典型应用
任务:
- 使用顺序存储结构来实现栈的基本操作(自行完成)。
- PTA函数题:另类堆栈、在一个数组中实现两个堆栈(考研题)
-
学会使用STL中的stack、queue与string见参考资料Stack与Queue代码。完成实验任务书中的题目1—C++中的stack和queue(课上必选)。
-
栈的应用(课上任选一)
-
根据PPT上的伪代码使用stack编写数制转换函数(十进制转二进制=>十进制转十六进制)。
-
void convertDecToBin(int x);//对十进制整数x输出其二进制值。需考虑0、负数,请写出测试代码)
-
PTA:符号配对(考核)、表达式转换(中缀转后缀,考核)
-
实验任务书:字符串是否对称(回文)
- 递归(自行完成,实验课考核加分)
4.1 递归程序编写(课上完成)
题目:已知f为单链表的表头指针, 链表中存储的都是整型数据,试写出实现下列运算的递归算法:
① 求链表中的最大整数;
② 求链表的结点个数;
③ 求链表中所有节点数据的平均值。**注意:**1.适用于包含头结点的链表;2.要考虑空链表、只包含1个节点的链表的情况。
4.2 使用stack将以下递归程序转化为非递归程序
void test(int &sum)
{
int x;
cin>>x;
if (x==0) sum = 0;
else {
test(sum);
sum+=x;
}
cout<<sum;
}
- 队列的应用(课上任选一)
-
PTA:银行业务队列简单模拟、舞伴问题
-
实验任务书:使用队列打印杨辉三角(可选)。
- 可选
-
实验任务书:使用队列对扑克牌排序、走迷宫。
-
PTA题目:另类循环队列(函数)
- 特别加分:使用递归或者队列实现对指定目录名及文件名进行文件查找(可使用C、C++、Python、Java实现)。并发一个简单博客描述该问题解决过程。
参考资料:
5.递归就这么简单
4.字符串(自行完成)
试验任务书
-
第一题-拼接字符串(身份证)。实验课检查。
-
选做:最后一题特别加分(判断是否是数字)。实验任务书其他题目
PTA
-
jmu-ds-简单密码
-
选做:jmu-ds-最长数字序列、jmu-ds-最长公共子串、jmu-ds-实现KMP
参考资料:
三.树
===
目标:
学会创建树,熟练掌握树的递归结构及在其上的递归算法,二叉树的基本操作,哈夫曼树,树的应用。
参考代码:
typedef struct BiTNode {
ElemType data;
struct BiTNode *lchild, *rchild;
} BiTNode, *BiTree;
标*的为课上讲解。其他为课后完成。
任务:
0. *****手动创建一颗二叉树,并对其进行先序(124356)、中序(241536)与后序(425631)遍历。树图如下。
-
*****使用先序串(
ABC##DE#G##F##HI##J##
)创建树,然后对其进行先、中、后序遍历。中序对应的序列为(CBEGDFAIHJ
)。对应PTA(编程):前序序列创建二叉树。 -
树的递归结构。PTA(函数)-课后完成:先序输出叶结点、求二叉树高度。
-
树的应用。PTA(函数)-课后完成:表达式树。
-
*队列应用(编程)。PTA:二叉树层次遍历(广度优先)。
-
先序、中序、后序确定树。PTA(编程)-课后完成:还原二叉树、根据后序和中序遍历输出先序遍历。
-
*二叉树的应用:二叉排序树。给定一串50 30 80 20 40 90 10 25 35 85 23 88创建二叉排序树并进行搜索。
-
*****树的应用(可选,简单讲解):PTA(编程):目录树(使用兄弟链,综合使用了树结构与链表结构)。
-
二叉树的应用(可选):哈夫曼树。PTA(编程):二叉树叶子结点带权路径长度和、修理牧场。
-
树的应用(可选):并查集。PTA(编程):朋友圈、家谱处理。
-
绘制二叉树(可选):使用EasyX绘制二叉树。
-
其他(可选):如下所示
二叉树既可以用链式结构存储也可以用顺序结构存储,尝试编写两个算法,实现两个功能:1. 将链式结构存储的二叉树转化成顺序结构存储;2. 将顺序结构存储的二叉树转化成链式结构存储。
实验课任务:
- 课前准备:
-
使用代码对先序字符串
ABC**DE*G**F**HI**J**
建立链式二叉树。并准备好层序遍历的伪代码。 -
学会使用queue进行编码。看:给学生-queue.txt
-
教师可按照本次实验的PPT上课。
- 实验课完成:
-
层序遍历二叉树。层次遍历课前准备1建立的链式二叉树。层序遍历输出为
ABHCDIJEFG
,请自行验证。 -
目录树(简单讲解思路)。使用怎样的数据结构来存储这棵树?字典排序怎么实现(可使用string的compare函数,或直接使用>、=、<等比较运算符)?
-
二叉排序树。尝试完成创建、查找。思考:如何删除、
参考资料:
四.查找与排序
=======
目标:
学会基本的查找与排序算法,学会将哈希表应用于快速查找、统计等。
任务:
4.1 查找
包括:基本查找、二分查找、二叉排序树、哈希(map的使用)
4.1.1 热身:
实现二叉排序树(实验课前在发布互评作业,实验课上学生展示)。
//在T上搜索key。查找成功则返回相应节点,否则返回NULL;
BiTNode* SearchBST(BiTree T, ElemType key)
//在T上插入key。成功插入,则返回所插入节点;否则返回NULL。
BiTNode* InsertBst(BiTree T, ElemType key)
//CreateBst(BiTree &T);//根据控制台输入或者数组、字符串等你希望的方式来创建BST
//在T上删除key。成功删除则返回所要删除的节点,否则返回NULL。注意:删除实际上只是将相应节点从树上分离出来。
BiTNode* DeleteBst(BiTree T, ElemType key)
可基于"BST-基础代码.txt"实现。提示:很多实现均可基于递归。
可选:
-
二叉搜索树(OJ):http://jmunetds.openjudge.cn/ex5/901/
-
二叉搜索树的节点删除(OJ):http://jmunetds.openjudge.cn/ex5/902/
4.1.2 PTA函数题
-
“是否二叉搜索树”(利用BST的递归定义)
-
“二叉搜索树中的最近公共祖先”(利用BST的递归定义、利用BST左小右大或左大右小的特性)
4.13 PTA编程题:
-
*QQ帐户的申请与登(哈希,map)。
-
航空公司VIP客户查询(哈希链)
-
基于词频的文件相似度(map)
排序题集中的“统计工龄”很适合演示map的使用。
4.1.4 可选(OJ):
-
905词典(map):http://jmunetds.openjudge.cn/ex5/905/
4.1.5 其他(OJ):
4.2 排序
包括:基本排序、快排、堆排。
4.2.1 PTA(自行完成)
-
填空题:5-1(链表冒泡排序)、5-2(另类排序-每趟找出最大与最小)
-
函数题:6-1(冒泡排序)
4.2.2 课堂任务PTA:
-
统计工龄(建议:提前完成。课上简单讲解.)
-
本质上是一个查找问题。大部分同学直接使用数组解决。问:与统计一篇英文文章中的词汇问题有何异同之处?可以联想到查找中学到的哈希表。
-
使用STL中的map改造该题?map存储的是键值对(key-value pair),key唯一。思考:key是什么类型?value是什么类型?
-
STL的map内部使用红黑树,key是排序好的。
-
“7-1 排序”(建议:提前完成。课上略讲。)
-
你使用了什么排序算法?
-
考虑性能问题、数组空间问题
-
PAT排名汇总(课堂回答)
-
首先理解问题、读懂样例。回答如下问题:
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
4.2.2 课堂任务PTA:*
-
统计工龄(建议:提前完成。课上简单讲解.)
-
本质上是一个查找问题。大部分同学直接使用数组解决。问:与统计一篇英文文章中的词汇问题有何异同之处?可以联想到查找中学到的哈希表。
-
使用STL中的map改造该题?map存储的是键值对(key-value pair),key唯一。思考:key是什么类型?value是什么类型?
-
STL的map内部使用红黑树,key是排序好的。
-
“7-1 排序”(建议:提前完成。课上略讲。)
-
你使用了什么排序算法?
-
考虑性能问题、数组空间问题
-
PAT排名汇总(课堂回答)
-
首先理解问题、读懂样例。回答如下问题:
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-MANI7EC3-1713190103027)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!