先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
while (low2 < len)//判断左右手都抓到子序列 判断规则:右手如果抓到,则左手也肯定抓到了 //难点2
{
while (low1 <= high1 && low2 <= high2)//左手还有数据,并且右手还有数据(左手不空且右手不空)
{
//此时判断low1和low2指向的值,谁大谁小
if (arr[low1] <= arr[low2])//low1指向的值 小于等于 low2指向的值
{
brr[k++] = arr[low1++];
/\*low1++;
k++;*/
}
else//low1指向的值 大于 low2指向的值
{
brr[k++] = arr[low2++];
}
}
//此时,while循环退出,代表着左手和右手抓的子序列肯定有一个空了
// 此时需要,将另一个不空的子序列的剩余值,依次挪动到辅助空间brr内 (难点3)
while (low1 <= high1) //左手子序列还有值
{
brr[k++] = arr[low1++];
}
while (low2 <= high2) //右手子序列还有值
{
brr[k++] = arr[low2++];
}
//将四个指针,向右平移, 处理接下来的两个子序列 (难点4)
low1 = high2 + 1;
high1 = low1 + gap - 1;
low2 = low2 = high1 + 1;
high2 = low2 + gap - 1 < len ? low2 + gap - 1 : len - 1;
}
//当最大的while判断为假("while(low2 < len)//判断左右手都抓到子序列")
//(难点5)代表出现了这种情况: 1.两个手都没抓到
// 2.左手抓到了,右手没抓到
// 第三种可能性:左手没抓到,右手抓到了(这种情况不存在)
//上面两种情况:如果出现第一种(左右手都没抓到,刚好结束,什么都不用管)
// 但是,一旦出现第二种情况(左手抓到了,右手没住到),这种情况下我们需要处理左手抓到的数据
while (low1 < len) //处理第二种情况下,左手中剩余的数据
{
brr[k++] = arr[low1++];
}
//此时,所有的数据都在辅助空间brr中,最后将brr中的数据全部挪动到arr中
for (int i = 0; i < len; i++)
{
arr[i] = brr[i];
}
free(brr);
}
//归并排序(Merge,非递归写法): 时间复杂度O(nlogn) 空间复杂度O(n) 稳定性:稳定
void Merge_Sort(int* arr, int len)
{
for (int i = 1; i < len; i *= 2) //logn
{
Merge(arr, len, i); //单独merge函数时间复杂度O(n) 空间复杂度O(n)
}
}
### 1.5 归并排序性能分析
* 时间复杂度:归并排序(Merge,非递归写法)O(nlogn)
* 空间复杂度:O(n)
* 稳定性:稳定
### 1.6 归并排序源代码(递归)
// 合并过程
void merge__(vector &arr, int l, int mid, int r) {
// 在这个地方创建额外空间,是一种不好的做法,更好的做法,等下讲
vector tmp(r - l + 1);
int i = l, j = mid + 1, k = 0;
while (i <= mid && j <= r) {
if (arr[i] >= arr[j]) {
tmp[k++] = arr[j++];
}
else {
tmp[k++] = arr[i++];
}
}
while (i <= mid) {
tmp[k++] = arr[i++];
}
while (j <= r) {
tmp[k++] = arr[j++];
}
for (k = 0, i = l; i <= r; ++i, ++k) {
arr[i] = tmp[k];
}
}
// 递归划分过程
void merge_sort__(vector &arr, int l, int r) {
// 只有一个数字,则停止划分
if (l >= r) {
return;
}
int mid = l + ((r - l) >> 1);
merge\_sort\_\_(arr, l, mid);
merge\_sort\_\_(arr, mid + 1, r);
// 合并两个有序区间
merge\_\_(arr, l, mid, r);
}
// 要排序的数组 arr
void merge_sort(vector& arr) {
merge_sort__(arr, 0, arr.size() - 1);
}
## 2.桶排序(基数排序)
### 2.1 基数排序的思想
* 基数排序(Radix sort)是将所有数据按照从最低位开始进行排序,也就是按照个位,十位,百位,千位…,而判断需要进行几次排序,则是根据数据中最大位数来判断,例如:12 21 366 52 198 1598,判断出最大值为1598,所以需要进行个位,十位,百位,千位共四次排序
* 基数排序适用场景:所有数据位数相差不大的情况下
### 2.2 基数排序的过程
* 桶=队列
![在这里插入图片描述](https://img-blog.csdnimg.cn/61ece332edc9407db5046b98bdff9147.png)
* 第一次排序——排个位(比较按照个位的数字按顺序放入桶内)
![在这里插入图片描述](https://img-blog.csdnimg.cn/77262e600f9740768f26408cfb361ab3.png)
* 第二次排序——十位
![在这里插入图片描述](https://img-blog.csdnimg.cn/4fd8d1d334554f81ad89201d4c99b4a7.png)
* 第三次排序——百位
![在这里插入图片描述](https://img-blog.csdnimg.cn/57a6fd3184fc449cab0416e0aa55ffbe.png)
### 2.3 基数排序源代码
//获取数组arr中最大值的位数
int Get_Max_count(int *arr, int len)
{
int max = arr[0];
for(int i=1; i<len; i++)
{
if(arr[i] > max)
{
max = arr[i];
}
}
int count = 0;
while(max != 0)
{
count++;
max /= 10;//max = max /10;
}
return count;
}
//获取值n,对应的fin位 是多少
//例如 123,0 -> 3
//例如 12345,3 -> 2
//例如 221,5 -> 0 000221,5 -> 0
int Get_Num_Finger(int n, int fin) //%10 取最低位 /10扔掉最低位
{
for(int i=0; i<fin; i++)
{
n = n/10;
}
return n%10;
}
//将单独的一次桶排序看做一个模块 时间复杂度O(n) 空间复杂度O(n)
// fin 代表按第几位进行一次单独的桶排序
// fin=0 代表按个位 fin=3 代表按千位
void Radix(int *arr, int len, int fin)
{
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-PtsmsONx-1713406419269)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!