一、哈希表
哈希算法:
在记录的存储位置和它的关键字之间建立一种去特定的对应关系,使得每个关键字key对应一个存储位置;
查找时,根据确定的对应关系,找到给定的key的映射。
记录的存储位置 = f(关键字)
我们把这种关系f称为哈希函数(散列函数);
采用这种散列技术将记录存储在一块连续的存储空间,这块连续存储开空间称为哈希表或散列表。
存储时,通过散列函数计算出记录的散列地址;
查找时,根据同样的散列函数计算记录的散列地址,并按此散列地址访问记录。
#include<head.h>
#include"hash.h"
HSNode_t *hashtable[HASH_SIZE]={NULL}; //以全局表量形式表示哈希表
/*哈希函数*/
int hash_function(char key)
{
if(key >= 'a' && key <= 'z')
{
return key - 'a';
}
else if(key >= 'A' && key <= 'Z')
{
return key - 'A';
}
else
{
return HASH_SIZE - 1;
}
}
/*插入链表*/
int insert_hashtable(HSDataTYpe data)
{
int addr = hash_function(data.name[0]);
HSNode_t *pnode = malloc(sizeof(HSNode_t));
if(NULL == pnode)
{
perror("malloc fail");
return -1;
}
pnode->data = data;
pnode->pnext = NULL;
pnode->pnext = hashtable[addr];
hashtable[addr] = pnode;
return 0;
}
/*遍历*/
void printf_hash()
{
for(int i= 0;i < 26;++i)
{
HSNode_t *p = hashtable[i];
while(p != NULL)
{
printf("%s %s\n",p->data.name,p->data.tel);
p = p->pnext;
}
}
}
/*查找*/
HSNode_t *find_hash(char *name)
{
int addr = hash_function(name[0]);
HSNode_t *p = hashtable[addr];
while(p != NULL)
{
if(strncmp(name,p->data.name,strlen(name)) == 0)
{
return p;
}
p=p->pnext;
}
}
/*删除*/
int pop_hash(int i)
{
HSNode_t *pdel = hashtable[i];
if(NULL == pdel)
{
return 0;
}
hashtable[i] = pdel->pnext;
free(pdel);
return 1;
}
/*销毁*/
void destory()
{
for(int i=0;i<HASH_SIZE;++i)
{
while(hashtable[i] != NULL)
{
pop_hash(i);
}
}
}
/********************************************************************/
#ifndef _HASH_H
#define _HASH_H
#define HASH_SIZE 27
typedef struct per
{
char name[64];
char tel[32];
}HSDataTYpe;
typedef struct hsnode
{
HSDataTYpe data;
struct hsnode *pnext;
}HSNode_t;
extern int insert_hashtable(HSDataTYpe data);
extern void printf_hash();
extern HSNode_t *find_hash(char *name);
extern int pop_hash();
extern void destory();
#endif
二、算法
1、算法的设计
1.正确性,
语法正确
合法的输入能得到合理的结果。
对非法的输入,给出满足要求的规格说明
对精心选择,甚至刁难的测试都能正常运行,结果正确
2. 可读性,便于交流,阅读,理解 高内聚 低耦合
3. 健壮性,输入非法数据,能进行相应的处理,而不是产生异常
4. 高效率(时间复杂度)
5. 低存储(空间复杂度)
2、算法时间复杂度
执行这个算法所花时间的度量
将数据量增长和时间增长用函数表示出来,这个函数就叫做时间复杂度。
一般用大O表示法:O(n)-----时间复杂度是关于数据n的一个函数
随着n的增加,时间复杂度增长较慢的算法时间复杂度低
时间复杂度的计算规则
1,用常数1 取代运行时间中的所有加法常数
2,在修改后的运行函数中,只保留最高阶项。
3,如果最高阶存在且系数不是1,则去除这个项相乘的常数。
3、排序算法
1、插入排序
思想:将数组分为已排序区间和未排序区间,初始已排序区间只有一个元素,就是数组的第一个元素。然后,每次从未排序区间中取出第一个元素,在已排序区间中找到相应的位置并插入。
特点:
- 在小规模数据集上,插入排序的性能接近线性排序。
- 时间复杂度在最好情况下为O(n),最坏情况下为O(n^2)。
- 插入排序是稳定的排序算法。
- 不需要额外的存储空间,也是原地排序
void InsertionSort(int *a,int len) { int i,j; for(i=1;i<len;++i) { j= i; int t = *(a+i); while(j>0 && (*(a+j-1))>t) { *(a+j) = *(a+j-1); --j; } *(a+j) = t; } }
2、选择排序
思想:遍历数组,每次从未排序的部分找到最小(或最大)的元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(或最大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
特点:
- 时间复杂度为O(n^2),其中n是数组的长度。
- 不稳定排序(即相等的元素可能在排序后的序列中改变相对位置)。
- 不需要额外的存储空间,原地排序。
-
void choiceSort(int *a, int len) { int i,j; for(i=0;i<len;++i) { for(j=i+1;j<len;++j) { if(*(a+i) >*(a+j)) { swap(a+i,a+j); } } } }
3、冒泡排序
思想:通过重复遍历要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。遍历数列的工作是重复进行的,直到没有再需要交换的元素为止,这表示该数列已经排序完成。
特点:
- 时间复杂度也是O(n^2)。
- 也是一种原地排序,且是稳定的排序算法
-
void BubbleSort(int *a,int len) { int i,j; for(j=len-1;j>0;--j) { for(i=0;i<j;++i) { if(*(a+i) > *(a+i+1)) { swap(a+i,a+i+1); } } } }
4、快速排序
基本思想为:任取待排序元素序列中的某元素作为基准值(pivot),按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。快速排序采用了分治的思想,将一个大问题转化为若干个小问题,然后逐个解决每个小问题,最终达到解决问题的目的。
void qSort(int *begin , int *end)
{
if(begin >= end)
{
return ;
}
int t = *begin;
int *p = begin;
int *q = end;
while(p < q)
{
while(p<q && *q >= t)
{
--q;
}
while(p<q && *p <= t)
{
++p;
}
swap(p,q);
}
swap(begin,p);
qSort(begin,p-1);
qSort(p+1,end);
}
5、二分查找
- 优点:
- 效率高:二分查找的时间复杂度为O(log n),在处理大数据集时非常高效。
- 适用范围广:只要数组(或类似的数据结构)是有序的,就可以使用二分查找算法来快速定位元素。
- 稳定性好:二分查找的性能不会受到输入数据分布的影响。
- 空间复杂度低:不需要额外的存储空间。
- 缺点:
- 要求有序数组:如果数组无序,则需要先进行排序操作,这可能会增加额外的时间开销。
- 插入和删除操作效率低:二分查找在查找操作上非常高效,但如果需要在数组中频繁地进行插入和删除操作,则二分查找可能不是最佳选择。
- 不适用于非数组数据结构:二分查找主要适用于数组或类似数组的数据结构。
- 边界条件处理复杂:在实现二分查找时,需要正确处理各种边界条件,这可能会使代码变得复杂且容易出错。
int *binaryFind(int *a,int len ,int n)
{
int begin =0;
int end =len -1;
int mid;
while(begin <= end)
{
mid = (begin + end) /2;
if(*(a+mid) < n)
{
begin = mid +1;
}
else if(*(a+mid) > n)
{
end = mid -1;
}
else
{
return a+mid;
}
}
return NULL;
}