c语言接口与实现--原子atom章节例子程序的理解

    以前听说过c语言有四书五经,同事推荐的《C语言接口与实现-创建可重用软件的技术》,刚接触就有点懵圈,作为菜鸟的看不懂,于是每一章节重复的看,代码一条条的过。对于第二章原子,目前只能做到了解皮毛,这里记录下来以备查阅和后续补充。源代码从博主Character_Painter的文章中扒过来的,如果有侵权请联系。附上链接http://blog.csdn.net/javagoingon/article/details/51107102。

    

    atom.h头文件,比较简单,无需注释

#ifndef ATOM_INCLUDED
#define ATOM_INCLUDED
extern int Atom_length(const char *str);
extern const char *Atom_new (const char *str, int len);
extern const char *Atom_string(const char *str);
extern const char *Atom_int (long n);
#endif

atom.c源文件

#include<stdio.h>
#include<assert.h>
#include<string.h>
#include<stdlib.h>
#define _CRT_SECURE_NO_WARNINGS
#define LONG_MAX1 1000   // 在limits.h中LONG_MAX 2147483647L LONG_MIN (-LONG_MAX-1),
#define LONG_MIN1 100
#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0]))) // 计算数组长度的方法,但数组元素作为函数参数时,此方法不可用。
static struct atom {    
    struct atom *link;    
    int len;    
    char *str;
} *buckets[2048];
// 定义了一个长度为2048的指针数组,每个元素是atom *
// 散列数组,用于计算hash表的key值,作为buckets的下标索引值,这个理解的不深....
static unsigned long scatter[] ={    2078917053, 143302914, 1027100827, 1953210302, 755253631, 2002600785,    1405390230, 45248011, 1099951567, 433832350, 2018585307, 438263339,    813528929, 1703199216, 618906479, 573714703, 766270699, 275680090,    1510320440, 1583583926, 1723401032, 1965443329, 1098183682, 1636505764,    980071615, 1011597961, 643279273, 1315461275, 157584038, 1069844923,    471560540, 89017443, 1213147837, 1498661368, 2042227746, 1968401469,    1353778505, 1300134328, 2013649480, 306246424, 1733966678, 1884751139,    744509763, 400011959, 1440466707, 1363416242, 973726663, 59253759,    1639096332, 336563455, 1642837685, 1215013716, 154523136, 593537720,    704035832, 1134594751, 1605135681, 1347315106, 302572379, 1762719719,    269676381, 774132919, 1851737163, 1482824219, 125310639, 1746481261,    1303742040, 1479089144, 899131941, 1169907872, 1785335569, 485614972,    907175364, 382361684, 885626931, 200158423, 1745777927, 1859353594,    259412182, 1237390611, 48433401, 1902249868, 304920680, 202956538,    348303940, 1008956512, 1337551289, 1953439621, 208787970, 1640123668,    1568675693, 478464352, 266772940, 1272929208, 1961288571, 392083579,    871926821, 1117546963, 1871172724, 1771058762, 139971187, 1509024645,    109190086, 1047146551, 1891386329, 994817018, 1247304975, 1489680608,    706686964, 1506717157, 579587572, 755120366, 1261483377, 884508252,    958076904, 1609787317, 1893464764, 148144545, 1415743291, 2102252735,    1788268214, 836935336, 433233439, 2055041154, 2109864544, 247038362,    299641085, 834307717, 1364585325, 23330161, 457882831, 1504556512,    1532354806, 567072918, 404219416, 1276257488, 1561889936, 1651524391,    618454448, 121093252, 1010757900, 1198042020, 876213618, 124757630,    2082550272, 1834290522, 1734544947, 1828531389, 1982435068, 1002804590,    1783300476, 1623219634, 1839739926, 69050267, 1530777140, 1802120822,    316088629, 1830418225, 488944891, 1680673954, 1853748387, 946827723,    1037746818, 1238619545, 1513900641, 1441966234, 367393385, 928306929,    946006977, 985847834, 1049400181, 1956764878, 36406206, 1925613800,    2081522508, 2118956479, 1612420674, 1668583807, 1800004220, 1447372094,    523904750, 1435821048, 923108080, 216161028, 1504871315, 306401572,    2018281851, 1820959944, 2136819798, 359743094, 1354150250, 1843084537,    1306570817, 244413420, 934220434, 672987810, 1686379655, 1301613820,    1601294739, 484902984, 139978006, 503211273, 294184214, 176384212,    281341425, 228223074, 147857043, 1893762099, 1896806882, 1947861263,    1193650546, 273227984, 1236198663, 2116758626, 489389012, 593586330,    275676551, 360187215, 267062626, 265012701, 719930310, 1621212876,    2108097238, 2026501127, 1865626297, 894834024, 552005290, 1404522304,    48964196, 5816381, 1889425288, 188942202, 509027654, 36125855,    365326415, 790369079, 264348929, 513183458, 536647531, 13672163,    313561074, 1730298077, 286900147, 1549759737, 1699573055, 776289160,    2143346068, 1975249606, 1136476375, 262925046, 92778659, 1856406685,    1884137923, 53392249, 1735424165, 1602280572};
//创建字符串的原子节点,添加到buckets中的桶中去,通过计算得到hash的h值添加到对应的原子atom列表中,如果已经存在此str内容,则直接返回已存在的节点内容。
const char * Atom_new(const char *str, int len)
{    
    unsigned long h;    
    int i;    
    struct atom *p;    
    assert(str);    
    assert(len >= 0);    
    for (h = 0, i = 0; i < len; i++)    
    { 
        h = (h << 1) + scatter[(unsigned char)str[i]];  
    }    
    h &= NELEMS(buckets) - 1; 
    // 计算出hash索引值,落在0-2047中
    // buckets[h]为链表头,对每个节点p进行判断,看内容是否与传入参数str相同,直到找到或者p=NULL    
    for (p = buckets[h]; p; p = p->link)    
    { 
        if (len == p->len)       
        {          
            for (i = 0; i < len && p->str[i] == str[i];) //从0开始挨个比对节点p->str中的元素与传入参数str中的元素是否相等,如果相等比对一下个i          {             
            i++;  
        }         
        if (i == len)            
         // 如果i==len,证明p->str中的内容与传入的str完全一致,不用重新new一个,直接返回p->str指针          
        {             
            return p->str;  
        }       
	}        
	// 如果在节点中未找到对应的str内容,则重新分配空间new一个,这里分配了atom原子结构体长度+len+1,atom结钩体是每个节点的表头    
	// 包含struct atom *link, int len和char * str,如果是32位系统则长度是12,可以通过sizeof(*p)或者NELEMS打印确认,    
	// 长度len是传入参数str内容的长度,+1是结尾补充'\0'的分配的1字节空间    
	p = malloc(sizeof (*p) + len + 1);     
	p->len = len;  
	p->str = (char *)(p + 1); 
	// p+1的值刚好是跳过表头12的地址,即之前分配的len+1的空间,用于存储str的内容。    
	if (len > 0)       
	{
	 memcpy(p->str, str, len);   
	}
	
	 
	p->str[len] = '\0';    p->link = buckets[h]; 
	// 将新创建的节点插入到buckets[h]的链表中,插入方式为替换链表head节点,新建单元作为head   
	buckets[h] = p;    
	return p->str;
}
const char *Atom_int(long n) 
{    
    char str[43];// 书中解释了43为魔数,暂时没有去了解,这样的设计思路值得借鉴    
    char *s = str + sizeof(str);    unsigned long m;    
    // 简单一点就是需要处理有符号书,比如char的范围是-128~127,CHAR_MIN=-128 CHAR_MAX=127, 则如果n=-128, m=127+1,然后转换为字符串后再加上‘-’号    // 此处用的是long道理一样,int和char型小于范围小于long,所以如果遇到-128直接执行m=-n;    
    // 符号'-'在do while循环中不好处理,单独通过if(n<0)来判断,补充上符号。    
    if (n == LONG_MIN) 
    {
	    m = LONG_MAX + 1UL;
    }else if (n < 0) 
    {
	    m = -n; 
    }else  
    {
	    m = n;
    }	
    
    do{
	   *--s = m % 10 + '0';  
    }while ((m /= 10) > 0);
    
	if (n < 0)  
    {
        *--s = '-';
    }	
	    
	return Atom_new(s, (str + sizeof(str) - s));
}
	// string类型的new,简单不解释
const char *Atom_string(const char *str) 
{    
	assert(str);    
	return Atom_new(str, strlen(str));
}
	// 遍历查找对应str的长度,不清楚这样做的含义,为啥直接计算str的长度?
int Atom_length(const char *str) 
{    
    struct atom *p;    
	int i;    
	assert(str);    
	for (i = 0; i < NELEMS(buckets); i++) 
	{
	    for (p = buckets[i]; p; p = p->link)   
	    if (p->str == str)  
        {
	        return p->len;
        }	
	}
	    
	return 0;
}

int main()
{    
	  printf("%d\n",Atom1_length(Atom1_int(10000000)));    
	  return 0;
}


































对于c语言接口网上的资料是少之又少,所以下面这些文字全是我一个字一个字打印上来的希望大家 能对的起我的付出: 现在的程序员都面临大量的关于应用程序接口(Application Programming Interface,API) 的信息,大多数人都会使用API和程序库,并在其所写的每一个应用程序实现它们,但是很少人 会创建或发布新的能广泛应用的API,事实上,程序员似乎倾向与循环使用他们自己的东西,而不 愿意查找,能满足他们要求的程序库,这或许是因为写特定应用程序代码要比查找设计好的API容易。 这里我所提到的是一种基于接口与其实现的设计方法,并且通过对24个接口及其实现的描述详细地演示了这种方法,这些接口涉及到计算机领域的很多知识,其中包括数据结构,算法,字符串处理 和并发程序,这些实现并不是简单的玩具----它们是为了在你们所设计的软件代码中使用而设计的。(当然了我会通过阅读量来看是否继续发下去,人要少了我就没有必要浪费时间了) c编程语言对基于接口设计方法的支持是极少的。 而面向对象的语言,如c++,Modula-3,则鼓励将接口实现分离,基于接口的设计独立与任何特定 的语言,但是它要求程序员对像c一样的语言有更多的驾驭能力和更高的警惕性,因为这类语言很容易破坏带有隐含实现信息的接口,反之亦然。 然而一但掌握了基于接口的设计方法,就能够在服务于众多应用程序的通用接口基础上建立应用程序,从而加速开发,在一些c++环境中的基础类库就体现了这种效果。 增加对现有软件的重用---接口实现库,能够减少初始开发成本,同时还能减少维护成本,因为应用程序的更多部分都建立在经过良好测试的通用接口实现上,这里我提到的接口是针对数据结构的,但它并不是数据结构,我重点将放在算法引擎----包装数据结构以供应用程序使用----而不在数据结构算法本身,接口的示例和实现都以literate程序的方式给出,换句话说就是源代码及其解释是按照最适合理解代码的顺序交织出现的。 下面我将我想要给大家讲的内容分一下类: 基础 1,接口实现 2,异常与断言 3,内寸管理 4,进一步内寸管理 数据结构 5,链表 6,表格 7,集合 8,动态数组 9,序列 10,环 11,位向量 字符串 12,原子 13,格式化 14,低级字符串 15,高级字符串 算法 16,扩展精度算法 17,任意精度算法 18,多精度算法 线程 19,线程 建议: 看到这里的朋友我相信对c语言都有了很长时间的学习 如果你还没有搞懂c语言的全部内容,我强烈建议你先别看这里
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值