C语言编程常见问题解答之位(bit)和字节(byte)

C语言编程常见问题解答之位(bit)和字节(byte),第1张

C语言编程常见问题解答之位(bit)和字节(byte),第2张

比特是指二进制中的一位,是信息的最小单位。位的使用可以从两个方面来分析:第一,计算机位值可以有多种解释,例如“是”或“否”,或者磁盘是否已插入驱动器,或者是否按下了鼠标键;其次,将几个比特的值连接起来后,可以表示更复杂的数据,每增加一个比特,可以表示的可能值的数量就会增加一倍。
换句话说,一个比特可以代表两个可能的值,即“0”和“1”;两位数可以代表2×2或4个可能值,即“00”、“01”、“10”、“11”;类似地,三位可以代表2×2×2或8个可能的值。对于计算机来说,比特的这种特性不仅是最有力的支持——因为复杂的数据(比如这本书的内容)可以分解成比特来存储,同时也是一种限制——因为在现实生活中,很多东西的值是不准确的,这样的值无法用有限的比特数来表示。
程序员必须知道每一项数据需要用多少位来表示。因为比特作为一个单位太小,为了方便起见,大多数计算机处理的信息的单位是一个比特块,称为字节。一个字节是大多数计算机中最小的可寻址信息单位,这意味着计算机为每个字节的信息分配一个地址,一次只能访问一个字节的信息。一个字节中的位数可以是任意的,并且在不同的计算机中是不同的。最常见的情况是每个字节有8位,即可以存储256个不同的值。8位的长度非常适合于存储代表ASCII(美国信息交换标准码)字符的数据。
下面的程序可以显示空之后的ASCII字符和PC的图形字符集:
# include
void main(void);
void main()
{
/"显示ASCII字符集"/
无符号字符空格= ' ';/*以空格开头
char =仅8位*/
int CTR = 0;
printf(" ASCII字符\ n ")& raquo;
printf(" = = = = = = = = = = = = = = = = = = \ n ");
for(CTR = O;ctr + space printf("%c ",CTR+space);
printf(" \ n ");
}

请注意,变量ctr必须是int类型,而不能是char类型,因为char类型只含8位,只能存放从0至255之间的值(signed char类型只能存放从-128至127之间的值)。如果ctr是char类型,它就永远不会存放256或比256更大的值,程序也就永远不会结束。此外,如果你在非PC机的计算机上运行上述程序,那么程序所打印的非ASCII字符可能会导致乱屏。
因为计算机是以字节块的方式工作的,所以大多数程序也以这种方式工作,有时,考虑到要存放的数据项的数目,或者移动每一位的信息所需的时间,节省内存空间就显得很有必要。
这时,我们通常会用少于一个字节的空间来存放那些只有少数可能值的数据,这也就是本章要讨论的主要内容。
10.1 用什么方法存储标志(flag)效率?
标志的作用是对程序执行过程中的两种或更多种选择作出决定。例如,在执行MS-DOS的dir命令时,可以用“/w”标志使该命令在屏幕上显示若干列文件名而不是每行只显示一个文件名。在3.5中你可以看到另外一个例子,该例通过一个标志从两种可能类型中选择一种在一个联合中使用。因为一个标志一般只有少数几个(通常是两个)值,所以,为了节省内存空间,通常不会将一个标志存放在一个属于它自己的int或char类型中。
存储标志值的效率是存储空间和存取速度之间的一种折衷。存储空间利用效率的存储方法是用数目足够的位来存储标志值的所有可能值,但大多数计算机不能直接寻址内存中单独的一位,因此标志值要从存放它的字节中提取。存取速度最快的存储方法是将每个标志值都存放到一个属于它自己的整型变量中,但是,当一个标志只需要一位存储空间而变量的长度为32位时,那么其余的31位就全部浪费掉了,因此这种方法的存储空间利用效率非常低。
如果标志的数目不多,那么使用哪种存储方法是没有关系的。如果标志的数目很多,那么将它们压缩存储在一个字符数组或整型数组中。这时,需要通过一种被称为位屏蔽(bit masking)的过程来提取这些标志值,即屏蔽掉不需要的位,只处理所需的位。
有时,为了节省存储空间,可能会将一个标志和另外一个值存放在一起。例如,如果一个整型的值小于整型所能表示的值,那么就可用它的高阶位来存放标志;如果某些数据总是2或4的倍数,那么就可用它的低阶位来存放标志。在3.5的例子中,就使用了一个指针的低阶位来存放一个标志,该标志的作用是从两种可能的类型中选择一种作为该指针所指向的对象类型。
请参见:
10.2什么是“位屏蔽(bit masking)”?
10.3位域(bit fields)是可移植的吗?
10.4移位和乘以2这两种方式中哪一种更好?
10.2 什么是“位屏蔽(bit masking)”?
位屏蔽的含义是从包含多个位集的一个或一组字节中选出指定的一(些)位。为了检查一个字节中的某些位,可以让这个字节和屏蔽字(bit mask)进行按位与操作(C的按位与运算符为&)——屏蔽字中与要检查的位对应的位全部为1,而其余的位(被屏蔽的位)全部为0。例如,为了检查变量flags的最低位,你可以让flags和最低位的屏蔽字进行按位与操作:
flags&1;
为了置位所需的位,可以让数据和屏蔽字进行按位或操作(C的按位或运算符为|)。例如,你可以这样置位flags的最低位:
flags = flags | 1;
或者这样:
flags |= 1;
为了清除所需的位,可以让数据和对屏蔽字按位取反所得的值进行按位与操作。例如,你可以这样清除flags的最低位:
flags = flags& ~1;
或者这样:
flags&=~1 ;
有时,用宏来处理标志会更方便,例10.2中的程序就是通过一些宏简化了位操作。
例10.2 能使标志处理更方便的宏
/* Bit Masking * /
/ * Bit masking can be used to switch a character
between lowercase and uppercase * /
#define BIT_POS(N) ( 1U «(N) )
#define SET_FLAG(N,F) ( (N) | = (F) )
#define CLR_FLAG(N,F) ( (N) &= - (F) )
#define TST_FLAGCN,F) ( (N) & (F) )
#define BIT_RANGE(N,M) ( BIT_POS((M) + 1- (N))-1

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » C语言编程常见问题解答之位(bit)和字节(byte)

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情