第二章
信息存储
(1)
多数计算机以一个字节作为最小可寻址的存储器单元。
机器级程序将存储器看成一个非常大的字节数组,称为虚拟存储器。
存储器的每个字节都由唯一的数字标识,称为它的地址。
所有可能地址的集合称为虚拟地址空间。
扩充:C语言中一个指针的值,无论它是指向一个整数,一个结构或是某个其他程序的对象,都是指针指向的存储块的第一个字节的虚拟地址。
C编译器还将每个指针和类型信息联系起来,这样就可以根据指针值的类型,生成不同的机器级代码来访问存储在指针指向位置的值,尽管如此,它生成的实际机器级程序并不包含指针类型信息,每个程序对象可以简单地视为一个字节块,程序本身就是一个字节序列。
(2)
字长:指明整数和指针数据的标称大小,由硬件决定。
决定虚拟地址空间的最大大小,因为虚拟地址空间是以一个字编码的。
(3)
char以存储文本串中的但个字符而得名,但也可以存储整数值。
Test:char s = x; //x∈[-128,127]正常整数值,其余截断显示数值
unsigned char s = x; //x∈[0,255)正常整数值,其余截断显示数值
程序员应该力图增强程序的可移植性,可移植的一个方面就表现在使程序对不同的数据类型的确切大小不敏感。
(4)
对于跨字节的程序对象,必须建立两个规则:一这个对象的地址是什么,二在存储器中如何让排列这些字节。
小端:低数据放在低地址。
大端:低数据放在高地址。
目前比较新的处理器使用 双端法 。
%.2x表示整数必须要用至少两个数字的十六进制格式输出。
十进制数字 X 的ASCII码正好是 0x3X。
ASCII码作为字符码在任何系统上都将得到相同的结果,与字节顺序和字大小顺序无关,因而,文本数据比二进制数据具有更强的平台独立性。
不同的机器类型,不同的操作系统,使用不同的且不兼容的指令和编码方式,因此二进制代码是不兼容的。
(5)
位向量:长度为W的0,1串。eg:a = [01010011] w = 8
位向量可用来表示有限的集合。用[Ai,A(i-1),...A1,A0]表示集合B{0,1,2,....i},当且仅当Ai = 1.使用这种编码集合,|和&等同于并和交。
eg:a = [01010001]表示集合A={0,4,6};
b = [01110110]表示集合B={1,2,4,5,6};
(6)
逻辑运算认为:0表示False,其余均表示1.
eg:!0x41 = 0 !0x00 = 1
逻辑运算对第一个参数求值能确定表达式结果时,不再对第二个参数求值。
(7)
移位运算,从左至右 结合。
特殊:算数右移K位,是在移出的K个高位补移动前最高位的数值。(对有符号整数的运算十分有用)
C标准并未明确定义应该使用哪种类型的右移。
对无符号数据,右移必须是逻辑右移。
实际中,几乎所有编译器都对有符号数采用算数右移。
当移位数K > 字长M,C标准规定,位移量为K % M,但也要尽量使移位量小于字长。
整数表示
尽管C语言标准并未指定有符号数采用哪种(原码,补码,反码)表示,但是几乎所有的机器都使用补码表示。
C库<limits.h>中定义了一组常量,来限定编译器运行的这台机器上不同整型数据类型的取值范围。
C语言有无符号数值转换的原则是,底层的位表示保持不变。
扩展:
有符号短数据SS---》无符号长数据UL:先将SS转换成有符号长数据SL,再将SL转换成UL.即先扩展大小再改变符号
eg:short s = x;
unsigned int p = s; //等价于 p = ( unsigned ((int)s) )
测试:
截断:
长数据L---》短数据S,进行位截断。
无符号数的截断为:L % (S类型的最大值)
有符号数:不仅数值大小可能变化,符号位也可能发生改变。
这两天虽然没有多大的进步,但是看了书就会觉得日子过得充实一些,希望每一天都能有一定的小进步,二叉树的C++版实现了,但是使用迭代器实现非递归遍历没有成功,明天早上一天的课,早点休息了~晚安了,亲爱的自己~哈哈哈~