有符号数处理

在计算机运算中，有符号数的表示（英语：signed number representations）需要将负数编码为二进制形式。

在数学中，任意基数的负数都在最前面加上“−”符号来表示。然而在计算机硬件中，数字都以无符号的二进制形式表示，因此需要一种编码负号的方法。当前有四种方法，用于扩展二进制数字系统，来表示有符号数：原码（sign-and-magnitude）、反码（ones' complement）、补码（two's complement）以及移码（offset binary，excess-N）。

原码

8位原码
二进制	符号及值	无符号
00000000	+0	0
00000001	1	1
...	...	...
01111111	127	127
10000000	−0	128
10000001	−1	129
...	...	...
11111111	−127	255

符号及值（sign & magnitude）的处理办法是分配一个符号位（sign bit）来表示这个符号：设置这个位（通常为最高有效位）为0表示一个正数，为1表示一个负数。数字中的其它位指示数值（或者绝对值）。因此一个字节只有7位（除去符号位），数值的范围从0000000（0）到1111111（127）。这样当你增加一个符号位（第八位）后，可以表示从−127₁₀到+127₁₀的数字。这种表示法导致的结果就是可以有两种方式表示零，00000000（0）与10000000（−0），这大大增加数字电路的复杂性和设计难度。CPU亦须执行两次比较，来测试运算结果是否为零。

十进制数−43用原码方法编码成八位的结果为10101011。

这种方法被直接比较于常用的符号表示法（放置一个“+”或者“−”在数字的数值之前）。一些早期的二进制电脑（例如IBM 7090）使用这种表示法，也许是由于它与通用用途的自然联系。原码是最常用的表示浮点数的方法。IEEE二进制浮点数算术标准（IEEE 754）采用最高有效位作为符号位，因此可表示正负零及正负无限。

反码

8位反码
二进制值	反码表示	无符号数表示
00000000	+0	0
00000001	1	1
...	...	...
01111101	125	125
01111110	126	126
01111111	127	127
10000000	−127	128
10000001	−126	129
10000010	−125	130
...	...	...
11111110	−1	254
11111111	−0	255

另一方面，一种叫做反码（ones' complement）的系统也可以用于表示负数（注：正数与原码形式一样，无需取反）。一个负数的二进制数反码形式为其绝对值部分按位取反（即符号位不变，其余各位按位取反）。同原码表示一样，0的反码表示形式也有两种：00000000（+0）与11111111（−0）。

举例来说，原码10101011（-43）的反码形式为11010100（−43）。有符号数用反码表示的范围为−(2^N−1−1)到(2^N−1−1)，以及+/−0。一个惯常的八位的字节便是（可表示）−127₁₀到+127₁₀，以及00000000（+0）或者11111111（−0）。

对两个反码表示形式的数字做加法，首先需要进行常规的二进制加法，但还需要在和的基础上加上进位。为什么必须这样呢？来看下面这个−1加上+2的例子。

       二进制    十进制
    11111110     -1
 +  00000010     +2
............    ...
  1 00000000      0   <-- 错误答案
           1     +1   <-- 加上进位
............    ...
    00000001      1   <-- 正确答案

在上面的例子中，二进制加法仅仅得到了00000000，这是一个错误的答案。只有当加上进位时才能得到正确答案（00000001）。

反码这种数字表示系统通常出现在老式的计算机中；PDP-1，CDC 160A，UNIVAC 1100/2200系列以及其它的一些电脑都使用反码算术。

关于正字法（orthography）的评述：这个系统之所以被称作反码（ones' complement）是因为一个正值x的反（表示为按位非x）也可以通过0的反码（ones' complement）表示形式（一长串的1，−0）减去x得到。

Internet协议IPv4，ICMP，UDP以及TCP都使用同样的16位反码检验和算法。虽然大多数计算机缺少“循环进位”硬件，但是这种额外的复杂性是可以接受的，因为“对于所有位（bit）位置上的错误都是同样敏感的”。^[1] 在UDP中，全0表示省略了可选的检验和特性。另外一种表示：FFFF，指示了0的检验和。^[2] （在IPv4中，TCP和ICMP都强制性地规定了检验和，而在IPv6中可以省略）。

注意负数的反码只需按位求数值的补码就可以得到，符号不需要变动。

补码

8位补码
二进制值	补码表示	无符号数表示
00000000	0	0
00000001	1	1
...	...	...
01111110	126	126
01111111	127	127
10000000	−128	128
10000001	−127	129
10000010	−126	130
...	...	...
11111110	−2	254
11111111	−1	255

补码（two's complement）回避了0有多种表示的问题以及循环进位的需要。在补码表示中，负数以位模式表示为正值的反码加1（当作无符号数）。

在补码表示中，只有一个0（00000000）。求一个数的补码（无论是负数还是正数）需要反转所有位，然后加1。一对补码整数相加等价于一对无符号数相加（除了溢出检测，如果能够做到的话）。比如，从旁边的表格可以看出，127与−128的补码表示相加就与无符号数127及128相加具有相同的结果。

从一个正数得到其对应负数的补码的简单方法表示如下：

	例1	例2
1. 从右边开始，找到第一个'1'	0101001	0101100
2. 反转从这个'1'之后开始到最左边的所有位	1010111	1010100

移码

移码（offset binary），是将二进制原码无符号整数所代表的值，减去一个预设值。

标准移码，预设值为二进制原码表示的最大整数的一半。一个数的标准移码和补码，最高位相反，其余各位均相同。

表示方式

下表列出了 4-bit 二进数所能表示的整数：

无符号（unsigned）可表示0到15
符号及值（sign & magnitude）可表示-7到+7，包括-0
反码（ones' complement）可表示-7到+7，包括-0
补码（two's complement）可表示-8到+7，没有±0的问题

二进数	无符号	符号比特	反码	补码
0000	0	0	0	0
0001	1	1	1	1
0010	2	2	2	2
0011	3	3	3	3
0100	4	4	4	4
0101	5	5	5	5
0110	6	6	6	6
0111	7	7	7	7
1000	8	-0	-7	-8
1001	9	-1	-6	-7
1010	10	-2	-5	-6
1011	11	-3	-4	-5
1100	12	-4	-3	-4
1101	13	-5	-2	-3
1110	14	-6	-1	-2
1111	15	-7	-0	-1

参见

参考资料

↑ Braden, R. Computing the Internet Checksum (RFC 1071). The Internet Engineering Task Force. 1988 [2009-06-11].
↑ Postel, J. User Datagram Protocol (RFC 768). The Internet Engineering Task Force. 1980 [2009-06-11].

[1] Braden, R. Computing the Internet Checksum (RFC 1071). The Internet Engineering Task Force. 1988 [2009-06-11].

[2] Postel, J. User Datagram Protocol (RFC 768). The Internet Engineering Task Force. 1980 [2009-06-11].

[1]

[2]