Skip to content
难度基础(★)
建议时长45分钟
本课难点
  • “数码/基数/位权”三概念的区分(题干常混用)
  • bit/Byte/Word 与编址粒度(字节编址、字编址)的对应关系
  • ASCII/Unicode(UTF-8 等)在“定长/变长、兼容性”上的差异点
  • 进制与码制的区别:进制解决“表示”,码制解决“符号与运算规则”

1.1.1 数据的表示概述

本课核心知识点整理
本课核心知识点手绘流程图(SVG)

本节导学:数据表示是后面所有计算题的地基

课程开头先提醒:这一章不是孤立的概念题,而是后面主存编址、IP 地址、补码读值、浮点运算、逻辑表达式判断的共同基础。计算机和人最大的差别在于:人可以直接理解十进制、文字、图片和声音;机器最终只能稳定地区分电信号的两种状态,也就是 01

因此,“数据表示”要解决的不是“把十进制换成二进制”这么窄的问题,而是下面这条链路:

text
现实信息
  ↓ 编码规则
0/1 序列
  ↓ 固定字长、位权、码制、格式
可存储、可传输、可运算的数据

1. 为什么所有信息都要落到 0/1

硬件层面最可靠的状态通常是两态:高/低电平、通/断、磁化方向等。二进制不是因为“人喜欢 0 和 1”,而是因为工程实现稳定、抗干扰、逻辑电路简单。

信息类型人的理解方式机器内部最终形式典型考点
数值253.14二进制整数、定点数、浮点数进制转换、码制、浮点
字符A字符编码后的二进制ASCII、Unicode、UTF-8
图像像素或图形对象像素矩阵或矢量描述位图、矢量图、容量计算
声音连续声波采样、量化、编码后的数据采样频率、量化位数
条件判断真/假1/0 或布尔值逻辑运算、短路求值

这也是为什么本节后面会依次引出进制、码制、浮点数和逻辑运算:它们都在回答“0/1 这串东西到底如何解释”。

2. 进制:解决数值怎样写

进制解决的是“一个数值用什么基数展开”。十进制是人类日常习惯,二进制适合硬件,十六进制适合压缩展示长二进制串。

(ana1a0)r=anrn++a1r+a0

这里 r 是基数,ai 是数码,ri 是位权。课程里提到主存编址和 IP 地址计算,就是因为这些题常常要在十进制、二进制、十六进制之间来回切换。

场景为什么会用到进制转换
主存编址地址常用十六进制给出,本质要按二进制位数计算容量
IP 地址与子网表面是点分十进制,掩码和网络号计算必须落到二进制
机器码/补码读值十六进制机器数要先拆成二进制,再按码制解释

3. 码制:解决正负号和机器运算

二进制只提供数码,不天然提供“正负号”。如果简单把最高位当符号位,就得到原码,直观但运算麻烦;继续发展出反码、补码、移码,是为了让固定字长里的负数更适合硬件处理。

问题进制能否解决需要码制解决的点
数字 1010 是多少可以,按基数和位权解释不涉及正负
1000 0000128 还是 -128不够要看题目说原码、补码还是移码
计算机如何统一做加法和减法不够补码让减法转成加法

所以“进制”和“码制”不要混:进制回答数值如何展开,码制回答固定字长的二进制串如何表示符号、范围和运算规则。

4. 浮点数:解决范围与精度的权衡

定点整数和定点小数的小数点位置固定,表示简单,但表达范围受限制。浮点数借用了科学计数法思想:

V=M×RE

其中 M 是尾数,R 是基数,E 是阶码。软考里最重要的两个判断是:

字段负责什么常见考法
阶码控制数量级,决定表示范围“范围由谁决定”
尾数保存有效数字,决定精度“精度由谁决定”

后面 1.1.4 会展开对阶、尾数运算和规格化。本节只要先建立大方向:浮点数不是更“准确”的表示,而是在有限位宽下用近似换取更大的范围。

5. 逻辑运算:解决真假判断和位级处理

课程最后提到逻辑运算,是因为程序设计离不开条件判断。算术运算处理数值大小,关系运算得到真假,逻辑运算再组合多个真假条件。

text
算术运算:a + b、a * b
关系运算:a > b、a == b
逻辑运算:(a > b) && (c != 0)

二进制里的 01 既可以表示数,也可以表示假和真。写程序时的 ifwhile,底层都要落到这种真假判断;做位运算时,还会把多个二进制位逐位进行与、或、异或等操作。

6. 本节学习路线

后续小节本节先建立的理解学习时要抓的主线
1.1.2 进制转换二进制与十六进制是考试计算工具位权、除基取余、分组转换
1.1.3 码制同一串二进制要按规则解释原码到补码的技术取舍
1.1.4 浮点数范围和精度不能同时无限提高阶码决定范围,尾数决定精度
1.1.5 逻辑运算程序条件也要落到真假值优先级、短路、按位运算

本节的核心结论是:机器只能处理 0/1,但 0/1 本身没有意义;真正有意义的是“解释规则”。进制、码制、浮点格式和逻辑规则,就是软件设计师考试里最常用的几类解释规则。

🧪 例题(按难度)

简单(3题)

单选
在计算机中,`Byte` 与 `bit` 的关系是:
单选
ASCII 码中,大写字母 `A` 的十六进制码值是:
单选
在软考存储容量题中,通常采用二进制计量:1GB 等于:

中级(3题)

单选
下列关于字符编码的说法正确的是:
单选
音频数字化过程包含采样、量化、编码三步。其中“把连续幅度离散为有限等级”的步骤是:
单选
关于位图与矢量图,下列说法正确的是:

困难(1题)

单选
一幅 `1024×768` 的彩色位图,采用 24 位真彩色(无压缩),其数据量约为:

📚 本课小结

  1. 数据表示:将现实信息转换为二进制形式
  2. 数制系统:二、八、十、十六进制及其转换
  3. 存储单位:bit、Byte、KB、MB、GB的关系
  4. 字符编码:ASCII和Unicode的特点
  5. 多媒体:图像、音频的数字化原理

💡 学习提示

数据表示是计算机科学的基础,理解这些概念对后续学习至关重要。建议:

  1. 多做进制转换练习
  2. 了解常用ASCII码值
  3. 理解数字化的基本原理
  4. 关注实际应用场景