04-位、字节、字符与编码
位(Bit)、字节(Byte)、字符(Character)和编码(Encoding)基础概念讲解
位(Bit):
- 位是计算机存储和处理信息的最小单位,表示一个二进制数字,可以是0或1。
- 位是构建更大数据单位的基础。
字节(Byte):
- 字节是由8个位组成的数据单位,是计算机存储的基本单位。
- 1字节 = 8位。
字符(Character):
- 字符是文本的基本单位,代表字母、数字、标点符号等。
- 字符的存储大小取决于所使用的编码系统。例如,在ASCII编码中,一个英文字符占用1个字节;而在UTF-8编码中,英文字符占用1个字节,而中文字符可能占用3个字节。
编码(Encoding):
- 编码是将字符映射到字节序列的规则或标准。
- 不同的编码方式可以支持不同数量的字符和语言。例如:
- ASCII编码:使用7位(实际上是8位,但最高位未使用)来表示字符,可以表示128个不同的字符,主要支持英语字符。
- UTF-8编码:是一种变长编码方式,可以使用1到4个字节来表示一个字符,支持世界上几乎所有的书写系统。