04-位、字节、字符与编码
0x-wen

位(Bit)、字节(Byte)、字符(Character)和编码(Encoding)基础概念讲解

位(Bit):

  • 位是计算机存储和处理信息的最小单位,表示一个二进制数字,可以是0或1。
  • 位是构建更大数据单位的基础。

字节(Byte):

  • 字节是由8个位组成的数据单位,是计算机存储的基本单位。
  • 1字节 = 8位。

字符(Character):

  • 字符是文本的基本单位,代表字母、数字、标点符号等。
  • 字符的存储大小取决于所使用的编码系统。例如,在ASCII编码中,一个英文字符占用1个字节;而在UTF-8编码中,英文字符占用1个字节,而中文字符可能占用3个字节。

编码(Encoding):

  • 编码是将字符映射到字节序列的规则或标准。
  • 不同的编码方式可以支持不同数量的字符和语言。例如:
    • ASCII编码:使用7位(实际上是8位,但最高位未使用)来表示字符,可以表示128个不同的字符,主要支持英语字符。
    • UTF-8编码:是一种变长编码方式,可以使用1到4个字节来表示一个字符,支持世界上几乎所有的书写系统。
由 Hexo 驱动 & 主题 Keep
总字数 41.3k