08字符与字符串[中章]

总览

章节目录

ASCII码

我们需要制定一个规则,来表达计算机常用的字符

目前我们常用的字符只有128个,我们可以用7位二进制编码进行存储

$$
2^7=128
$$

但是为了存入计算机[1],我们会在高位补充一个0,成为8位数,方便计算机计算

ASCII表

==可印刷字符

我们可以观察到,数字0-9分别对应48-57

我们把48和57转换成2进制

$$
\overbrace{48}^\text{0011;0000} 到 \overbrace{51}^\text{0011;1001}
$$

可以看到我们数字前面4位统一为0011
而后四位则代表了8421码

字母的关系(不用记忆,仅作为了解)

字母ASCII规则

例题

ASCII码转换示例

汉字编码

GB2312-80编码格式

使用区位码(一个94X94的表格)的形式进行编码,类似坐标一样

区位码

转换规则

为了使GB格式与ASCII编码格式区分,我们统一加上80H,这样我们二进制编码后GB的第一位是1,而ASCII码的第一位永远是0,这样就可以区分编码

区分

输入法的原理
首先是把英文交给国标码,然后处理成汉字内码

输入法图解

字符串是如何在计算机中储存的

1

按字节编制:每个地址对应1B

字符串从低地址向高地址依次存放

存放图解

很多语言中,\0作为字符串的结尾标志,同样也需要存入

存放\0

存放中文

存中文

在所有计算机中,多字节数据都被存放在连续的字节序列中。根据数据中各字节的排列顺序不同,可能

  • “大端模式”、
  • “小端模式”

知识点以及回顾

总结

  1. 32~126,其余为控制,通讯字符==
  2. 可以在电脑上表示出来,或者打印出来的字符


  1. 计算机通常是以8bit进行处理数据 ↩︎


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!