08字符与字符串[中章]
总览
ASCII码
我们需要制定一个规则,来表达计算机常用的字符
目前我们常用的字符只有128个,我们可以用7位二进制编码进行存储
$$
2^7=128
$$
但是为了存入计算机[1],我们会在高位补充一个0,成为8位数,方便计算机计算
==可印刷字符
我们可以观察到,数字0-9分别对应48-57
我们把48和57转换成2进制
$$
\overbrace{48}^\text{0011;0000} 到 \overbrace{51}^\text{0011;1001}
$$
可以看到我们数字前面4位统一为0011
而后四位则代表了8421码
字母的关系(不用记忆,仅作为了解)
例题
汉字编码
GB2312-80编码格式
使用区位码(一个94X94的表格)的形式进行编码,类似坐标一样
为了使GB格式与ASCII编码格式区分,我们统一加上80H,这样我们二进制编码后GB的第一位是1,而ASCII码的第一位永远是0,这样就可以区分编码
输入法的原理
首先是把英文交给国标码,然后处理成汉字内码
字符串是如何在计算机中储存的
按字节编制:每个地址对应1B
字符串从低地址向高地址依次存放
很多语言中,\0
作为字符串的结尾标志,同样也需要存入
存放中文
在所有计算机中,多字节数据都被存放在连续的字节序列中。根据数据中各字节的排列顺序不同,可能
有
- “大端模式”、
- “小端模式”
知识点以及回顾
计算机通常是以8bit进行处理数据 ↩︎
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!