python——字符编码

本文介绍了字符编码的基础知识,包括字符编码的历史发展,如ASCII、GBK、Shift_JIS、EUC-KR和Unicode(UTF-8)。重点讲解了Unicode的产生背景和作用,以及在Python中处理字符编码的实操技巧,包括解决乱码问题、Python2和Python3的编码差异,以及编码解码的过程。

在这里插入图片描述

字符编码

字符编码简介

由于计算机内部只识别二进制,但是用户(全球人类)在使用计算机的时候可以看到各式各样的语言,所以这中间必须对不同语言进行‘翻译’,计算机才能识别,这个翻译的标准就是字符编码表,数字和字符一一对应。

‘翻译’过程

  • 用户 → 计算机 → 用户
  **字符 → 数字 (01二进制)→ 字符**

字符串编码发展史

👉[ASCII](ASCII_百度百科 (baidu.com)

1.ASCII码

计算机最初是由美国人发明的,美国人为了能狗让计算机识别英文字符,发明了ASCII码,里面记录了英文与数字对应关系。如下图:

在这里插入图片描述

  • 所由英文字符和符号加起来不超过127个
  • 使用八位表示是为了后续发现新的语言
字符对应关系
  • A-Z:65-90
  • a-z:97-122

在python中,用ord()方法查看字符对应的数字(十进制)

在这里插入图片描述

2.汉字编码 ——GBK

为了让计算机能够识别中文,发明了另外一套编码,GBK
GBK编码表记录了中文英文与数字的对应关系。

  • GBK对于英文使用一个字节
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值