Just water water...

Adj325

常见编码问题解决方法

搜索

Just water water...

常见编码问题解决方法

发布于：2018-02-03 21:16:24 标签：/ Python / 编码 / 访问：

常见编码问题解决方法

字节对象

常见的解决方法是, 轮询可能编码, 进行解码
详见：
- 编码探讨: 该以什么编码打开”gb2312”文本?

编码文本

\u
1
2
3
4
5
# python3
'\u4f60\u597d'.encode('unicode-escape').decode('unicode-escape')

# python2
'\u4e2d'.decode('unicode-escape'')
详见:
- Python3 使用 unicode-escape 处理 unicode 16进制字符串编解码问题
- Python编程-字符串的编码转换、存储及乱码问题

\x

# python3: 
'\xe4\xb8\xad'.encode('raw_unicode_escape').decode('utf-8')

# python2: 
s = '\xe4\xb8\xad'
b = repr('\xe4\xb8\xad')
unicode(eval(b),"gbk")

详见:

Python入门：input获取\xe4\xb8\xad字符正确解码

URL编码与解码

python2/3
- urllib.quote(string[, safe])：对字符串进行编码。参数 safe 指定了不需要编码的字符
- urllib.unquote(string) ：对字符串进行解码
- encooding：指定编码, 默认UTF-8