常见编码问题解决方法
字节对象
- 常见的解决方法是, 轮询可能编码, 进行解码
- 详见:
编码文本
\u
1
2
3
4
5# python3
'\u4f60\u597d'.encode('unicode-escape').decode('unicode-escape')
# python2
'\u4e2d'.decode('unicode-escape'')详见:
\x
1
2
3
4
5
6
7# python3:
'\xe4\xb8\xad'.encode('raw_unicode_escape').decode('utf-8')
# python2:
s = '\xe4\xb8\xad'
b = repr('\xe4\xb8\xad')
unicode(eval(b),"gbk")详见:
URL编码与解码
- python2/3
- urllib.quote(string[, safe]):对字符串进行编码。参数 safe 指定了不需要编码的字符
- urllib.unquote(string) :对字符串进行解码
- encooding:指定编码, 默认UTF-8