如果遇到 '\\xe4\\xb8\\xad\\xe5\\x9b\\xbd' 这样的utf-8 escape字符串，并且不是在代码里，而是从别的地方获取的，无法更改，就需要特殊的解码方式。

在 Python2 中，可以直接用 decode("string_escape") 解决，但是 Python 3 中 str 类型无法 decode ，那么怎么办呢？

方法

In [2]:

s = r'\xe4\xb8\xad\xe5\x9b\xbd'

c = s.encode().decode('unicode-escape').encode('raw_unicode_escape').decode('utf-8')

print(c)

中国

没错，decode('unicode-escape')之后，字符串实际上变成了'\xe4\xb8\xad\xe5\x9b\xbd'，就可以用常规的.encode('raw_unicode_escape').decode('utf-8')解决。

第二种方法代码如下：

In [1]:

s = r'\xe4\xbd\xa0\xe5\xa5\xbd'
eval("print('"+s+"'.encode('raw_unicode_escape').decode('utf-8'))")

你好

写成函数：

In [2]:

def getUtf8Escape(s):
    return eval("'"+s + "'.encode('raw_unicode_escape').decode('utf-8')")

print(getUtf8Escape(s))

你好

复制代码，简单粗暴的方法，但确实有效。顺带一提，如果是Unicode的escape字符串，或者没有\\转义的utf-8，其实很简单。

Unicode明文：

In [4]:

a = r'\u8bf7'
b = a.encode().decode("unicode_escape")
print(b)

请

In [5]:

#utf-8
a = '\xe4\xbd\xa0\xe5\xa5\xbd'
b = a.encode('raw_unicode_escape').decode('utf-8')
b

Out[5]:

'你好'

① 阅读使用手册