pythonjson.dumps中文亂碼問(wèn)題解決

json中文亂碼

json.dumps(var,ensure_ascii=False)并不能解決中文亂碼的問(wèn)題

json.dumps在不同版本的Python下會(huì)有不同的表現(xiàn)，注意下面提到的中文亂碼問(wèn)題在Python3版本中不存在。

注:下面的代碼再python2.7版本下測(cè)試通過(guò)

#-*-coding:utf-8-*-

odata={'a':'你好'}

printodata

結(jié)果：

{'a':'\xe4\xbd\xa0\xe5\xa5\xbd'}

printjson.dumps(odata)

結(jié)果：

{"a":"\u4f60\u597d"}

printjson.dumps(odata,ensure_ascii=False)

結(jié)果：

{"a":"浣犲ソ"}

printjson.dumps(odata,ensure_ascii=False).decode('utf8').encode('gb2312')

結(jié)果：

{"a":"你好"}

要解決中文編碼，需要知道python2.7對(duì)字符串是怎么處理的：

由于#--coding:utf-8--的作用，文件內(nèi)容以u(píng)tf-8編碼，所以printodata

輸出的是utf-8編碼后的結(jié)果{‘a(chǎn)’:‘\xe4\xbd\xa0\xe5\xa5\xbd’}

json.dumps序列化時(shí)對(duì)中文默認(rèn)使用的ascii編碼，printjson.dumps(odata)輸出unicode編碼的結(jié)果

printjson.dumps(odata,ensure_ascii=False)不使用的ascii編碼，以gbk編碼

‘你好’用utf8編碼是%E4%BD%A0%E5%A5%BD用gbk解碼是浣犲ソ

字符串在Python內(nèi)部的表示是unicode編碼。

因此，在做編碼轉(zhuǎn)換時(shí)，通常需要以u(píng)nicode作為中間編碼，即先將其他編碼的字符串解碼(decode)成unicode，再?gòu)膗nicode編碼(encode)成另一種編碼。

decode的作用是將其他編碼的字符串轉(zhuǎn)換成unicode編碼

decode(’utf-8’)表示將utf-8編碼的字符串轉(zhuǎn)換成unicode編碼。

encode的作用是將unicode編碼轉(zhuǎn)換成其他編碼的字符串

encode(‘gb2312’)，表示將unicode編碼的字符串轉(zhuǎn)換成gb2312編碼。

python3中沒(méi)有這種問(wèn)題，所以最簡(jiǎn)單的方法是引入__future__模塊，把新版本的特性導(dǎo)入到當(dāng)前版本

from__future__importunicode_literals

printjson.dumps(odata,ensure_ascii=False)

結(jié)果

{"a":"你好"}

在寫(xiě)入文件的時(shí)候出現(xiàn)了Python2.7的UnicodeEncodeError:‘a(chǎn)scii’codeccan’tencode異常錯(cuò)誤

大神的解決方法：

不使用open打開(kāi)文件，而使用codecs：

from__future__importunicode_literals

importcodecs

fp=codecs.open('output.txt','a+','utf-8')

fp.write(json.dumps(m,ensure_ascii=False))

fp.close()

以上內(nèi)容為大家介紹了解決python中json.dumps中文亂碼問(wèn)題，希望對(duì)大家有所幫助，如果想要了解更多Python相關(guān)知識(shí)，請(qǐng)關(guān)注 IT培訓(xùn)機(jī)構(gòu):千鋒教育。

久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

解決python中json.dumps中文亂碼問(wèn)題