ppcq.net
当前位置:首页 >> python编码转换 >>

python编码转换

1、python2与python3稍微有点区别 2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码 3、将unicode转换成中文,只需要用deconde解码就可以了 >>> u='欢迎' >>> e=u.encode() >>> e b'\xe6\xac\xa2\xe8\xbf\x8e' >>>

java中字符串转码,根据实际运用的环境有以下三种方式 1. 使用java.lang.string这是最常用的方法,先用对应编码获取字节,然后重新构造新编码,示例代码如下:string s = "清山"; byte[] b = s.getbytes("utf-8");//编码 string sa = new string(

coding声明的编码,和你py文件本身的编码,要一致.你py代码中,所要处理的字符串,即你的html的编码,你也要清楚然后才可以正常的,decode或encode,才能得到你要的unicode字符串,某种编码的字符串.你没有解释清楚你的背景,所以没法帮你.相关的原理和示例代码,我早就写了教程了.感兴趣的,自己google搜:【整理】关于HTML网页源码的字符编码(charset)格式(GB2312,GBK,UTF-8,ISO8859-1等)的解释Python专题教程:字符串和字符编码其中有很多相关内容的解释,比如:【总结】Python 2.x中常见字符编码和解码方面的错误及其解决办法

有,b = [i.decode("utf8") for i in a]这样你转换后的b就是你想要的列表了,输出都是u'\'之类的unicode编码了注意, decode里面的参数我默认你是utf8的,如果报错了你可以换gbk或者不填

A. Usage decode/encode:def utf2gbk(s): ''' 按utf-8解码,再按gbk编码 ''' return s.decode('utf-8').encode('gbk')with open(fname) as handle: for ln in handle: print utf2gbk(ln)B. Usage codecs:import codecsenv_coding='gbk' # 设置一个系统环境编码

供参考.gb312本来就是标准ascii的一种扩充,ascii可以视同为gb312的子集.所以,如果var的值全部是在ascii里面的话,转成gb312后也还是属于ascii,所以使用detect函数的时候,编码还是ascii(当然同时也属于gb312);如果var的值不是全部在ascii里面的话,语句var = var.decode('ascii')可能会出错.只要var的值是英文(内码0-127),转换不转换,都已经是gb2312编码.

>> import urllib>>> urllib.quote('中文')'%e4%b8%ad%e6%96%87'>>> urllib.unquote('%e4%b8%ad%e6%96%87')'\xe4\xb8\xad\xe6\x96\x87'>>> print urllib.unquote('%e4%b8%ad%e6%96%87')中文然后你自己chdir()试试吧 如果不行,可能要转换成unicode先s = urllib.unquote('%e4%b8%ad%e6%96%87')uni = str.decode(s)os.chdir(uni)

比方说你的字符串变量为 str,可以尝试使用 str.decode('gb2312') 进行转换

你的代码里看不到要转编码吗,不过从你报错信息来看,在第一行加上一句:# coding:gbk 即可解决.

python的默认的编码是ascii: 指的是你写代码默认是编码是ascii 编码的, 当然你也可以改成你想要的编码,比如在开头写个注释就用utf8编码 # -*-coding:UTF-8-*- 字符串在Python内部的表示是unicode编码: 这个是python 3 以后才是这样的吧,

网站首页 | 网站地图
All rights reserved Powered by www.ppcq.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com