这几年有幸接触了网络,对于“乱码”这个问题,我觉得不外乎“编码不对”这么个原因了。
不知该说“众所周知”,还是该说“我们不得不面对这样一个事实”,是的,真正意义上的技术人才是老外们,由于历史的原因,游戏规则向来是他们定。所以,出现乱码,十有八九是因为它们没考虑到中文字符,谁让他们本来就不懂呢?当然,偶尔会是简、繁体字符编码相互之间的冲突。
了解了这个背景,出现乱码也就不足为奇了。解决办法就是换一个字符编码:网页乱码自然是在浏览器里更改设置,如果是装进电脑的游戏或者应用软件,那就要进控制面板进行调整了。
最后,像我这种外行,只要知道各字符集间的关系是UTF-8>GB18030>GBK>GB2312就行了,一般用UTF-8能正常解码出原先的乱码,当然,用最匹配的编码能解决得更加完美。另外,网页源代码里的“charset”就是字符编码设置了,等于号之后就是真相。
中国的网站,绝大部分就三种编码,UTF-8、GBK、GB2312,其中以GB2312巨多。小弟不久前写过一篇文章,介绍这三种编码的不同,可供扩展阅读哈http://www.qianxingzhem.com/archives/464
学习了,以前一直没去追究过编码出现的源头,还有2312这个确实强大。
本来想在你的页面留言的,但是你那边似乎没有邮件提醒;上次的留言也是后面跑过去看的……