VC++ 下处理 UTF8 编码的字符串

void UTF8toANSI(CString &strUTF8)
{
//获取转换为多字节后需要的缓冲区大小，创建多字节缓冲区
UINT nLen = MultiByteToWideChar(CP_UTF8,NULL,strUTF8,-1,NULL,NULL);
WCHAR *wszBuffer = new WCHAR[nLen+1];
nLen = MultiByteToWideChar(CP_UTF8,NULL,strUTF8,-1,wszBuffer,nLen);
wszBuffer[nLen] = 0;

nLen = WideCharToMultiByte(936,NULL,wszBuffer,-1,NULL,NULL,NULL,NULL);
CHAR *szBuffer = new CHAR[nLen+1];
nLen = WideCharToMultiByte(936,NULL,wszBuffer,-1,szBuffer,nLen,NULL,NULL);
szBuffer[nLen] = 0;
strUTF8 = szBuffer;
//清理内存
delete []szBuffer;
delete []wszBuffer;
}
//ANSI转UTF8
void ANSItoUTF8(CString &strAnsi)
{
//获取转换为宽字节后需要的缓冲区大小，创建宽字节缓冲区，936为简体中文GB2312代码页
UINT nLen = MultiByteToWideChar(936,NULL,strAnsi,-1,NULL,NULL);
WCHAR *wszBuffer = new WCHAR[nLen+1];
nLen = MultiByteToWideChar(936,NULL,strAnsi,-1,wszBuffer,nLen);
wszBuffer[nLen] = 0;
//获取转为UTF8多字节后需要的缓冲区大小，创建多字节缓冲区
nLen = WideCharToMultiByte(CP_UTF8,NULL,wszBuffer,-1,NULL,NULL,NULL,NULL);
CHAR *szBuffer = new CHAR[nLen+1];
nLen = WideCharToMultiByte(CP_UTF8,NULL,wszBuffer,-1,szBuffer,nLen,NULL,NULL);
szBuffer[nLen] = 0;
strAnsi = szBuffer;
//内存清理
delete []wszBuffer;
delete []szBuffer;
}

在windows下打开一个记事本，保存文件，下面有四种编码选择。ANSI，也就是多字节字符集，在VC中也就是CHAR(char)字符串。Unicode，就是UTF16，在VC中也就是WCHAR（wchar_t)字符串。Unicode big endian ，就是UTF32，这种编码用的比较少。UTF8，网页上几乎都是用UTF8，UTF8用1-4个字节来编码所有的字符，英文只需要1个字节，中文需要3-4个字节。比起UTF16来说，UTF8这样可以尽可能的节省网络带宽，因为在网络上传输的字符，大部分以英文为主。UTF16至少是2个字节，部分字符4个字节。

如果我们写一个VC程序，从获取HTML网页数据，这些数据的编码是UTF8的，获取到我们VC程序中的CHAR字符数组中时就会发现，英文可以正常显示，中文全部乱码了。因为我们的CHAR型字符串用的是ANSI编码。要想把UTF8转换为ANSI，一般有两种方法。一种是手工写代码实现，百度上搜索可以发现很多资料，透彻了解这些字符集编码后，可以手工来实现转换，网上也有很多别人写好的转换函数。一种方法就是借助第三方函数库。由于我们在windows平台下编写程序，我们可以使用API函数来转换MultiByteToWideChar和WideCharToMultiByte。使用这个函数，我们得进行两次转换，先用MultiByteToWideChar把UTF8编码的CHAR字符串转换成WCHAR字符串，第一个参数要注明我们要转换的代码页为CP_UTF8，即UTF8的意思。然后用WideCharToMultiByte吧WCHAR字符串转换成CHAR字符串，第一个参数使用936，936代码页的意思是简体中文。有关代码页的知识可以百度百科一下。

本文出自：https://blog.csdn.net/xuexiiphone/article/details/51252778

打赏作者

admin：系统自动奖励，+10，

一	二	三	四	五	六	日
« 10月
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

发表评论 取消回复

发表评论取消回复