manyinjin 发表于 2013-2-3 10:45:44

java中GB2312 To Utf-8字符转换

    朋友让我帮他写个gb2312->utf-8的字符转换程序,找了半天没有在网上找到合适的,于是自己动手写了一个,呵呵。把它贴在这里,免得以后忘记了 ^_^
    实现思路大致如下:
   
[*] 取得一个汉字的Unicode码   
[*]把Unicode码分解为两个16进制数据字符串(丢弃前两个字节)   
[*]把这两个16进制数据字符串转换成二进制数据字符串   
[*]把二进制数据字符串分解为三个串,第一个串为4(0~4)个位,在高位加上标记位“1110”,第二(4~10)、三个(10~16)串均为6个位,分别在高位加上“10”标记位   
[*]把这三个二进制串分别转换为10进制数据并赋值给字节型数组   
[*]根据这个字节型数组构造UTF-8字符
<div class="code_title">java 代码
页: [1]
查看完整版本: java中GB2312 To Utf-8字符转换