六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 15|回复: 0

java中GB2312 To Utf-8字符转换

[复制链接]

升级  58%

5

主题

5

主题

5

主题

童生

Rank: 1

积分
29
 楼主| 发表于 2013-2-3 10:45:44 | 显示全部楼层 |阅读模式
    朋友让我帮他写个gb2312->utf-8的字符转换程序,找了半天没有在网上找到合适的,于是自己动手写了一个,呵呵。把它贴在这里,免得以后忘记了 ^_^
    实现思路大致如下:
       
  •  取得一个汉字的Unicode码   
  • 把Unicode码分解为两个16进制数据字符串(丢弃前两个字节)   
  • 把这两个16进制数据字符串转换成二进制数据字符串   
  • 把二进制数据字符串分解为三个串,第一个串为4(0~4)个位,在高位加上标记位“1110”,第二(4~10)、三个(10~16)串均为6个位,分别在高位加上“10”标记位   
  • 把这三个二进制串分别转换为10进制数据并赋值给字节型数组   
  • 根据这个字节型数组构造UTF-8字符
<div class="code_title">java 代码
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表