logo32 发表于 2013-1-31 10:47:43

在Linux Shell下把汉字转换为Url编码

在linux 的shell环境下有一个od命令可以把文件按不同的进制的ascii码输出,该功能可以完成在linux shell下把汉字转换为url编码的任务。

url编码是十六进制的形如%E6%9C%8D%E5%8A%A1%E5的字符串,test是包含“数据库网络,”这几个字符的文件,以下命令输出:


#od -t x /test0000000 ddbefdca f8cde2bf 0a2ce7c20000014

该字符串对应的url编码为 %CA%FD%BE%DD%BF%E2%CD%F8%C2%E7%2C。

可以看出编码的对应关系以下是转换的脚本:


#!/bin/sh#make url codeod -t x /tmp/test |awk '{ w=split($0,linedata," ");for (j=2;j<w+1;j++){for (i=7;i>0;i=i-2){if (substr(linedata,i,2) != "00") {printf "%" ;printf toupper(substr(linedata,i,2));}}}}' >/tmp/testurl

/tmp/testurl文件的内容就是转换结果。
页: [1]
查看完整版本: 在Linux Shell下把汉字转换为Url编码