详情页

帝国CMS PHP汉字(UTF-8)转unicode码

时间:2023年06月10日

编辑:佚名

最近要写一个与汉语字典有关的程序,发现许多生僻字,在页面不能显示,只能以unicode码的10进制实体来显示。于是有了php将汉字转unicode码就成了迫切需求。用搜索找到好多个函数,可惜在试用后都放弃了,这些函数只支持普通汉字的转码,对于生僻字不支持。只好自己写一个,测试成功了。这个函数是根据unicode的二进制规则来写的。
function dp_HzToUnicode($hz){
    $r=array();
    $hex=str_replace("%","",urlencode($hz));
    $r['hex']=$hex;
    $bin2=base_convert($hex,16,2);
    $dec=base_convert($hex,16,10);
    if($dec<127){
        $r['dec']=$dec;
        $r['unidoce']=$r['dec'];
        $r['bin2']=$bin2;
        return $r;
    }
    $bit=strlen($bin2)/8;
    $br=str_split($bin2,8);
    $true_bin2='';
    for($i=0;$i<$bit;$i++){
        if($i==0){
            $true_bin2.=substr($br[$i],$bit+1);
        }else{
            $true_bin2.=substr($br[$i],2);
        }
    }
    $r['bin2']=$true_bin2;
    $unidoce=base_convert($true_bin2,2,16);
    $r['unidoce']=$unidoce;
    $html=base_convert($true_bin2,2,10);
    $r['dec']=$html;
    return $r;
}
相关文章
猜你需要