Skip to content

PHP将汉字字符串转换为数组

想要将“日常歌单”几个字变为"日 / 常 / 歌 / 单”,然而直接用explode("","日常歌单")返回false,用preg_replace("//","/ \/ /","日常歌单")也不行,分割中文会出错,因为编码不一样长。于是需要自己做相应的函数。

关键问题:mb_strlen、mb_substr

  1. mb_strlen中文长度计算有问题
php
mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )

使用mb_strlen("xxxx","utf-8")会使得中文长度按1计算而不是3,例如:

php
$str='日常a歌1单';  
echo strlen($str);//14  
echo mb_strlen($str,'utf8');//6
  1. mb_substr可以安全截取中文字符
php
string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )

按照字符编码多字节安全地截取字符,例如:

php
$str='日常a歌1单'; 
echo mb_substr($str,0,4,'utf-8');//截取头5个字,【日常a歌1】

思路和操作

思路:可以先计算长度,然后一个for循环一次截取每个字符,再加入数组,最后implode(或者在截取后马上进行拼接)

php
function str2arr_utf8($str)
    {
        $len = mb_strlen($str, 'utf-8');
        $arr = [];
        for ($i=0; $i<$len; $i++)
            $arr[] = mb_substr($str, $i, 1, 'utf-8');
        return $arr;
    }
转载请注明出处https://bananaoven.com/articles/135.html | 香蕉微波炉
分享许可方式知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议
重大发现:转载注明原文网址的同学刚买了彩票就中奖,刚写完代码就跑通,刚转身就遇到了真爱。