Эта тема на forum.dklab.ru


non4eg: HTML спецсимволы
Столкнулся с проблемой HTML спецсимволов.
Нужно на сайте инородном найти текст... иногда прокатывает а иногда встречаются спецсимволы, которые не хотят декодироваться.
Встретился на сайте символ : …
Не помогает:

function unhtmlentities($string)
{
// replace numeric entities
$string = preg_replace('~&#x([0-9a-f]+);~ei', 'chr(hexdec("\\1"))', $string);
$string = preg_replace('~&#([0-9]+);~e', 'chr(\\1)', $string);
// replace literal entities
$trans_tbl = get_html_translation_table(HTML_ENTITIES);
$trans_tbl = array_flip($trans_tbl);
return strtr($string, $trans_tbl);
}


и не помогает, даже : html_entity_decode.

Если, кто-то встречался с такими проблемами, отзовитесь.
non4eg:
Уже сам нашёл выход.


function mbc($str){
return mb_convert_encoding("&#".$str.";", 'cp1251', 'HTML-ENTITIES');
}

function unhtmlentities($string)
{
$string = preg_replace('~&#([0-9]+);~e', 'mbc(\\1)', $string);
return $string;
}


Может кому понадобиться)

Эта тема на forum.dklab.ru