Эта тема на forum.dklab.ru


Дрёмин Е.М.: Вопрос про grabbing...
Здравствуйте!
Хотел бы узнать, каким образом лучше вырезать информацию с сайта без видимой потери скорости. Всякие простейшие примеры типа:

<?
$GrabURL = "http://www.SomeSite.Com/PageName.html"; //- URL
$GrabStart = "<html>"; //- HTML Code To Start Grab.
$GrabEnd = "</html>"; //- HTML Code To End Grab.
$OpenFile = fopen("$GrabURL", "r");
$RetrieveFile = fread($OpenFile, 100000); //- Reduce This To Save Memory
$GrabData = eregi("$GrabStart(.*)$GrabEnd", $RetrieveFile, $DataPrint);
// $DataPrint[1] = str_replace("", "", $DataPrint[1]); //- Un-Comment This Line for "Replace" purposes!
fclose($OpenFile);
echo $DataPrint[1];
?>

не выдерживают никакой критики, т.к. скрипт выполняется в лучшем случае несколько секунд.
Да, ещё, про очищение тегов, хотелось бы узнать почему не действует, например:
$DataPrint[1] = str_replace("<b>(.*)</b>", "", $DataPrint[1]);
Т.е. я хочу удалить содержимое между тегами <b> и </b>.
Юрий Насретдинов:
почему не действует, например
А Вы посмотрите, в чем различие между str_replace, ereg_replace и preg_replace...
Дмитрий Котеров:
скрипт выполняется в лучшем случае несколько секунд
Я думаю, это просто столько времени страница http://www.SomeSite.Com/PageName.html скачивается. С этим вряд ли чего можно поделать — разве что скачать ее один раз, а потом использовать временную копию.
Юрий Насретдинов:
Дмитрий Котеров:
Кстати, насчет скорости, помнится, делали переводчик, который соединялся с сайтом промпта... Причем делал он это очень быстро. Можно поинтересоваться, какой у Вас (т.е. хостинга) канал соединения с интернетом ? Потому что у меня например страницы скачиваются мгновенно (вернее файлы, потому что страницы генерируются долго)
Дмитрий Котеров:
Канал у нас точно не знаю какой — не я этим занимаюсь. По личным впечатлениям — скорость бывает весьма разной, иногда доходит до 1 МБ/с (а между машинами на соседних этажах — до 8 МБ/с).

вернее файлы, потому что страницы генерируются долго
Вот именно. Кто сазал, что та страница — статическая?
Дрёмин Е.М.:
Да, прошу прощения, про str_replace перепутал...

Эта тема на forum.dklab.ru