Новости Joomla

0 Пользователей и 1 Гость просматривают эту тему.
  • 880 Ответов
  • 213721 Просмотров
*

olegtlt

  • Осваиваюсь на форуме
  • 23
  • 1 / 0
в сграбливаемом сайте стоит:
<a onclick="window.open('/data/sborniki/100%_43.jpg','','width=377,height=480');return false;" href="/data/sborniki/100%_43.jpg">
при граблении у меня при наведении на ссылку показывается правильный путь (если открыть в новом окне то всё окей) а при клике во всплывающем окне пишет "The requested URL /data/sborniki/BLOKBASTERY_55.jpg was not found on this server."

решил проблему с помощью расширения - ReReplacer
« Последнее редактирование: 27.04.2010, 01:34:19 от olegtlt »

Господа, здравствуйте! Огромное спасибо автору.
Версия jooml'ы: 1.5.15 Версия скрипта: 1.4.5
====================================
Вопросы по расширению возможностей:
1.) Как реализовать "предпубликационное" редактирование содержимого?
Конкретный пример: Имеется "галлерея-донор" с переодически обновляющимся фото контентом.
Задача: Чтоб перед выводом на "сайт-реципиент" изменялся параметр "ширина" каждой миниатюры.
----------------------------------------------
2.) Создание многостраничного контента.
Конкретный пример: Существует контент расположеный на нескольких страницах "ресурс-донора".
Задача: Создание многостраничного вывода контента Не используя метод многократного дублирования mod_grabber
Задача 2: Если инплантируемый контент превышает допустимые нормы, нарушая тем самым гармоничный дизайн Автоматически раделять на несколько страниц.
===============================
Предполагаю, что следует создать определённые шаблоны для решения этих задач.
===============================
P.S. Следует полагать, что этот форум не является рынком, в следствии чего, я прошу не писать о возможности помочь за вознаграждение. С уважением Андрей.
*

drumin

  • Осваиваюсь на форуме
  • 18
  • 0 / 0
Здравствуйте, у меня возник такой вопрос. Для того чтобы закрыть сграбленные ссылки от индексации в Google достаточно прописать в параметры ссылки тег rel="nofollow", но вот для Яндекса такое не прокатит, чтобы запретить индексацию Яндексу нужно ссылку поставить в теги <noindex>, можно было бы конечно эти теги прописать перед сграбленным кодом и после, но тогда весь материал не проиндексируется, а вот если бы была возможность добавлять данные теги только к ссылке, но не к предварительному описанию сграбленной новости (например), то материал бы проиндексировался, так вот можно ли такое осуществить, или никак, и не планируется?
*

temper

  • Осваиваюсь на форуме
  • 21
  • 0 / 0
Здравствуйте.
Как сделать граббинг от <div class="newsArticle"> до <p><strong>?
В default.php прописано:

<?php defined('_JEXEC') or die('Restricted access');

$result = phpQuery::newDocument($html);
//$out    = pq($result)->find('div.newsArticle')->html();
echo $out;
?>

И еще как в php прописать синтаксис для отображения ссылок src и href ?
« Последнее редактирование: 01.06.2010, 18:09:47 от temper »
*

dimmer

  • Осваиваюсь на форуме
  • 32
  • 1 / 0
Перестала грабится погода с rp5.ru. Сначала думал что, тэги поменялись, но нет. Теперь не открываются прямые ссылки на город. Например, http://rp5.ru/5483/ru выдает 404, если заходить напрямую, а не с главной страницы. Можно это как-то победить?
*

vadim s. sabinich

  • Захожу иногда
  • 139
  • 11 / 0
  • переводчик-любитель
сайт по "демо" и "скачать" недоступен. ваш к.о.
VPS-хостинг на FirstVDS.ru || VPS/хостинг на ISPserver.com -- рефералам онлайн поддержка!
*

temper

  • Осваиваюсь на форуме
  • 21
  • 0 / 0
Автор ты еще живой? Что молчим то?  ^-^
*

sanitarn

  • Осваиваюсь на форуме
  • 38
  • 0 / 0
Непонятно, а как указать ему категорию куда он будет грабить?
*

yuri-it

  • Давно я тут
  • 994
  • 44 / 3
  • Быстрый хостинг https://jehost.ru
Непонятно, а как указать ему категорию куда он будет грабить?
Непонятно, а как указать ему категорию куда он будет грабить?
Автор же написал, что в БД данные не заносятся.
По-настоящему быстрый хостинг для Joomla : https://jehost.ru
Отзывы: http://joomlaforum.ru/index.php/topic,109288.0.html
Отзывы по хостингу http://hosting101.ru/jehost.ru
*

Spek™

  • Новичок
  • 9
  • 2 / 0
Знаете че?
Во первых прочитайте все 12 страниц,или воспользуйтесь поиском,некоторые вопросы дублируются неединажды.
Во вторых Автор не лошадь работать бесплатно и тоже хочет вкусно кушать,написано 300-500 рублей ЕСЛИ Ломину разбираться САМИМ.Уже проведена Огромная работа,faq можно составить.
Ну ладно, я понимаю еще чтото толковое спросить,но переспрашивать,тыкать и ПРОСИТЬ сделать,ПОД ПРЕДЛОГОМ помощи это некрасиво,неэтично и вообще  бееее.
пс: Пальцем не тыкаю,но предупреждаю: Совесть нада иметь уважаемые дамы и господа.Пишите по делу пожалуйста.
пс1: За грабер отдельное спасибо автору.Насчет FAQ на русском затея думаю хорошая,ща разберусь как че работает и напишу.
пс2: Идея с авторизацией на сайте - шикарная,однако я считаю что это будет как ядерная боеголовка в руках спамеров, в массы такое точно пускать нельзя,а кому действительно нужно тот и так перепишет под себя.
пс3: Мод - золото. И еще,давайте жить дружно.Без лишнего флуда.

///////////////////// поставил последнюю версию... да этош праздник какойто!)))))
насчет 12 страниц я погорячился,кто знаком c php смело ставьте 1.5.0 версию разобраться че куда - можно.
/////////////////////
phpQuery очень схоже с jQuery читаем тут:
http://habrahabr.ru/blogs/jquery/38208/ jQuery для начинающих
http://www.rsdn.ru/article/inet/jQuery.xml подробнее
http://jquery-docs.ru/ Перевод официальной jQuery документации на русский язык
/////////////////////затем вооружаемся переводчиком и дуем сюда:
http://code.google.com/p/phpquery/ собственно для чего все это и затевалось. Открываем  default.php блокнотиком и применяем знания на практике.Удачи всем)))
/////////////////////
Николай сдеайте пожалуйста проверку на cURL, установлен или нет,голову сломал почему не работает)))))
в настрйоках  php.ini разкомментируйте строку:
extension=php_curl.dll
ещё open_basedir и safe_mode должны быть off
также можно попробовать в .htaccess добавить это:
php_flag safe_mode off

а все из за ошибки:
Warning: curl_setopt() [function.curl-setopt]: CURLOPT_FOLLOWLOCATION cannot be activated when in safe_mode or an open_basedir is set in */public_html/modules/mod_grabber/helper.php  on line 20

в файле helper.php
16-23 строки:
        $ch = curl_init();
        curl_setopt ($ch, CURLOPT_URL, $params->get('url'));
        curl_setopt($ch, CURLOPT_USERAGENT, $agent);
        curl_setopt($ch, CURLOPT_REFERER, $referer);
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
        curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
        $file = curl_exec ($ch);
        curl_close($ch);

пробовал эмулировать работу CURLOPT_FOLLOWLOCATION методом http://qds.su/blog/?p=152 не вышло. стучусь к хостеру.
недождался, изменил эту строчку:
 curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
на
 curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 0);
в шаблоне прописал echo $html; выпал сайт донор целиком и без кракозябров,я так понимаю скрипт работает нормально.
сел за изучение jquery
/////////ответ хостера:
curl у нас стоит, но проблема как раз в том, что установлен open_basedir в целях безопасности, чтобы у скриптов не было возможности обратиться в папки других пользователей....
Ваша проблема будет рассмотрена администратором.
/////////////////////
Привожу еще ссылки по phpQuery
http://saintist.ru/2009/04/30/phpquery-shporgalka
http://m.habrahabr.ru/post/69149/?wob=J8U4YJ зачитал,поставил phpQuery теперь думаю а зачем мне плагин?))))))))

« Последнее редактирование: 15.06.2010, 15:43:25 от Spek™ »
*

yuri-it

  • Давно я тут
  • 994
  • 44 / 3
  • Быстрый хостинг https://jehost.ru
Пробую с локалхоста 1.4.5 пишет сайт не найден :( И так для всех сайтов ...
По-настоящему быстрый хостинг для Joomla : https://jehost.ru
Отзывы: http://joomlaforum.ru/index.php/topic,109288.0.html
Отзывы по хостингу http://hosting101.ru/jehost.ru
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
включите отображение ошибок .. что показывает?
*

yuri-it

  • Давно я тут
  • 994
  • 44 / 3
  • Быстрый хостинг https://jehost.ru
включите отображение ошибок .. что показывает?
вообще на денвере ошибки все включены, ничего не показывает ) Просто красным Сайт не найден :( Кстати вот версия 1.5 вроде видит донора, но не хочу пока шаблонами заморачиваться, в 1.4.5 как раз что нужно все.
По-настоящему быстрый хостинг для Joomla : https://jehost.ru
Отзывы: http://joomlaforum.ru/index.php/topic,109288.0.html
Отзывы по хостингу http://hosting101.ru/jehost.ru
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
дайте источник, в личку например, посмотрим что там такое
*

yuri-it

  • Давно я тут
  • 994
  • 44 / 3
  • Быстрый хостинг https://jehost.ru
дайте источник, в личку например, посмотрим что там такое
сайт на денвере, может поэтому не работает? Денвер во внешку не настроен. Попробую сегодня на домашнем ПК все проделать.
По-настоящему быстрый хостинг для Joomla : https://jehost.ru
Отзывы: http://joomlaforum.ru/index.php/topic,109288.0.html
Отзывы по хостингу http://hosting101.ru/jehost.ru
*

sandra21

  • Новичок
  • 5
  • 0 / 0
Автору спасибо, модуль классный

Вопрос не совсем в тему но может кто-нибуть все таки ответит  crazy!

граблю страницу с таблицей в этой таблице я убираю первую строку (заголовок) и во всех строках надо убрать последний столбик пишу

шаблон
Код
<?php
defined('_JEXEC') or die('Restricted access');
$result = phpQuery::newDocument($html);
$out=pq($result)->find('table.txt');
$out->find('tr:first')->remove();
$out->find('tr>td:last')->remove();>

убирается только последний столбик в последней строчке, почему?
нужно ли использовать цикл? вроде нет если писать $out->find('tr>td')->remove(); убираются же все можно ли к элементам обращаться по номеру? Ну или хотя бы подскажите что читать желательно на русском
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
*

sandra21

  • Новичок
  • 5
  • 0 / 0
Ладно с этим разобралась  ;D

теперь другой вопрос, беру с сайта в windows-1251 у меня соответственно UTF-8 из чего куда кодировать указанно но ничего не грабится, если кодировку не указываешь то грабится но с вопросиками граблю отсюда http://finam.info/home/main/default.asp
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
используйте iconv
iconv  (  'UTF-8', 'Windows-1251',  $out  );
где  $out - это переменная в которой хранится вся информация которая на выходе должна быть
*

sandra21

  • Новичок
  • 5
  • 0 / 0
Спасибо, помогло  :D
*

yuri-it

  • Давно я тут
  • 994
  • 44 / 3
  • Быстрый хостинг https://jehost.ru
вот собственно ошибки мои появились:

Notice: Undefined offset: 1 in H:\home\test1.ru\www\auto2\modules\mod_grabber\helper.php on line 123

Notice: Undefined variable: go in H:\home\test1.ru\www\auto2\modules\mod_grabber\mod_grabber.php on line 80

Notice: Undefined variable: atr in H:\home\test1.ru\www\auto2\modules\mod_grabber\mod_grabber.php on line 85
По-настоящему быстрый хостинг для Joomla : https://jehost.ru
Отзывы: http://joomlaforum.ru/index.php/topic,109288.0.html
Отзывы по хостингу http://hosting101.ru/jehost.ru
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
версия модуля и Joomla какая?
*

yuri-it

  • Давно я тут
  • 994
  • 44 / 3
  • Быстрый хостинг https://jehost.ru
версия модуля и Joomla какая?
модуль 1.4.5, Joomla 1.5.15
По-настоящему быстрый хостинг для Joomla : https://jehost.ru
Отзывы: http://joomlaforum.ru/index.php/topic,109288.0.html
Отзывы по хостингу http://hosting101.ru/jehost.ru
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
похоже что шаблон не верно составлен .. попробуйте со стандартным каким-нить .. например lenta
*

sandra21

  • Новичок
  • 5
  • 0 / 0
a почему ->text оборачивается в параграф?
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
вообще-то не должно такого быть.
text() должен возвращать простой неформатированный текст.
покажите ваш пример?
*

sandra21

  • Новичок
  • 5
  • 0 / 0
$out->find('tr:nth-child(' . $cellsCount . '2)>td>a')->text("что угодно");
в итоге оборачивается параграфом и не только text, но и любая вставка данных, html() и тд


ести вставлять так


$out->find('tr:nth-child(' . $cellsCount . '2)>td>a')->html("<span>ENRC</span>");

то вставляется без параграфа, но этот тег вобще не очень нужен
*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
это скорее уже тогда вопрос к автору phpQuery ...
*

Tremere

  • Новичок
  • 8
  • 0 / 0
не знаю, что нужно делать, выдает все время ошибки, мне надо с этой странице выдирать таблицу лидеров HaloCharts Score Leaderboard
http://www.halocharts.com/leaderboards.php?group_id=&country=Russian Federation&type=HCS

и еще выдает всегда такую ошибку, включение Легаси мод вроде не помогло

Warning: curl_setopt() [function.curl-setopt]: CURLOPT_FOLLOWLOCATION cannot be activated when in safe_mode or an open_basedir is set in /home/haloun/public_html/modules/mod_grabber/helper.php on line 21

*

nikonor

  • Давно я тут
  • 513
  • 56 / 0
  • Content Grabber
попробуйте просто закомментировать эту строку  /home/haloun/public_html/modules/mod_grabber/helper.php on line 21
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться
 

Модуль для отображения курсов валют

Автор Геон

Ответов: 2
Просмотров: 417
Последний ответ 03.02.2024, 22:19:02
от Геон
Модуль «Image Show gk4», не отображается ни картинка, ни текст

Автор kaasin

Ответов: 1
Просмотров: 2050
Последний ответ 13.05.2023, 15:42:15
от anastasya96
Компонент Commedia и плагин mp3browser для медиа-сайтов

Автор ecolora

Ответов: 557
Просмотров: 118936
Последний ответ 13.03.2023, 00:25:14
от ecolora
Стандартный модуль случайного изображения не выводит фотографии

Автор strix

Ответов: 8
Просмотров: 6424
Последний ответ 19.10.2022, 16:07:11
от Andrej_777
Модуль тегов Joes Word Cloud для Joomla 3

Автор ecolora

Ответов: 1
Просмотров: 1390
Последний ответ 05.05.2022, 19:04:44
от ecolora