Убираем "amp;" из адреса страниц

Проблемы с установкой или работой phpBB 3.0.х. Решение проблем связанных с модами, стилями, доработками и так далее.
cefp
Сообщения: 333
Поблагодарили: 3 раза

Убираем "amp;" из адреса страниц

Сообщение cefp » Пт фев 12, 2016 10:40 am

Заметил, что гугл иногда неправильно обрабатывает адреса, содержащие знак ампресанда. Он может посчитать равнозначными адреса вот такие для примера:

Код: Выделить всё

http://danfa.org/viewtopic.php?f=27&t=100

Код: Выделить всё

http://danfa.org/viewtopic.php?f=27&t=100

Первый адрес форум обработает как надо и покажет запрашиваемую тему, а на второй адрес выдает сообщение о том, что тема не существует. Гугл ошибочно воспринимает именно адреса с текстом "amp;" после знака амперсанда. Думаю, это связано с тем, что в html коде рекомендуют делать замену знака амперсанда на "&".

Для решения проблемы можно добавить обработку таких адресов. Для этого можно в файле viewtopic.php
найти код:

Код: Выделить всё

if (!$topic_id && !$post_id)

    
trigger_error('NO_TOPIC');

и заменить его на такой:

Код: Выделить всё

if (!$topic_id && !$post_id)
{
    
$urlrequest $_SERVER['QUERY_STRING'];
    
parse_str($urlrequest,$urlvar);
    foreach (
$urlvar as $key => $value)
    {
        
$key str_replace("amp;"""$key);
        if (
$key === 't')
        {
            
$topic_id = (integer) $value;
        }
        if (
$key === 'start')
        {
            
$start = (integer) $value;
        }
    }
    if (!
$topic_id && !$post_id)
    {    
        
trigger_error('NO_TOPIC');
    }    
d o h o d - s - n u l y a .ru - идеи бизнеса.
Реклама
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

Re: Убираем "amp;" из адреса страниц

Сообщение Slash » Пт фев 12, 2016 12:34 pm

Я установил хук товарища Shredder http://www.phpbb-work.ru/seo-hooks-t87.html
Сейчас адрес выглядит так (пример на эту тему): viewtopic.php?t=1932.
cefp
Сообщения: 333
Поблагодарили: 3 раза

Re: Убираем "amp;" из адреса страниц

Сообщение cefp » Пт фев 12, 2016 1:37 pm

Я не стал ставить такой хук, чтобы поисковикам не пришлось менять адреса в своих индексах.
d o h o d - s - n u l y a .ru - идеи бизнеса.
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

Re: Убираем "amp;" из адреса страниц

Сообщение Slash » Пт фев 12, 2016 1:46 pm

cefp писал(а):чтобы поисковикам не пришлось менять адреса в своих индексах

Можно сделать переадресацию со старых адресов на новые, к тому же с этим хуком страница доступна и по старому адресу. Со временем все индексы обновятся.
cefp
Сообщения: 333
Поблагодарили: 3 раза

Re: Убираем "amp;" из адреса страниц

Сообщение cefp » Пт фев 12, 2016 1:54 pm

Тогда, возможно было бы лучше перейти еще на один вариант, который я рассматривал перед рассмотрением этого - переход на ЧПУ. Но где-то читал, что не рекомендуют это делать, если есть много страниц в индексе. Вот если бы можно было сделать плавный переход. Например для начала создавать новые адреса для новых тем, а потом постепенно и старые обновлять. Тогда наверно был бы ощутимый положительный эффект.

Заметил еще одну небольшую ошибку.

Иногда гугл неправильно обрабатывает такие адреса:

Код: Выделить всё

http://danfa.org/viewtopic.php?t=186&start=15

Обычно форум при таком адресе отображает первую страницу темы. В адресе вместо всех знаков амперсанда одновременно может быть "&"
d o h o d - s - n u l y a .ru - идеи бизнеса.
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

Re: Убираем "amp;" из адреса страниц

Сообщение Slash » Пт фев 12, 2016 2:37 pm

cefp писал(а):start=15

Может лучше запретить такие адреса в robots.txt?
Slash писал(а):Я установил хук

Уже удалил...
cefp
Сообщения: 333
Поблагодарили: 3 раза

Re: Убираем "amp;" из адреса страниц

Сообщение cefp » Пт фев 12, 2016 3:20 pm

Slash писал(а):
cefp писал(а):start=15

Может лучше запретить такие адреса в robots.txt?

Когда на странице 15 сообщений, то страницы с числами кратными 15 после слова start лучше не запрещать. Иначе поисковики смогут проиндексировать только первую страницу темы. В последнее время гугл выдает как ошибку, если видит что какая-то страница закрыта от индексации. При этом на ней может дублироваться часть контента с другой страницы. Иногда возникаем мысль разрешить индексацию таких страниц в robots, но не хочется, чтобы были дубли. Вот страницы где после слова start стоит число не кратное 15 можно закрывать в robots, но ссылки такие страницы появляются довольно редко.
d o h o d - s - n u l y a .ru - идеи бизнеса.
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

Re: Убираем "amp;" из адреса страниц

Сообщение Slash » Пт фев 12, 2016 10:03 pm

Внес правки предложенные cefp: Убираем amp; из адреса страниц

На данный момент в Google ВебМастере у меня 159 ошибок - не найдено из-за &. Подождем результата.
cefp, за правки спасибо.
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

Re: Убираем "amp;" из адреса страниц

Сообщение Slash » Пн фев 15, 2016 10:19 am

Сегодня с утра проверил, ошибок меньше.
Сейчас ошибок - 140.
cefp
Сообщения: 333
Поблагодарили: 3 раза

Re: Убираем "amp;" из адреса страниц

Сообщение cefp » Пн фев 15, 2016 10:50 am

А Вы их не отмечаете как исправленные?
d o h o d - s - n u l y a .ru - идеи бизнеса.
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

Re: Убираем "amp;" из адреса страниц

Сообщение Slash » Пн фев 15, 2016 12:08 pm

Нет. Мне стало интересно будет сам Google Bot проверять страницы, которые помечены, как не найдено.
И видимо проверяет.

Чуть позже отмечу, как исправленное.

За сценарий ещё раз спасибо.
cefp
Сообщения: 333
Поблагодарили: 3 раза

Re: Убираем "amp;" из адреса страниц

Сообщение cefp » Пн фев 15, 2016 12:46 pm

Пожалуйста. У меня там попадаются еще другие неправильные адреса. Но их было намного меньше по сравнению с этими. Например вместо знака равно набор символов. Может быть у Вас есть другие частовстречающиеся ошибки? Не думали поработать с ними? Я вот сейчас стараюсь избавляться от всех таких ошибок.
d o h o d - s - n u l y a .ru - идеи бизнеса.

Вернуться в «phpBB»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость