1. Главная
  2.  
  3. Блог Акцепт-У
  4.   Поиск внешних ссылок на страницах сайта

Поиск внешних ссылок на страницах сайта

Внешние ссылки с сайта в последнее время стали «криминальным» элементом, на которые обращают внимание seo аудиторы. Конечно – если со страницы много прямых внешних ссылок, не закрытых от индексации, то возникает подозрение, что сайт торгует ссылками. Поэтому, на клиентских сайтах мы обычно закрываем внешние ссылки в теги noindex, прописываем атрибут rel=”nofollow” ,  или делаем ссылку через Java Script:
<a onclick="window.open('http://ac-u.ru','','');return false;" href="#">веб студия</a>

Что делать, если к вам на продвижение попал сайт, на котором много страниц и множество внешних ссылок? Либо, у сайта несколько зеркал и внутренние ссылки выполнены с полными URL адресами на разные домены-зеркала?

Сначала необходимо получить список адресов внешних ссылок. Тут нам поможет незабвенная программа Xenu (http://home.snafu.de/tilman/xenulink.html)

Как ею пользоваться – можно почитать в интернете, к примеру тут: http://devaka.ru/articles/xenu-link-sleuth
Добавлю только, что в исключениях необходимо добавлять начало URL адреса полностью: http://www.domen.tld/restricted_url и т.п.

Экспортируем полученные результаты в "TAB separated" файл, копируем его содержимое в эксель (или OpenOffice calc). Там сортируем это содержимое по колонке с адресом. Удаляем лишнее и в итоге получаем список URL внешних ссылок с сайта.
Однако, не получаем страницы, на которых они стоят. Проект, к сожалению не развивается, иначе можно было бы попросить создателя сей замечательной проги добавить опцию построения отчета не только по битым ссылкам, но и по внешним.

Чтобы получить страницы со внешними ссылками необходимо:

Если контент сайта лежит в файлах:
Копируем файло себе на компьютер и запускаем любую искалку по файлам. К примеру - @Text Replacer (http://tr.infortech.ru/) Можно по идее не копировать, а исправлять прямо на сервер. Но я к сожалению не настолько сведущ в unix-софте, чтобы что-то посоветовать на тему Embarassed

Если контент сайта лежит в БД (обычно так и бывает), необходим доступ к phpMyAdmin и реквизиты доступа к базк данных.
В phpmyadmin выбираем вкладку «поиск» и вводим в строку поиска нужный нам адрес из полученного списка, обрамляя его знаками «%» (ведь справа и слева от адреса будут стоить символы). Выбираем таблицы для поиска (если не знаем где лежит контент – выбираем все), отмечаем «точное соответствие»  – и жмем «Ок»

Получаем список всех таблиц с найденными в них совпадениями. Методом банальной эрудиции и логики вычисляем таблицу с контентом, жмем «Обзор». Нам показываются записи в таблице, в которых есть соответствия нашему URL. Ну и дальше просто: жмем на «Редактировать», находим в записи нужный урл, исправляем ссылку, приводя ее к надлежащему виду.

И так по всем URL из списка Smile

Комментарии

Добавить комментарий

Пункты, отмеченные *, являются обязательными к заполнению