Главная страница » Блог » SEO-заметки

Собрать все ссылки со страницы вместе с анкорами

Часто SEO-специалисту необходимо собрать все ссылки с анкорами со страницы, например у нас в команде часто ставиться задача воссоздать в таблицах структуру сайта клиента, согласно навигации этого сайта. Поэтому мы составили небольшой алгоритм и разработали JS-скрипт для оптимизации этого процесса в браузере.

Порядок действий для получения ссылок с анкорами:

а) Зайти на страницу сайта с меню навигации (обычно это главная страница) и открыть в меню инструменты

Скриншот открытия DevTools в Google Chrome
Скриншот открытия DevTools в Google Chrome

б) Открыть вкладку «Консоль»

Вкладка "Console" в DevTools Google Chrome
Вкладка «Console» в DevTools Google Chrome

в) Далее вставляем наш JS-скрипт в консоль и жмем Enter 😎

Вставка скрипта по сбору ссылок в DevTools
Вставка скрипта по сбору ссылок в DevTools

Сам скрипт:

var res = 'Анкор, URL ссылки\n';
document.querySelectorAll('a').forEach(a => {
    if (a.href.includes('javascript:') || a.href.includes('#') || a.href.includes('?')){
        // continue
    }else{
        res = res + a.text.replace(/[^a-zA-Zа-яА-Я 0-9]/g, "") + ', ' + a.href + '\n';
    }
})
console.log(res)

В результате в консоль распечатается список url ссылок и их анкоров в CSV-формате, который остается только скопировать:

Результат работы нашего JS-скрипта в консоли браузера
Результат работы нашего JS-скрипта в консоли браузера

Обратите внимание, что если не раскрыть полностью вывод нажатием на кнопку «Показать еще», то скопируется не весь результат, а только видимая часть в консоли!

г) Скопированные данные вставляем в Excel и разбиваем на столбцы с разделителем «запятая».

Выгрузка ссылок и их анкоров в Excel
Пример результата выгруженного в Excel

Далее обрабатываем полученную выгрузку ссылок с их анкорами уже по своим нуждам. Например мы удаляем из этого списка ненужные нам ссылки на технические страницы (со знаком #, ?), ссылки на другие домены, текстовые блоки, изображения и т.д.