Главная страница » Блог » SEO-заметки

Собрать все ссылки со страницы вместе с анкорами

Часто SEO-специалисту необходимо собрать все ссылки с анкорами со страницы, например у нас в команде часто ставиться задача воссоздать в таблицах структуру сайта клиента, согласно навигации этого сайта. Поэтому мы составили небольшой алгоритм и разработали JS-скрипт для оптимизации этого процесса в браузере.

Порядок действий для получения ссылок с анкорами:

а) Зайти на страницу сайта с меню навигации (обычно это главная страница) и открыть в меню инструменты

Скриншот открытия DevTools в Google Chrome
Скриншот открытия DevTools в Google Chrome

б) Открыть вкладку «Консоль»

Вкладка "Console" в DevTools Google Chrome
Вкладка «Console» в DevTools Google Chrome

в) Далее вставляем наш JS-скрипт в консоль и жмем Enter 😎

Собрать все ссылки со страницы вместе с анкорами
Вставка скрипта по сбору ссылок в DevTools

Сам скрипт:

var output = 'Анкор, URL ссылки\n';
var baseURL = window.location.origin + '/'
var res = new Map()
var anchor = ''
console.log(output)
document.querySelectorAll('a').forEach(a => {
    if (!a.href.includes(window.location.origin) || a.href.includes('javascript:') || a.href.includes('#') || a.href.includes('?') || a.href.includes('tel:') || a.href.includes('mailto:') || a.href == baseURL){
        // continue
    }else{
        anchor = a.text.replace(/[^a-zA-Zа-яА-Я 0-9]/g, "").replace(/\s{2,}/g, " ");
        if(!res.has(a.href)){
            res.set(a.href, anchor)
        }else{
            if(res.get(a.href).length < anchor.length){
                res.set(a.href, anchor)
            }
        }

    }
})
res.forEach(
    (value, key) => {
        console.log(`${key}, ${value}`); // печатаем в консоль результат
    }
);

В результате в консоль распечатается список url ссылок и их анкоров в CSV-формате, который остается только скопировать:

Результат работы нашего JS-скрипта в консоли браузера
Результат работы нашего JS-скрипта в консоли браузера

Обратите внимание, что если не раскрыть полностью вывод нажатием на кнопку «Показать еще», то скопируется не весь результат, а только видимая часть в консоли!

г) Скопированные данные вставляем в Excel и разбиваем на столбцы с разделителем «запятая».

Выгрузка ссылок и их анкоров в Excel
Пример результата выгруженного в Excel

Далее обрабатываем полученную выгрузку ссылок с их анкорами уже по своим нуждам. Например мы удаляем из этого списка ненужные нам ссылки на технические страницы (со знаком #, ?), ссылки на другие домены, текстовые блоки, изображения и т.д.