1. Новые покупки

    20.11.2020: Бесплатные покупки на Aliexpress, Amazon,asos + заработок от 200% на одной покупке

    18.11.2020: Куплю базы

    05.11.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 2 из 3

    03.11.2020: Magic video 3.0 Анимированные шаблоны Powerpoint

    02.11.2020: [Udemy] Этичный Хакинг | Запись интенсива Secure Android Phone

    29.10.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 1 из 3

    28.10.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 3 из 3

    28.10.2020: Видеомонтаж по полочкам [Антон Пушкарев]

    27.10.2020: 25 крутых проектов с Arduino [Марк Геддес]

    26.10.2020: Монтаж в Davinci Resolve: быстрый старт [Дмитрий Ларионов]

    26.10.2020: Монтаж в Davinci Resolve 16 [profileschool] [Дмитрий Ларионов]

    13.10.2020: [SalesHub и Игорь Кустов] Мастер группа 7: Бизнес на Amazon - Перезагрузка (новый поток) 2017

    13.10.2020: Запуск издательского бизнеса на Amazon SalesHub 2017

    05.10.2020: Вебинар продвижение instagram

    30.09.2020: [Дуйко Андрей] Программирование 2017 года

    30.09.2020: Обучение торговли криптовалютами

    04.09.2020: Джеральд Кейн - Полный дистанционный сертификационный курс гипноза (раздаточные материалы)

    26.08.2020: Онлайн курс Скорость 8 Аяз Шабутдинов

    25.08.2020: Анимация в Instagram

    25.08.2020: Новый курс по скоростной обработки фотографий в фотошопе

    23.08.2020: Кровавая неделя партнёрского маркетинга. Акуле плевать

    23.08.2020: THE ULTIMATE EDGE - Anthony Robbins (Энтони Роббинс)

    16.08.2020: Курс "СуперЧтение" = Скорочтение + Развитие памяти

    11.08.2020: Множественные источники трафика

    08.08.2020: Уличное каратэ. Как научиться драться за 100 дней

Как бороться с мертвыми ссылками?

Тема в разделе "Статьи/Новости IT", создана пользователем Toretto, 1 фев 2014.

  1. Toretto

    Администратор

    Регистрация:
    13 янв 2014
    Сообщения:
    9.241
    Симпатии:
    6.645
    Говорят, что если какая-то информация опубликована в интернете, то ее уже невозможно стереть из Всемирной сети. Мол, джинн выпущен из бутылки и это необратимый процесс. На практике все иначе.
    skladchik, темы по заработку, инфопродукты, coga.biz.
    Веб — чрезвычайно динамическая среда. Сайты постоянно появляются и исчезают, старый контент удаляют, из-за изменения структуры сайта ссылки перестают работать. Мертвые ссылки — это действительно реальная проблема.


    На эту тему в последние десять лет проведено несколько исследований, которые показали, что ежегодно умирает как минимум 3% ссылок, и это весьма консервативная оценка. По статистике Internet Archive, среднее время жизни веб-страницы — всего лишь 100 дней. Научный журнал Science проверял живучесть ссылок в научных статьях. Спустя два года после публикации 13% ссылок уже не работали. Подтверждений этому феномену — десятки. Даже в хорошо контролируемой среде ссылки пропадают. Например, 11% твитов об Арабской весне пропали через год после публикации, хотя сервис Twitter (пока) функционирует.

    Американский разработчик Гверн Бранвен (Gwern Branwen) поддерживает свой сайт gwern.net, на котором много внешних ссылок. Программист молод и считает, что его сайт будет работать до 2070 года. Получается, что даже если брать консервативную оценку в 3% смертности ссылок ежегодно, то к 2070 году на его сайте останутся живыми только 16% ссылок. Это неприемлемо, если вы хотите гарантировать нормальную работу информационного ресурса.

    На онлайновые архивы вроде Internet Archive нельзя положиться полностью, потому что больше половины мертвых ссылок там не найдешь. Кэш Google живет недолго. Поэтому наиболее оптимальным решением является локальное архивирование всех посещенных URL. Их список можно автоматически экспортировать из истории серфинга в браузере.

    В своем блоге Гверн Бранвен публикует bash-скрипты, с помощью которых удобно экспортировать историю серфинга и автоматически скачивать все посещенные страницы в локальный архив. Для экономии места на диске он предлагает запускать программы-дедупликаторы и архиваторы вроде 7Zip с максимальной степень компрессии. Отдельная команда предварительно удаляет из локального архива веб-страницы с сайтов, которые не следует сохранять (например, Reddit).

    Организовав такой личный архив, вы убережете себя от потери какой-либо важной информации. Чтобы помочь и остальным, можно запустить еще один скрипт, который будет заливать копии всех этих страниц в десяток имеющихся онлайновых архивов, в том числе Internet Archive, чтобы они сохранялись и там.

    В конце концов, еще один скрипт предлагается для периодического поиска мертвых внешних ссылок на своем сайте и замены их на URL’ы с сохраненными копиями в онлайновых архивах.
     
XenForo add-ons by Waindigo™ ©2014 Waindigo Foundation.