1. Новые покупки

    13.02.2021: Продажа аккаунтов гидры/hydra с балансом TG: @hydravalid | Бот, отзывы, всегда в наличии

    08.02.2021: [GO IT] Онлайн курсы HTML/CSS + JavaScript

    07.02.2021: HX_RC_DVR 4.1.5

    06.02.2021: Конференция для художников, иллюстраторов и графических дизайнеров [ART FAMILY SCHOOL]

    11.01.2021: 100 Флаеров на все случаи жизни в PSD со скидкой 94%

    19.12.2020: Множественные источники трафика

    19.12.2020: [Firefly Design] Компьютерная графика в Photoshop и Illustrator Практический курс

    19.12.2020: Аккаунты Гидры/HYDRA с балансом 24/7 - @hydravalid | Бот, отзывы, скидки - hydravalid.ru

    19.12.2020: [Udemy] Этичный Хакинг | Запись интенсива Secure Android Phone

    19.12.2020: Новый Курс "Маркетмейкер 2017"

    16.12.2020: FAS - продвинутый скрипт для быстрой индексации - на базе Мувер

    13.12.2020: Взламываем Сайты / Тестирование На Проникновение С Нуля - Часть 4 Из 7

    13.12.2020: Куплю базы

    11.12.2020: Бесплатные покупки на Aliexpress, Amazon,asos + заработок от 200% на одной покупке

    05.11.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 2 из 3

    03.11.2020: Magic video 3.0 Анимированные шаблоны Powerpoint

    29.10.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 1 из 3

    28.10.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 3 из 3

    28.10.2020: Видеомонтаж по полочкам [Антон Пушкарев]

    27.10.2020: 25 крутых проектов с Arduino [Марк Геддес]

    26.10.2020: Монтаж в Davinci Resolve: быстрый старт [Дмитрий Ларионов]

    26.10.2020: Монтаж в Davinci Resolve 16 [profileschool] [Дмитрий Ларионов]

    13.10.2020: [SalesHub и Игорь Кустов] Мастер группа 7: Бизнес на Amazon - Перезагрузка (новый поток) 2017

    13.10.2020: Запуск издательского бизнеса на Amazon SalesHub 2017

    05.10.2020: Вебинар продвижение instagram

Как бороться с мертвыми ссылками?

Тема в разделе "Статьи/Новости IT", создана пользователем Toretto, 1 фев 2014.

  1. Toretto

    Администратор

    Регистрация:
    13 янв 2014
    Сообщения:
    9.347
    Симпатии:
    6.680
    Говорят, что если какая-то информация опубликована в интернете, то ее уже невозможно стереть из Всемирной сети. Мол, джинн выпущен из бутылки и это необратимый процесс. На практике все иначе.
    skladchik, темы по заработку, инфопродукты, coga.biz.
    Веб — чрезвычайно динамическая среда. Сайты постоянно появляются и исчезают, старый контент удаляют, из-за изменения структуры сайта ссылки перестают работать. Мертвые ссылки — это действительно реальная проблема.


    На эту тему в последние десять лет проведено несколько исследований, которые показали, что ежегодно умирает как минимум 3% ссылок, и это весьма консервативная оценка. По статистике Internet Archive, среднее время жизни веб-страницы — всего лишь 100 дней. Научный журнал Science проверял живучесть ссылок в научных статьях. Спустя два года после публикации 13% ссылок уже не работали. Подтверждений этому феномену — десятки. Даже в хорошо контролируемой среде ссылки пропадают. Например, 11% твитов об Арабской весне пропали через год после публикации, хотя сервис Twitter (пока) функционирует.

    Американский разработчик Гверн Бранвен (Gwern Branwen) поддерживает свой сайт gwern.net, на котором много внешних ссылок. Программист молод и считает, что его сайт будет работать до 2070 года. Получается, что даже если брать консервативную оценку в 3% смертности ссылок ежегодно, то к 2070 году на его сайте останутся живыми только 16% ссылок. Это неприемлемо, если вы хотите гарантировать нормальную работу информационного ресурса.

    На онлайновые архивы вроде Internet Archive нельзя положиться полностью, потому что больше половины мертвых ссылок там не найдешь. Кэш Google живет недолго. Поэтому наиболее оптимальным решением является локальное архивирование всех посещенных URL. Их список можно автоматически экспортировать из истории серфинга в браузере.

    В своем блоге Гверн Бранвен публикует bash-скрипты, с помощью которых удобно экспортировать историю серфинга и автоматически скачивать все посещенные страницы в локальный архив. Для экономии места на диске он предлагает запускать программы-дедупликаторы и архиваторы вроде 7Zip с максимальной степень компрессии. Отдельная команда предварительно удаляет из локального архива веб-страницы с сайтов, которые не следует сохранять (например, Reddit).

    Организовав такой личный архив, вы убережете себя от потери какой-либо важной информации. Чтобы помочь и остальным, можно запустить еще один скрипт, который будет заливать копии всех этих страниц в десяток имеющихся онлайновых архивов, в том числе Internet Archive, чтобы они сохранялись и там.

    В конце концов, еще один скрипт предлагается для периодического поиска мертвых внешних ссылок на своем сайте и замены их на URL’ы с сохраненными копиями в онлайновых архивах.
     
XenForo add-ons by Waindigo™ ©2014 Waindigo Foundation.