1. Новые покупки

    27.04.2021: Как настроить рекламу в Instagram / Facebook за 1 день и получать клиентов дешевле, чем в директе [M

    22.04.2021: Интернет-Маркетолог + Трафик Менеджер

    12.04.2021: Множественные источники трафика

    07.04.2021: [Брайан Трейси] - Персональный успех 2016

    31.03.2021: Доступ в закрытый клуб Wolf's club

    26.03.2021: Стратегия FxMax4 PRO (ПолуАВТОМАТИЧЕСКАЯ, прибыль до 30-60% в мес на депозит!)

    17.03.2021: Продвинутая работа с Google Analytics

    13.02.2021: Продажа аккаунтов гидры/hydra с балансом TG: @hydravalid | Бот, отзывы, всегда в наличии

    07.02.2021: HX_RC_DVR 4.1.5

    06.02.2021: Конференция для художников, иллюстраторов и графических дизайнеров [ART FAMILY SCHOOL]

    11.01.2021: 100 Флаеров на все случаи жизни в PSD со скидкой 94%

    19.12.2020: [Firefly Design] Компьютерная графика в Photoshop и Illustrator Практический курс

    19.12.2020: Аккаунты Гидры/HYDRA с балансом 24/7 - @hydravalid | Бот, отзывы, скидки - hydravalid.ru

    19.12.2020: [Udemy] Этичный Хакинг | Запись интенсива Secure Android Phone

    16.12.2020: FAS - продвинутый скрипт для быстрой индексации - на базе Мувер

    13.12.2020: Взламываем Сайты / Тестирование На Проникновение С Нуля - Часть 4 Из 7

    13.12.2020: Куплю базы

    11.12.2020: Бесплатные покупки на Aliexpress, Amazon,asos + заработок от 200% на одной покупке

    28.11.2020: [GO IT] Онлайн курсы HTML/CSS + JavaScript

    05.11.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 2 из 3

    03.11.2020: Magic video 3.0 Анимированные шаблоны Powerpoint

    29.10.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 1 из 3

    28.10.2020: [Udemy] Взламываем соседский Wi-Fi - Часть 3 из 3

    28.10.2020: Видеомонтаж по полочкам [Антон Пушкарев]

    27.10.2020: 25 крутых проектов с Arduino [Марк Геддес]

Как бороться с мертвыми ссылками?

Тема в разделе "Статьи/Новости IT", создана пользователем Toretto, 1 фев 2014.

  1. Toretto

    Администратор

    Регистрация:
    13 янв 2014
    Сообщения:
    9.528
    Симпатии:
    6.704
    Говорят, что если какая-то информация опубликована в интернете, то ее уже невозможно стереть из Всемирной сети. Мол, джинн выпущен из бутылки и это необратимый процесс. На практике все иначе.
    skladchik, темы по заработку, инфопродукты, coga.biz.
    Веб — чрезвычайно динамическая среда. Сайты постоянно появляются и исчезают, старый контент удаляют, из-за изменения структуры сайта ссылки перестают работать. Мертвые ссылки — это действительно реальная проблема.


    На эту тему в последние десять лет проведено несколько исследований, которые показали, что ежегодно умирает как минимум 3% ссылок, и это весьма консервативная оценка. По статистике Internet Archive, среднее время жизни веб-страницы — всего лишь 100 дней. Научный журнал Science проверял живучесть ссылок в научных статьях. Спустя два года после публикации 13% ссылок уже не работали. Подтверждений этому феномену — десятки. Даже в хорошо контролируемой среде ссылки пропадают. Например, 11% твитов об Арабской весне пропали через год после публикации, хотя сервис Twitter (пока) функционирует.

    Американский разработчик Гверн Бранвен (Gwern Branwen) поддерживает свой сайт gwern.net, на котором много внешних ссылок. Программист молод и считает, что его сайт будет работать до 2070 года. Получается, что даже если брать консервативную оценку в 3% смертности ссылок ежегодно, то к 2070 году на его сайте останутся живыми только 16% ссылок. Это неприемлемо, если вы хотите гарантировать нормальную работу информационного ресурса.

    На онлайновые архивы вроде Internet Archive нельзя положиться полностью, потому что больше половины мертвых ссылок там не найдешь. Кэш Google живет недолго. Поэтому наиболее оптимальным решением является локальное архивирование всех посещенных URL. Их список можно автоматически экспортировать из истории серфинга в браузере.

    В своем блоге Гверн Бранвен публикует bash-скрипты, с помощью которых удобно экспортировать историю серфинга и автоматически скачивать все посещенные страницы в локальный архив. Для экономии места на диске он предлагает запускать программы-дедупликаторы и архиваторы вроде 7Zip с максимальной степень компрессии. Отдельная команда предварительно удаляет из локального архива веб-страницы с сайтов, которые не следует сохранять (например, Reddit).

    Организовав такой личный архив, вы убережете себя от потери какой-либо важной информации. Чтобы помочь и остальным, можно запустить еще один скрипт, который будет заливать копии всех этих страниц в десяток имеющихся онлайновых архивов, в том числе Internet Archive, чтобы они сохранялись и там.

    В конце концов, еще один скрипт предлагается для периодического поиска мертвых внешних ссылок на своем сайте и замены их на URL’ы с сохраненными копиями в онлайновых архивах.
     
XenForo add-ons by Waindigo™ ©2014 Waindigo Foundation.