1. Новые покупки

    20.08.2017: [Наталья Карья] Интенсив. e-mail маркетинг на практике (2017)

    20.08.2017: [ЧК-FREE] - [Игорь Манн] - 50 правил ЖИЗНИ, МАРКЕТИНГА И БИЗНЕСА

    20.08.2017: Греби тонны трафика из вк [ОЧЕНЬ ЛЕГКО И БЫСТРО]

    20.08.2017: [EMPO] - Увеличиваем конверсию с помощью Google Optimize 2017

    20.08.2017: Обучение Бизнесу с Китаем от 100$ к 10.000$ за 2 месяца коучинг 17.0 (Версия Платинум)

    20.08.2017: Jonn22: Воркшоп по товарному бизнесу 2017

    20.08.2017: Курс "СуперЧтение" = Скорочтение + Развитие памяти

    19.08.2017: Эликсир бессмертия. Рецепт.

    19.08.2017: Tooligram Professional 2.5.4 Нулл

    19.08.2017: [КриптоСамурай] - обучение заработку на криптовалюте

    19.08.2017: Пиратский Консалтинг 2.0 (2017) +Пиратский консалтинг 2.0 (Пакет золото)

    19.08.2017: Феноменальная память для занятых людей

    18.08.2017: Николай Ягодкин - "Все программы центра Advance" 2015

    18.08.2017: "Стань сильнее", Pre-Intermediate (A2-B1)

    18.08.2017: От идеи до яркого текста. Тексты, которые цепляют.

    18.08.2017: Гуру After Effects: Анимация инфографики. Lynda.com на русском

    18.08.2017: [Аудиоккнига] - Блокчейн. Схема новой экономики

    18.08.2017: Заработок биткоинов (Программа Х8)

    18.08.2017: [Udemy] Создание 2D игр в Unity: Полнофункциональные игры

    18.08.2017: Делаем игры с нуля и до готового проекта (Unity). Эпизоды 1-10

    18.08.2017: [tceh] Учимся программировать на Python за 3 месяца

    18.08.2017: Инструментарий Data Science & Data Mining с помощью Python

    18.08.2017: Быстрая анимация в After Effects

    18.08.2017: Facebook Маркетинг Безумие Версия 2.0 - Продвижения в Свой Бизнес (2016)

    18.08.2017: [Convert Monster] Google Adwords 3.0 (2017)

Скрыть объявление
Схемы заработка, Складчины, Инфопродукты
Постоянные обновления только у нас!
Присоединяйся :)

Как бороться с мертвыми ссылками?

Тема в разделе "Статьи/Новости IT", создана пользователем Toretto, 1 фев 2014.

  1. Toretto

    Администратор

    Регистрация:
    13 янв 2014
    Сообщения:
    7.217
    Симпатии:
    5.018
    Говорят, что если какая-то информация опубликована в интернете, то ее уже невозможно стереть из Всемирной сети. Мол, джинн выпущен из бутылки и это необратимый процесс. На практике все иначе.
    skladchik, темы по заработку, инфопродукты, coga.biz.
    Веб — чрезвычайно динамическая среда. Сайты постоянно появляются и исчезают, старый контент удаляют, из-за изменения структуры сайта ссылки перестают работать. Мертвые ссылки — это действительно реальная проблема.


    На эту тему в последние десять лет проведено несколько исследований, которые показали, что ежегодно умирает как минимум 3% ссылок, и это весьма консервативная оценка. По статистике Internet Archive, среднее время жизни веб-страницы — всего лишь 100 дней. Научный журнал Science проверял живучесть ссылок в научных статьях. Спустя два года после публикации 13% ссылок уже не работали. Подтверждений этому феномену — десятки. Даже в хорошо контролируемой среде ссылки пропадают. Например, 11% твитов об Арабской весне пропали через год после публикации, хотя сервис Twitter (пока) функционирует.

    Американский разработчик Гверн Бранвен (Gwern Branwen) поддерживает свой сайт gwern.net, на котором много внешних ссылок. Программист молод и считает, что его сайт будет работать до 2070 года. Получается, что даже если брать консервативную оценку в 3% смертности ссылок ежегодно, то к 2070 году на его сайте останутся живыми только 16% ссылок. Это неприемлемо, если вы хотите гарантировать нормальную работу информационного ресурса.

    На онлайновые архивы вроде Internet Archive нельзя положиться полностью, потому что больше половины мертвых ссылок там не найдешь. Кэш Google живет недолго. Поэтому наиболее оптимальным решением является локальное архивирование всех посещенных URL. Их список можно автоматически экспортировать из истории серфинга в браузере.

    В своем блоге Гверн Бранвен публикует bash-скрипты, с помощью которых удобно экспортировать историю серфинга и автоматически скачивать все посещенные страницы в локальный архив. Для экономии места на диске он предлагает запускать программы-дедупликаторы и архиваторы вроде 7Zip с максимальной степень компрессии. Отдельная команда предварительно удаляет из локального архива веб-страницы с сайтов, которые не следует сохранять (например, Reddit).

    Организовав такой личный архив, вы убережете себя от потери какой-либо важной информации. Чтобы помочь и остальным, можно запустить еще один скрипт, который будет заливать копии всех этих страниц в десяток имеющихся онлайновых архивов, в том числе Internet Archive, чтобы они сохранялись и там.

    В конце концов, еще один скрипт предлагается для периодического поиска мертвых внешних ссылок на своем сайте и замены их на URL’ы с сохраненными копиями в онлайновых архивах.
     
XenForo add-ons by Waindigo™ ©2014 Waindigo Foundation.