Проект "Архив интернета" скопил уже больше 10 петабайт информации


Internet Archive

Некоммерческий проект The Internet Archive, запущенный в 1996 году и призванный сохранить вехи развития Сети, хранит уже 10 Пбайт (10 млн Гбайт) информации, сообщает "Сотовик.ру". Всего в архиве сохранено боле 85 млрд веб-страниц, которые являются общественным достоянием или защищены лицензией Creative Commons о бесплатном использовании контента на базе типового пользовательского соглашения.

Архив собирает копии веб-страниц, графические материалы, видео-, аудиозаписи и программное обеспечение. Проект намерен обеспечить долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики.

Самое интересное представлено системой "возврата в прошлое" (Wayback Machine), позволяющей посмотреть, как выглядели веб-сайты много лет назад. Важная составная часть проекта - библиотека Open Library, стремящаяся, как и сервис Google Books, сохранить в цифровом формате все книги мира.

Конечно, 10 Пбайт - довольно скромно в сравнении с объемом данных, собранных интернет-гигантами вроде соцсети Facebook, которая заявляет более чем о 100 Пбайт фотографий и видео на своей площадке. Однако ценность информации "Архива Интернета" куда как выше, нежели зачастую бессмысленный цифровой мусор.

Сервер Архива расположен в Сан-Франциско, а "зеркала" 0 в Новой Александрийской библиотеке и в Амстердаме. С 2007 года The Internet Archive имеет официальный статус библиотеки.

facebook
LJ