Hoje encontramos praticamente de tudo na internet. É possível procurar desde uma simples receita de bolo até informações valiosas sobre o passado da humanidade.
No entanto, como a produção humana de conteúdo está cada vez maior, é necessário mais e mais espaço para guardar todas estas informações. E é aí que temos esbarrado em um grande desafio. Parte destas informações estão sumindo para sempre.
Parte das páginas da web não existem mais
- Segundo um estudo do Pew Research Center, um quarto de todas as páginas web que já existiram em algum momento entre 2013 e 2023 já não existem mais.
- Quanto mais antigos são os arquivos, maiores os problemas.
- A organização tentou acessar páginas existentes em 2013 e 38% delas não funcionam mais.
- O mesmo também pode acontecer com páginas mais recentes.
- Cerca de 8% dos conteúdos publicados em algum momento de 2023 desapareceram em outubro do mesmo ano.
- Ainda segundo o trabalho, um em cada cinco websites governamentais contém pelo menos um link quebrado.
- Além disso, mais da metade dos artigos da Wikipédia tem um link quebrado na sua seção de referências.
- Isso significa que parte da história humana simplesmente desapareceu para sempre.
- As informações são da BBC.
Leia mais
Acervo gigantesco busca guardar informações
É neste contexto que diversas organizações compostas na sua maioria por voluntários estão buscando uma forma de salvar esta enorme quantidade de dados. É o caso, por exemplo, do Internet Archive, uma organização sem fins lucrativos sediada em São Francisco, nos Estados Unidos.
Criada em 1996 como um projeto do pioneiro da internet Brewster Kahle, a organização criou o que pode ser o mais ambicioso projeto de arquivo digital já realizado. São 866 bilhões de páginas web, 44 milhões de livros, além de 10,6 milhões de vídeos com filmes e programas de televisão. Toda está coleção está guardada em diversos centros de dados espalhados pelo mundo.
O trabalho do Internet Archive também ajuda a recuperar alguns links quebrados. O projeto Wayback Machine usa robôs para rastrear cópias de websites e guardar este conteúdo.
O grande problema, no entanto, é que esta e diversas outras organizações estão enfrentando ameaças financeiras, dificuldades técnicas, ciberataques e batalhas jurídicas geradas por empresas que não aceitam que cópias da sua propriedade intelectual estejam disponíveis gratuitamente na internet. E sem o trabalho destas pessoas muitas informações simplesmente vão continuar desaparecendo para sempre.