BERITA TERKINI
Internet Archive Capai Tonggak Satu Triliun Situs Web yang Diarsipkan

Internet Archive Capai Tonggak Satu Triliun Situs Web yang Diarsipkan

Internet Archive, salah satu proyek perpustakaan daring terbesar, mencatat tonggak baru setelah hampir 30 tahun beroperasi. Organisasi nirlaba ini berhasil melestarikan situs web ke satu triliunnya, sebuah capaian yang menegaskan pentingnya pengarsipan digital di tengah internet yang kian menjadi bagian tak terpisahkan dari kehidupan, namun dinilai tidak selalu stabil dan mudah berubah.

Meski internet menawarkan banyak manfaat, keberlanjutan konten digital kerap menjadi persoalan. Materi daring pada dasarnya bersifat sementara dan umumnya hanya bertahan selama pemiliknya memiliki sumber daya serta kemauan untuk terus memeliharanya.

Contoh yang kerap disorot adalah insiden MySpace pada 2019. Akibat kesalahan teknis saat migrasi server, jejaring sosial tersebut secara tidak sengaja menghapus konten musik dan data pengguna yang diunggah antara 2003 hingga 2015. Dalam waktu singkat, sekitar 50 juta lagu dari 14 juta artis disebut hilang selamanya dari internet.

Situasi semacam itu menjadi salah satu alasan keberadaan Internet Archive. Sejak 1996, organisasi ini menargetkan penciptaan “catatan permanen tentang evolusi Internet.” Upaya tersebut dilakukan melalui pengumpul data otomatis untuk mencadangkan situs web publik, serta menerima kontribusi sukarelawan, termasuk edisi cetak, rekaman audio, dan berbagai format media langka lainnya.

Setelah hampir tiga dekade, repositori Internet Archive dilaporkan telah mengumpulkan lebih dari 866 miliar halaman web dan 41 juta dokumen digital. Dengan sekitar 500 juta halaman ditambahkan setiap hari, total volume data diperkirakan mencapai sekitar 100.000 terabyte—disebut setara dengan kapasitas penyimpanan 50.000 iPhone kelas atas saat ini.

Namun, ambisi “perpustakaan umat manusia” ini menghadapi tantangan baru seiring ledakan kecerdasan buatan (AI). Perusahaan teknologi kini semakin agresif memanfaatkan data daring untuk melatih model bahasa berukuran besar, sering kali dalam situasi hukum yang belum sepenuhnya jelas.

Untuk melindungi hak cipta, sejumlah perusahaan media besar seperti The New York Times dan The Guardian mulai memblokir akses bagi alat pengarsipan. Langkah ini dipahami sebagai respons atas belum adanya kerangka hukum khusus yang menjamin kompensasi memadai bagi para kreator, terutama terkait penggunaan konten untuk menghasilkan materi berbasis AI.

Di sisi lain, pembatasan tersebut dinilai dapat membuat pelestarian ekosistem informasi menjadi lebih sulit. Ke depan, pencapaian kesepakatan mengenai hak dan tanggung jawab berbagai pihak dipandang penting bagi keberlangsungan Internet Archive, termasuk untuk mengejar target berikutnya dalam mengarsipkan hingga 2 triliun halaman web.