Tugas VClass Softskill Pertemuan 2
1. Apa yang anda ketahui tentang Web Archiving
Web Archiving adalah proses mengumpulkan bagian dari WWW dan
memastikan koleksi tersebut diawetkan dalam suatu arsip, misalnya situs arsip,
untuk diakses peneliti, sejarawan, dan masyarakat umum pada masa datang.
2. Sebutkan dan Jelaskan serta berikan contoh cara kerja Web
Archiving
Remote Harvesting
adalah cara yang paling umum dalam web archiving dengan
menggunakan teknik web crawlers yang secara otomatis melakukan proses
pengumpulan halaman web. Metode yang digunakan web crawler untuk mengakses
halaman web sama semeprti user mengakses halaman web menggunakan wob browser.
Contoh web crawler yang digunakan dalam web archiving seperti :
• Heritrix
• HTTrack
• Wget
On-Demand
Ada banyak layanan yang dapat digunakan sebagai sumber
archive web “on-demand”, menggunakan teknik web crawling. Contohnya seperti :
• Aleph Archives
• archive.is
• Archive-It
Database Archiving
Databasa Archiving mengacu pada metode untuk menarsipkan
konten database-driven websites. Hal ini biasanya memerlukan ekstraksi konten
database ke standard schema, sering menggunakan XML. Setelah disimpan dalam
format standar, konten yang diarsipkan dari beberapa databse dapat tersedia
untuk diakses dengan menggunakan single access system. Motode ini digunkanan
seprti pada DeepArc dan Xinq masiing masing dikembangkan oleh Bibliothèque
nationale de France dan National Library of Australia.
Transactional Archiving
Transactional archiving merupakan event-driven yang
mengumpulkan transaksi yang berlangsung antara web server dan web browser. Hal
ini terutama digunakan untuk menjamin keaslian dari isi suatu website, pada
tanggal tertentu. Hal ini sangatlah penting untuk organisasi atau perusahaan
yang perlu mematuhi persyaratan hukum atau peraturan untuk mengungkapkan dan
mempertahankan informasi. Sistem yang digunakan pada transactional archiving
biasanya beroperasi dengan memeriksa setiap permintaan HTTP dan respon dari web
server, menyaring setiap aktifitas untuk menghilangkan konten yang duklikat dan
secara permanen disimpan sebagai bitstreams. Sebuah sistem transactional
archiving membutuhkan instalasi perangkat lunak pada web server, dan karena hal
itu maka metode ini tidka dapat mengumpulkan konten dari remote website.
Comments
Post a Comment