Duurzaam digitaal archiveren met Archivematica
Het IISG heeft gekozen voor het systeem Archivematica om de instroom en duurzame opslag van digitale collecties beter te beheren.
Na een zorgvuldige afweging van diverse systemen is begin 2017 de keuze gemaakt. Half maart 2017 is begonnen met de implementatie. De verwachting is dat voor de zomer van 2017 digitaal geboren archief via Archivematica verwerkt kan worden en daarna zullen gedigitaliseerde collecties en onderzoeksdata volgen.
Het IISG beschikte al wel over een workflow voor digitale collecties, maar die was vooral gebaseerd op een aantal zelfgemaakte scripts. Dat bleek steeds moeilijker te onderhouden, zeker gezien de enorme groei van de instroom en de toenemende urgentie digitaal geboren archief ook goed te verwerken.
In 2016 is een project gestart om een aantal bestaande systemen te bekijken en te testen. Uiteindelijk zijn testversies van Archivematica en Preservica geinstalleerd en uitvoerig onderzocht. Hoewel ook Preservica een uitstekend systeem is, bleek Archivematica financieel en organisatorisch beter bij het IISG te passen.
Archivematica maakt gebruik van een aantal micro-services die voor een bepaalde workflow aan en uit gezet kunnen worden en specifiek ingesteld. Er zijn bijvoorbeeld micro-services voor het scannen van virussen, het checken van de integriteit van de bestanden en het maken van gebruikskopieën van bestanden. De digitale collecties kunnen daar doorheen gevoerd worden om het materiaal in het e-depot op te slaan. Het systeem registreert alle bewerkingen en kenmerken van de bestanden zodat ze ook op langere termijn beheerd kunnen worden.
De workflow die Archivematica volgt in grote lijnen de stappen van het OAIS model. Dit model is een invloedrijk en belangrijk uitgangspunt voor duurzame digitale archivering. Door het gebruik van Archivematica volgt het IISG een zogenaamde OAIS-compliant workflow en komt zo een stuk dichterbij de status van een Trusted Digital Repository (TDR).
De implementatie van Archivematica gebeurt in samenwerking met de Canadese firma Artefactual. Zij zal het ontwikkelwerk doen om Archivematica in te richten naar IISG wensen en aan te sluiten op de bestaande infrastructuur van het IISG (Persistent Identifier Service, Acquisitie database, metadata systemen en opslagsysteem) . De verwachting is dat eind juni een beta-versie ingericht is voor de workflow van digitaal geboren archieven.
Na de zomer moet die in productie genomen worden en volgt de workflow voor gedigitaliseerde collecties. Tegelijkertijd starten we een onderzoek naar het verwerken van specifieke collecties email, sociale media en websites. Tenslotte is ook de bedoeling dat de bij het IISG opgeslagen onderzoeksdata via Archivematica verwerkt gaan worden.