Opgaver
Vi har formuleret nogle få opgaver. De er ment som en hjælp til at blive løbet i gang, men når du er i gang, er det helt fint at stikke af sammen med andre deltagere og følge din egen sti mod målet.
Velkommen til Det Kgl. Biblioteks Datasprint, hvor vi dykker ned i den fascinerende verden af digitale kulturarvsdata. Datasprintet er designet til bachelor- og kandidatstuderende. Gennem en række praktiske opgaver får du kendskab til datarensning, analyse og visualisering.
Nedenfor er de opgaver, du vil arbejde med under Datasprintet.
Opgave 1
Lær dine data at kende med opgaver i OpenRefine
Vær opmærksom på, at OR ikke er et analyseværktøj, men et værktøj til rensning af data.
Basal rensning i OpenRefine:
- fjern white spaces, fjern tal fra place kolonne (skal disse tal slettes eller gemmes?)
- text facets og cluster: afprøv forskellige clustering algoritmer på author og/eller place
- arbejd med et subset af datasættet - det går hurtigere
- opret kolonner på baggrund af eksisterende kolonner - for eksempel bevar den originale kolonne og gem resultatet fra et “cluster” i en ny kolonne
- lav en timeline med year kolonne (kræver, at datasættet er renset) - sammenligning af årstal og måder at skrive bynavne på ved hjælp af sort-funktionen.
- vælg en forfatter og undersøg ændring i og/eller emner/tematikker/bøger, de har skrevet i perioden.
Opgave 2
Hvad vælger du fra, når du vælger til?
Refleksionsopgave - kortsigtet og langsigtet betydning af metodiske beslutninger, der er truffet i forhold til at rense data, for eksempel standardisering af bynavne.
Opgave 3
Skab tidy data og eksporter dem til andre programmer
Rens og eksporter datasættet, så det kan analyseres og visualiseres ved hjælp af en Python, R eller Orange.
Brug OpenStreetMap til at berige dine data med geografiske koordinatorer. Vis herefter på et kort, hvor der er udgivet bøger.
Opgave 4
Dansk boghistorie - hvad afslører titlerne?
Tag et nærmere kig på titlerne.
Genudgivelser; hvilke titler/bøger har været så populære gennem Danmarks historie, at de er genudgivet mange gange?
Sammenlign hvor lang den typiske titel er i forskellige historiske perioder.
Undersøg de forskellige stavemåder, som knytter sig til forskellige historiske perioder eller emner; for eksempel reyse, reise eller rejse. Hvornår begyndte vi at skrive rejse med j?
Ved at løse opgaverne forbedrer du dine datakompetencer og får kendskab til, hvordan digitale værktøjer kan bruges til at udforske og fortolke kulturarvsdata.
Vi ser frem til at opleve, hvad du finder frem til, og hvad du lærer i løbet af Datasprintet!