
Journalister kan ikke altid regne med at få data, pænt afleveret i regneark, klar til brug. Du bliver nødt til at kende alternative metoder.
Ofte siger en myndighed at man kan søge dem frem – bid for bid på deres hjemmeside. Eller data er blot spredt ud over mange, mange sider på nettet. I begge situationer er vi nødt til at sætte en maskine til at hente data hjem til vores eget regneark eller database. Det kalder vi web scraping, og det er der stor interesse for blandt journalister og researchere.
På kurset lærer vi dig at bruge programmet Heliumscraper til den slags opgaver. Det er et meget effektivt og forholdsvist billigt program, hvor du ikke behøver at kunne programmere for at være med. At skrabe et site for at skaffe sig data bør være sidste udvej, så på kurset gennemgår vi også alternativerne og giver dig de bedste tricks til at få data udleveret uden brug af skrabning.
Du lærer på kurset:
- at installere og anvende Heliumscraper
- at bygge en skraper, så du kan skrabe en lang række sites
- at indbygge en funktion, der bladrer fra side til side
- at indbygge en funktion, der åbner links til undersider, så du også kan skrabe dem
- at eksportere de indsamlede data til andre programmer
Kurset vil indeholde oplæg og mange praktiske øvelser.
Forudsætninger: Du skal have et grundlæggende kendskab til regneark. Du skal medbringe din egen windows-pc på kurset. Heliumscraper fungerer ikke på mac’s OS X styresystem.
Er din arbejdsplads ikke medlem af Pressens Uddannelsesfond, kan du tilmelde dig ved at sende os en mail.
Prisen omfatter undervisning, undervisningsmaterialer og forplejning i løbet af kurset. Prisen er ekskl. moms. Vi fakturerer i forbindelse med tilmelding til kurset.