Att analysera 6,7 miljoner jobbannonser

Uppdaterat: jun 3

Tillväxtverket och Universitetskanslersämbetet (UKÄ) har tillsammans analyserat 6,7 miljoner jobbannonser för att kartlägga arbetsmarknadens behov av digital kompetens. Arbetet är en del av ett regeringsuppdrag som syftar till analysera och föreslå hur kompetensförsörjningen av digital kompetens kan utvecklas i Sverige. Vi pratar med Erik Hegelund på Tillväxtverket för att lära oss mer om projektets metoder och insikter.



”Analysen bygger på öppna arbetsmarknadsdata från Platsbanken. De insikter vi kan dra av datan kan användas för att underlätta matchning på arbetsmarknaden vilket i sin tur kan bidra till ökad produktivitet och sysselsättning,” menar Erik Hegelund, handläggare och analytiker på Analysenheten på Tillväxtverket.


Projektet har läst in jobbannonser publicerade på Arbetsförmedlingens Platsbanken mellan 2006 – 2020 och analyserat dessa med hjälp av datadriven textanalys. Analysen visar bland annat att efterfrågan på digital kompetens har ökat med nästan det dubbla från 2006 fram till i dag. Den största lärdomen inom projektet kommer dock från att använda själva metoden med datadriven textanalys för att kartlägga tendenser i samhället.

”Det finns stora fördelar med att analysera rådata, i vårt fall själva texten i annonserna. Andra tänkbara metoder för sånt här arbete skulle till exempel kunna vara intervjuer eller enkäter. En fördel med just denna metod är att vi får möjlighet att läsa vad annonsörerna själva skrivit och göra egna beräkningar utifrån det. Sen behöver inte heller det faktum att ett visst ord nämns i en jobbannons innebära att det speglar exakt hur arbetsmarknaden ser ut, men det ger i alla fall en bra indikation.”


För att genomföra kartläggningen har projektet använt en datadriven analys programmerad i R, ett programmeringsspråk som ofta används för analys av text och statistik. Projektet skrev en kod som läste in samtliga jobbannonser och filtrerade dem utifrån olika söktermer kopplat till digital kompetens, så som olika programmeringsspråk. Användandet av en automatiserad metod för att gå igenom de 6,7 miljoner annonserna var avgörande; arbetet hade inte kunnat göras manuellt.


”Man kan ganska snabbt se enorm potential i den här typen av informationsmaterial och automatiserade metoder och det finns troligen en potentiellt stor samhällsnytta här som idag är relativt outnyttjad.”


Hur avgörande var det att jobbannonserna på Platsbanken lagts upp som öppna data?


”Att den här typen av öppna data existerar är helt avgörande för att kunna hämta in informationen och genomföra en sådan här kartläggning. Mycket av sådant här arbete var i princip omöjligt inte alltför långt tillbaka då både teknologin och data var mindre lättillgänglig än idag.”


Vad är fördelen med att tillgängliggöra offentliga öppna data?


”Att tillgängliggöra offentliga data så att vem som helst kan använda den för att ta fram nya tjänster och analyser öppnar upp för mer möjlighet och innovation. Det är jätteviktigt för samhället då det kan vara svårt för staten och myndigheter att själva komma på hur man bäst löser aktuella utmaningar i detalj.”


Vilka lärdomar drar ni inom projektet av arbetsmetoden?


”En lärdom är att vara ödmjuk inför hur svårt det är att jobba med rådata. Vi har spenderat väldigt mycket tid med att rensa data för att kunna göra analysen. Det är viktigt att filtrera hur en sökning sker så att man inte samlar upp fel information ”


Vad har ni kommit fram till inom projektet?


”I sommar släpps en rapport från projektet kring insikter och lärdomar. Vårt mål med rapporten är att illustrera att dessa data finns och är användningsbara. Vi ser stor potential i att använda den här typen av analys och metod för att ta fram indikationer på tendenser i samhället, så som efterfrågan på en viss typ av kompetenser, yrkesgrupper eller utbildningar.


Den stora lärdomen är kopplad till metoden. Vi visste redan att digital kompetens efterfrågas mer i och med den tekniska utvecklingen, men att testa att analysera den här mängden data för att nå samma slutsats är intressant. Vi kan också specificera vilka typer av digitala kompetenser som efterfrågas på en ganska detaljerad nivå.”


Hur kan den här typen av lösningar göra skillnad på arbetsmarknaden framöver?

”Arbetsmarknadsdata finns redan tillgänglig och Jobtech Development vid Arbetsförmedlingen jobbar för att göra den ännu mer användbar. Det intressanta är hur man framåt kan utveckla fler tjänster utifrån data som kan komma slutanvändaren till användning. Det är eftersträvansvärt att försöka göra den här typen av avancerade sökmetoder superenkla att använda för gemene man, såsom genom en applikation med färdiga filter bakom skalet. På så sätt skulle det bli lättare att själv förstå efterfrågan av kompetenser på arbetsmarknaden.”


Fler analyser och mer om regeringsuppdraget hittar du på https://digitalspetskompetens.se/


---


Webbinarium om projektet


Föreningen genomförde ett webbinarium om projektet den 27 maj och det blev vår största uppslutning hittills. Projektgruppen bakom regeringsuppdraget ’Digital spetskompetens’ vid Tillväxtverket och UKÄ presenterade sina metoder och insikter.


Erik Hegelund och Filippa Annersten inledde diskussionen med hur textanalys av platsannonser som metod kan användas för att kartlägga efterfrågan på kompetenser. Inom projektet togs en lista med 3000 ord fram inom kategorier som programspråk, mjukvara och utvecklingsmetoder. Annonserna söktes automatiskt igenom med hjälp av en datadriven analys programmerad i R. Det fanns även ett behov av att rensa datan så att exempelvis C-körkort inte dök upp i samma sökresultat som programmeringsspråket C#.


Den generella slutsatsen är att textanalys som metod fortsatt kan användas för att bättre förstå tendenser i samhället, och att öppna myndighetsdata är viktigt för att få tillgång till råinformationen. Vi fick även höra Jonas Södergren vid Arbetsförmedlingen Jobtech Development prata om möjligheterna med öppna arbetsmarknadsdata och Andreas Højbjerre (HBS Economics) om hur liknande textanalyser genomförts i Danmark.


Se webbinariet här: