Sammandrag

Vi skapade en ämneskarta där liknande eller identiskt innehåll samlas på samma områden på kartan. När artiklarna sedan är placerade på kartan uppskattade vi områdets åldersprofil.
I de bästa av världar gör man den här analysen på basis av de enskilda artiklarnas åldersprofiler, men eftersom den här informa- tionen inte är offentlig valde vi att göra en approximation med hjälp av demografidata som finns tillgänglig på varumärkesnivå.
Det betyder att vi betraktar den andel som de analyserade va- rumärkena har av sina användare som är under 35-åringar. De här siffrorna bildar sedan en sannolikhet för att den enskilda artikeln har lästs av just den profilen. När vi sedan räknar medeltalet av alla artiklar som publicerats just på det området på innehållskartan får vi en aggregerad bild av hur rimligt det är att innehåll som publiceras just på det området intresserar gruppen som vi är intresserade av.
Det måste dock understrykas att det här är en uppskattning på basis av den data som finns tillgänglig, med mer detaljerad data kan bilden självfallet förändras. Det här tillvägagångssätten missar interna profilskillnader inom det enskilda varumärket. Det vill säga om en viss typ av innehåll på exempelvis Hufvudstadsbladet konsekvent attraherar en yngre publik, uppfattar den här metodologin inte den signalen. Men däremot syns det i modellen om de varumärken som har en yngre profil också publicerar artiklar på det området. Så vårt antagande är att det här mönster kommer fram i helhetsbilden.
Gällande varumärkens åldersprofiler är det data som är förvånans- värt svår att hitta offentligt. För att kunna jämföra ett stort antal olika varumärken använder vi därför i den här analysen så kallad proxydata.

Facebook erbjuder data om åldersfördelningen för deras an- vändares intressen i deras kampanjplaneringsverktyg. Eftersom en så stor del av populationen använder Facebook, även unga, så beslöt vi att använda just den åldersprofil som Facebook rapporterar för varumärken i vår analys.

Andel under och över 35-åriga användare enligt varumärke i hela USA, Storbritannien, Finland och Sverige. Enligt vår uppfattning viktar Facebook inte åldersprofilerna enligt land, vilket betyder att USA med så stor popula-

tion dominerar siffran när det gäller de engelskspråkiga varumärkena, medan förstås de nordiska språken begränsar användarna. källa: Facebooks Audi- ence Insight, Various syftar här på data som samlats från olika källor. Källor- na är Digiday, Wall Street Journal, Verto Analytics, Schibsted Media Group. (https://www.vertoanalytics.com/chart-week-tracking-news-reader-demo- graphics/ https://digiday.com/media/not-5-charts-state-gawker-media/ https://blogs.wsj.com/cmo/2015/08/12/comcast-invests-200-million-in-vox- media-valuing-digital-media-firm-at-1-billion/ http://annonswebb.schibsted.se/sv/brands/svd-176/audience http://annonswebb.schibsted.se/sv/brands/aftonbladet-20/audience http://annonswebb.schibsted.se/sv/brands/omni-173/audience)

Vi har gjort ett antal jämförelser med offentlig och icke offentlig data. Några av benchmarkprofilerna ses i figuren ovan. Med hjälp av de här jämförelserna vågar vi anta att Facebooks åldersfördelning korrelerar, till och med överraskande väl, med den åldersfördelning som varumärkena själva har att tillgå.
En annan fördel är att Facebook för närvarande har en unik posi- tion.När de uppger användare handlar det på riktigt om Facebook-an- vändare och därmed riktiga personer som registrerat sig för tjänsten.
Stora delar av mediebranschen har fortfarande inte möjlighet att rita en bild av riktiga personer, utan är tvungna att uppskatta användning på en viss apparat, webbläsare eller motsvarande. Även till skillnad från många tjänster som kräver inloggning, exempelvis webb tv-applikationer, är Facebook-användningen så gott som alltid knuten till en person.
Här behöver vi dock vara medvetna om att a) variationen av hur de enskilda varumärkenas åldersfördelning korrelerar med Facebooks

åldersfördelning kan vara stor och b) Facebooks data finns till för deras syften att sälja annonsprodukter och vi har inga garantier för att data inte reflekterar det här syftet.

Processen i korthet

I det här avsnittet går vi djupare in på hur materialet för analysen byggdes tekniskt.

Processen för att skapa ämneskartan och analysen har sett ut så här:

1) Vi läste av de ovannämnda varumärkena genom att utnyttja olika metoder och tekniska källor. Här ingår allt från så kallad web scraping, rss-distribution och publikation av artiklar på Twitter.
2) Vi samlade rubrikerna för alla artiklar som publicerades under en given tidpunkt. Om artiklarna var skrivna på finska eller svenska översatte vi dem till engelska.
3) Vi skapade en modell som ger en numerisk representation av rubrikens semantiska betydelse genom att placera den på en punkt i en hyperrymd med 512 dimensioner.
4) Vi reducerade dimensionerna till två för att kunna rita ämneskartan.
5) Vi aggregerade artiklarnas andel av unga läsare och skapade en så kallad heatmap med hexagoner. Ju rödare cellen, det

vill säga hexagonen är, desto mer sannolikt representerar området ett ställe där man hittar många unga läsare.
6) Vi gjorde en heuristisk analys av de hexagoner som ser ut att innehålla mycket unga läsare och de som ser ut att innehålla få unga läsare.

Andel uppskattade användare under 35 åriga enligt varumärke. Uppgjord enligt den metod som vi redogör för ovan, källa Facebooks Audience Insights (här hela världen) samt de andra källorna.

Info

Skribent(er)