Web data extraction, screen scraping, web crawling, web harvesting. Zelf noemen ze het bij Mozenda liever “comprehensive web data gathering”. Ik noem het webdata grazen (want dan kan ik eindelijk een plaatje van een koe laten zien).
Mozenda is een tool waarmee je “agents” kan maken die geautomatiseerd data van websites plukt, om het vervolgens keurig voor je in een bestandje weg te schrijven. En dat alles via een razend makkelijke GUI, je hoeft dus niet te programmeren. Het is geen gratis tool (voor de goedkoopste versie betaal je 100 dollar per maand), maar er is wel een trial versie beschikbaar om het eens uit te proberen.
Uitproberen, dat is precies wat ik eens ben gaan doen. In no-time heb ik vandaag een agent gemaakt die, geautomatiseerd, de volgende stappen doorloopt:
Inloggen in Linkedin;
naar mijn “groups” pagina gaat;
een groep selecteert waar ik lid van ben;
de ledenpagina opent van die groep;
vervolgens van elk lid de naam, functie en aantal “followers” wegschrijft in een bestand;
van elk lid ook de profielpagina opent en ook daar nog wat data van wegschrijft in het bestand;
vervolgens op de “next” knop drukt om de volgende 20 leden te “grazen”, net zo lang tot er geen “next” knop meer is.
En zo had ik van complete linkedin groepen alle leden met relevante info in een keurig .csv bestandje. Nou ja, helaas niet alle leden van de grotere groepen, Linkedin laat nooit meer dan 500 leden zien.
Nu kan je natuurlijk wel nuttigere toepassingen bedenken. Wat te denken van periodiek (je kan je agents ook schedulen), de assortimentpagina’s van je concurrenten afstruinen om je prijspositie in de markt te bepalen? Of meningen over jouw product op vergelijkings-sites?
Al met al een leuke tool, ik sta verbaasd hoe simpel het allemaal gaat.
Hieronder een leerzaam filmpje van de tool, waarin ze reviews van een bepaalde productgroep gaan grazen.
Ik heb mij overigens in de aanloop naar de kamerverkiezingen wild geïrriteerd aan de debatten die steeds werden onderbroken om een hippe redacteur, met laptop in de aanslag natuurlijk, te laten vertellen wat die voor de nederlandse bevolking volledig a-typische groep van twitteraars van het debat vond.
Toch valt niet te ontkennen dat twitter een interessante (en realtime) bron van informatie kan zijn. Leuk artikel hierover in de Harvard Business Review: Six Ways to Find Value in Twitter’s Noise. In dit artikel laten ze een aantal mogelijkheden zien, door ten tijde van de launch van de Ipad te kijken welke woorden werden getweet in combinatie met het woord Ipad. Ze gebruikten hiervoor een “steam graph”, die de frequentie van de gebruikte woorden in de tijd laat zien.
Het aardige is dat diegene die deze grafiek voor de Harvard Business Review heeft gemaakt, op zijn site een interactieve versie heeft staan, waar je zelf een trefwoord kan opgeven. Onderstaande heb ik gemaakt met zijn Twitter SteamGraphs tool, voor het keyword “bavaria”. Tijdens de huldiging is Bavaria in context met Heineken genoemd, zie de reacties onder in het plaatje.
Sinds 1 maart is postfilter.nl in de lucht. Postfilter beheert het direct mail blokkade bestand en het nationaal overledenen register van stichting Infofilter (dat vanaf oktober 2009 het bel-me-niet register beheert).
Bedrijven die lid zijn bij een van de aangesloten brancheorganisaties kunnen kosteloos gebruik maken, niet-leden tegen een vergoeding.
Wat zou het leuk zijn als we deze data van Nederland hebben. Want hoewel je op het internet al heel wat informatie over je buurtje kan vinden, wil je eigenlijk weten of je buurtgenoten een beetje smaak hebben! Misschien kijken de mensen met wie ik mijn straat deel, wel naar films van Steven Seagal….brrrr.
Dus, bij deze een oproep aan Videoland, deel je data met mij!
Zou het ook geen verrijking zijn voor de huidige postcodesegmentaties? We hebben ook informatie over mediagebruik (gelezen tijdschriften, bekeken TV zenders, etc.). De data van een videotheek kan nog geld waard zijn. Of gebeurt dit al?
Geef je mening over dit artikel:
(nog geen stemmen, wees de eerste!)
Loading ...
SPSS liet marktonderzoekbureau Synovate rondetafelgesprekken voeren met vijftig marketingdirecteuren en interviewde 110 professionals om te vorsen hoe de vlag er bij hangt qua gebruik van klantinformatie. Je kan het rapport, na het afstaan van wat persoonlijke gegevens, aanvragen op de SPSS site.
Wat waren de belangrijkste resultaten?
Deze pagina is alleen toegankelijk voor leden. Login. Heeft u nog geen account? Registreer nu!
Gegegevenskwaliteitverbeteraar (leuk scrabble-woord) Human Inference is een kennisplatform gestart. ‘Watweetikvanmijnklant.nl‘ heet het en het organiseert voor vroege vogels onder andere ontbijtsessies.
Deze pagina is alleen toegankelijk voor leden. Login. Heeft u nog geen account? Registreer nu!
Tom Kok, voorzitter van de DDMA, stelt de onbeperkte houdbaarheid van iemands toestemming om te worden benaderd met (persoonsgerichte) reclame ter discussie, zo las ik in een artikel op Emerce. “Het wordt echter ook tijd om na te gaan over een weggooiplicht (…) Toestemming kan een keer ophouden”, melde hij tijdens het XS4All Privacydebat op FIFI 2008.
Wat vind jij: Is iemands opt-in voor eeuwig? Of moet elk opt-in adres een uiterste houdbaarheidsdatum meekrijgen?
Nou kan ik mij voorstellen dat het een goede marketingpraktijk kan zijn om klanten eens in de zoveel tijd te vragen of ze nog prijs stellen op je uitingen. Tegelijkertijd vraag ik mij af of het recht op verzet niet al genoeg in voorziet in de behoefte van de meeste klanten.
Hoe dan ook, een interessante stelling van het DDMA.