Big data

Big data becomes business

Skärmavbild 2017-11-14 kl. 10.28.08.png

By PETER LUNDEGÅRDH  |  peter.lundegardh@di.se  |  Torsdag 30 juni 2016 

pastedImage.png

He is the mathematician who traded ideas to Richard Branson in exchange for lunch and invented algorithms that helped Barack Obama to success on social media. And he happens to be the only one who can predict if commuter trains will be delayed or not.

  I solve real problems, says Wilhelm Landerholm.


» You have probably, at some point, got stuck on while boarding an airplane, wishing it could go faster. Guess what, Wilhelm Landerholm has an algorithm for it.

With queue theory as his forte he can determine the most efficient way to fill the seats in a short period of time.

Either you put passengers in the right order already at the gate, or you can do it randomly. My suggestion is to give the travelers colored tiles and drop one colour at a time, he says.

FACTS | WILHELM LANDERHOLM

Age: 38 years.

Family: Married, two children, 6 and 4 years.

Living: In Täby, north of Stockholm.

Background: Mathematician, statistician and political scientist. In 2003 he published the e-book About Opportunities, and two years later the book Forget the customer with his own publishing house. Runs the company Queue. Last year he was well known after launching a forecast service for commuter trains via an app called the The Commuter Forecast.

Spare time: Play with his kids, preferably in nature. "I’m a Gaisare at heart and soul" (Gais = football team from Gothenburg). Loves licorice and is most comfortable in fleece sweaters.

Media habits: Twitter. "News junkie", Dagens Industri, Washington Post and The New York Times.


FACTS | 7 PROBLEM SOM WILHELM LANDERHOLM HAR LÖST:

1. A tool for aid organizations that predicts refugee flows.

2. An algorithm that reveal delays in commuter traffic – two hours before it happens.

3. Evaluating the success of a online dating date, based on how fast the woman logs back on to the site.

4. Maybe not a real problem, but he spends his free time predicting who will pick up trophies at the Academy Awards.

5. Sorting out what triggers people to retweet messages on Twitter. Used in Obama's reselection campaign.

6. He helped Richard Branson's Virgin Airlines to simplify the check-in process.

7. A system that alerts customers when products bought online get stuck in transport.


Wilhelm Landerholm is one of Sweden’s few real so-called data scientists. An expert in analyzing large amounts of data and in how to get a clear picture and draw concrete conclusions from statistical noise – through mathematical algorithms.

As the world us generating more and more data – just think about everything you share with your mobile or on Facebook – there are more opportunities than ever to turn this into business.

Retailers and global corporations are turning every stone for that kind of expertise. With his knowledge and ability Wilhelm Landerholm is sure to be one of the people that will help businesses grow in our data driven society.

 

Working in his "man-cave"

He is proud owner of the company Queue, a laboratory that tailors business concepts through data analysis. The office, or his "man cave", is located in Täby with two rooms and seating for eight people. Yet, he works alone.

The first thing you notice walking in are five clocks, showing the time in Los Angeles, Stockholm, New York, Mumbai and Seoul. But it’s dead silent, no tick, no tock.

The idea was to keep track of the time in my customers timezones, but they ticked extremely loud. I got crazy after two days and unplugged the batteries, Wilhelm says.

Along the walls there are shelves with neatly organized document boxes and large cartons full of sweets - coffee caramel is the obvious favourite. There are even more boxes of chocolate next to some of his favorite books. It is quite a mix of literature, everything from Douglas Adams The guardians of the galaxy to Vilhelm Moberg's The new builders. There you will also find the Start Your Own-handbook

Swedish companies are bad at taking advantage of big data’s opportunities, according to Wilhelm.

There is a high demand from large American groups or companies that work in that environment, such as Schibstedt and Kinnevik, he says and bites his tongue.

If confidentiality agreements could speak, the ones right behind him are screaming.

I have customers who basically are completely dependent on me and they would sue the shit out of me if I told who they are. I have to check who I'm allowed to talk about, but Aftonbladet and Tele2 are probably fine, it's been a while since I delivered algorithms to them.

A quialified guess would be that some of his clients are major retail chains in the UK. Some are perticularly nervous and require that their data is analyzed only on a computer that has never been connected to the Internet.

It's no problem. I'm working on good computers and with a computer power many people only dream about.

For his part, he has kept a low profile so far. Talking about himself, like now, is rare.

I'm really flying under the radar. It's very rare that I meet the end customer. My private zone is pretty big. I'm almost not ready to talk to you, really.

However, if the stereotype of a mathematician is an introvert and square person who loves numeracy, then Wilhelm Landerholm is the opposite.

You will notice him walking in to a room, but in a warm and charming way and he prefers fleeced sweaters over a suit.

Laughing loudly, sometimes in falsetto, and chatting like a popcorn machine. When a grain pops, a chain reaction is in motion and he can talk for hours. Shake the pan with a question or two and he will continue to pop. His answers could really go in every possible direction.

I know that I am like that, and it annoys me. Mathematicians are usually very stringent, and in some way that´s the ideal for me.

He lacks enough ego to admit that he received 0.1 points in the national university test.

There were two columns to fill in the answers. I wrote my answers in the wrong column. You should probably not get a higher score if you can’t read the instructions ...

But he is way more accurate when he describes what a data scientist actually does.

There are many out there who use the title without being close to using the right methods or analyze correctly, he says, pulling out a small circuit board from the jacket.
I usually bring this to customers, like food for thought. It's good for them to hold on to while I’m talking.

Big data isn’t necessarily ones and zeros in server halls in the size of hangars. The valuable part of the information can be handled on a small Raspberry Pi computer that costs a few hundred pounds at your ordinary electronics store.

Much of what I do is very abstract. It's about automated systems, but nothing you and me as customers notice. Sure, you can see the price tag, but from there to the underlying pricing strategies, it is a big, big leap.
I depend on combining a number of techniques, including something called Random Forest.

When I ask him to describe what Random Forest is – with the addition that he should explain it as simple as if I were his grandmother – he answers sincerely:

I've had many questions, but never that one! Lucky you did not ask me to explain to my mom, because she has a licentiate degree in inorganic chemistry.

The big point with Random Forest is to randomize observations and variables and make a decision tree on your sampled data. It allows you to get more trees – a forest. The point is that most of the trees will rate the data correctly, and that the errors appear in different places. This allows you to get a fairly robust estimate compared to just doing it once.

 

Delayed mail and web dating

But a deep diving in mathematical terms is not really necessary here. More importantly, pretty much anyone who reads this article have used, exposed, or benefited from a technical solution that Wilhelm Landerholm made.

He’s been innovating since 2003 and is so far up to 1,291 models, of which 250 are used right now. Here is a small selection from the models he throws out (at a pace only a stenographer could catch up with):

"The train brain". The train delay model to Stockholmståg. | "I built a model that can predict train delays two hours in advance. As far as we know, the model is world-unique when it's actually implemented and ticking and going. "

Centiro. | "It’s a model that alerts when a mail shipment, delivered from an online store, will be late."

Tele2. | "Several different things, but perhaps the best example is the model for creating customer clusters / product development segments."

Function C2. | "A simple method of measuring how successful a online-date is based on the time it takes before the girl logs in again. But it's so old that I don’t know what's left of it. "

 

Obama and Twitter

The commuter train tracker became a global news story when released a couple years ago and Wilhelm Landerholm was invited by BBC’s technical magazine Click to describe it.

After the program was broadcasted, my phone was in chock. I suddenly had 591 unanswered calls. One of those who called was a rail operator in Japan.

He made a taxi optimization model at the same time as the people behind Uber began to launch their idea and has carved together features that predict refugee flows, a tool for aid organizations.

In connection with Barack Obama's presidential campaign, datawizards were flocking to cast their spells. Wilhelm Landerholm was one of those who contributed with a feature linked to Twitter.

It was about sorting out what people respond to and what triggers them to retweet messages. If you know that, it's possible to have them send out a similar message, though from your own candidate.

In addition to the juggling of equations and analytical tools in his entrepreneurial business, he has also been involved in the start-up of Ecoguard, a energy measurement company, which currently has around 40 employees and has a turnover of 6 million euros.

The model can also be used as a negotiation weapon – how much to pay the actors in proportion to how much the movie will record.

The model has 21 parameters or measurement points such as action, concept and genre. The secret lies in how these estimates affect each other. He does not want to tell who use it, but the movie records hanging out at his office point to the fact that it's probably 20th Century Fox.

And who would walk home with a statue from this year's Oscars gala, Wilhelm Landerholm already knew in advance. Kind of.

Me and some friends have a game where we try to create as simple models as possible. We count the twelve most important statuettes, and everybody usually has ten-twelve-ish correct. The one who can build a model that is exact as possible with as little data as possible wins. My best performance so far is 20 correct winners out of 24 possible.

I make the mistake of asking how it works – it's like opening the gates to a dam. Out comes industry slang like bagging, logistic regression, classical regression (which seems to be a bad prediction technique, but good for capturing variety), Kalman filters, time series analysis and Markov chains (something Wilhelm Landerholm is obviously particularly weak for).

 

A bad businessman

In a more simple way, it seems to be about estimating and evaluate what other prizes the films or actors have won, or how many views the videos got on Youtube.

Personally, I often combine several techniques. But I really appreciate creating clusters. With good grouping of data you can create functions that have lower variations and deviations. I also like distance, in other words, vectors, where we describe an object's characteristics and then consider the difference, the distance, between these objects. That's basically what most cluster technicians do, but what I mean is the correction. If you are based on expectant model, you can add a bias to change the conditions.

He always carries a notebook full of ideas. Or improvement suggestions that he calls them. In plain text: equations with more letters than numbers. All written down with very neat writing and sober drawn diagrams and graphs.

I constantly think of new models that can solve problems of all kinds. If you ask my wife, she’d say it's tiring. I am always looking for a thought behind everything and can think about death date or how best to arrange a buffet breakfast in a hotel.

Wilhelm Landerholm tries to discover patterns. He structures reality and tests with different assumptions: "What would happen if you ..."

Even though he already in high school tried to sell biscuits and coca cola from his locker, he sees himself like a bad businessman.

I have not earned any big money. One of the models I have drawn has earned 23 million euros to the company I collaborated with. I received 2800 euros for that algorithm.

However, his brand new Volvo XC90 is parked outside the office. The company is hardly going bad.

 

Classed as superintelligent

Wilhelm Landerholm grew up in a middle-class part of Mölnlycke, outside Gothenburg. His parents were academics. Parents of some of his friends called him "Q" after the tech genius in James Bond since he rebuilt his bikes and designed soapbox cars. Math was no favorite subject. It was not until he went to Örebro University his love for math flourished. A school were Sweden’s National Statistics Agency happened to be involved with.

I wanted to go my own way after high school and chose Örebro because I did not know a single person there.

A teacher at the statistics institute discovered his potential and made sure that he improved his jedi skills in the subject with the help of a teacher at a university in Wales.

I received an introductory letter where I was described as superintelligent - which I’m really not - but I received special treatment. I have accumulated a lot of university credits. The most difficult of all courses was five points in management policy.

When he set out to find a job, it was more of an uphill battle.

I applied for many jobs as analysts in logistics and optimization. But I was probably too honest in my answers when they asked me what I'm good at, because I always replied “write exams”.

During the study period in the early 2000s, Wilhelm Landerholm sent a list of suggestions for improvement to Richard Branson with the offer that if any of them were introduced to the supercontractor's company, he would be invited to lunch.

There were three ideas, one of them was about how to make check-in functions better at Virgin. It was a long time ago, I do not even remember what we ate. Branson was barely present.

Now Wilhelm Landerholm has the privilege of choosing assignments.

I say no to about two hours of three. Often it is a project where there is no possibility of finding a solution in the given time span.

Very few companies have problems so big that a small computer can’t solve them. Most of the times it does not have to be complicated at all. A dispatching company that turned to him for help with arranging the queues at the loading dock in connection with loading and unloading. That was fixed through a webcam.

If the drivers in their mobiles could see what it looked like on the site, they could plan better and park only when there was a free cargo area. All problems do not require complicated solutions.

Underneath the kind and warm surface there is a more sticky side. Wilhelm Landerholm is getting angry with companies who treat their customers bad. He has even written a book about the phenomenon called Ignore the Customer. The thesis he thinks is that companies must look at their customers the same way rock band treats their fans.

Some companies he made fun of on Twitter are PostNord and Broker Statistics. He sees Facebook as careless in some respects, but has no problem with Google.

I've seen how Facebook – in real time – can sort out which travelers on bus 611 to Danderyd who are dog owners based on information about how people moved and what pictures they shared. To me, Google is more sensible. But maybe that's because I´m in contact with good people in that company.

 

The most exciting experiment

Some are exposed to his sense of humor. Prior to the last Swedish election, he could not keep his fingers away and started two Twitter accounts. One with a social-democratic profile and one Liberal profile. He let Twitter bots generate tweets and copy the partisans' posts.

That was the funniest experiment I did. The Social Democratic Account received 2,000 followers, the Liberals 800. Then I changed the Twitter profile so that the Liberals got social-democratic tweets and vice versa. I regret that I deleted those accounts without documenting the traffic.

The experiment managed caused some annoyance for several politicians, not least a Liberal in Solna.

Twitter data is fascinating. For a statistician, there is much to do with what is said there. It is possible to chart very much and try things.

Wilhelm Landerholm has, among other things, a weekly competition on his Twitter account where people present problems that need a solution. The best problems he writes on a whiteboard in the office. Right now you can find "Throw less food" and "How to like yourself?" on there.

I like those questions. It can’t be impossible to identify which ingredients are in the food that is thrown away most for example.

What is the relation between what is served and what is being thrown? Wilhelm Landerholm is able to find patterns in everything and thus an opening for a solution.

But what can you do with a emotion like what you feel about yourself?

The question is so abstract that it becomes mathematically interesting. Are there any data you can use to find a solution? Are there any data in what people post on Facebook or anywhere else? And how do you measure it?

A few years ago Wilhelm Landerholm tried to create a standard for statistical surveys. The idea was to have some kind of five-star rating system. Inexperienced investigations reveal a special glow in his eyes.

When I see things like ’One in three women get better hair from this shampoo’ I wonder what happened to the other two thirds. Did they drop their hair?

 

Can reveal Ikea's secret

In a world where large amounts of data can be exploited, there are huge profits to make from automation. And with more and more being available online opens up opportunities to find things out. The furniture giant Ikea's best kept secrets are how much every department stores sells. But to figure it out is basically simple, according to Wilhelm Landerholm.

The price of the products is known and online, you can see inventory balance. I just need to follow how the stock changes for hundreds of products to get a true picture. If I also want to put sales in relation to the number of customers, just count cars entering the parking lot. You don’t even have to do it by hand, you can set up a small Raspberry Pi computer and a sensor at the entrance.

For his own sake, he reluctantly uses bankcards. But than aging, he doesn’t have a wallet.

I'm probably one of the last ones who carry cash in my pocket. Cash is good. You get the right sense of how much something costs when pay with a five hundred note compared to the vague feeling of scrambling a code when shopping with cards.

If I had a lot of money, I would invest everything in companies dealing with zip technology, compression of large amounts of data, and how it can be done safely with encryption. There will happen a lot with that following years to come.

In addition to the consultancy assignments, Wilhelm Landerholm has an idea of creating "self-running companies".

I want put everything I made together and start data-driven companies. Each Raspberry Pi on this table can become a limited company. Many aspects of a company is very possible to automate.
He uses the Thai food shop near the office as an example. How many customers, what portions do they buy, which dishes are the best, what ingredients are needed? Everything can be entered into a data model. Get customers on Thursdays? Use the customer information available and send discount offers or inform about a special dish. Follow up. Build on.

One problem is that legislation in this area is lagging behind. Because what happens if the company doesn’t pay taxes?

I don’t always think patents are the best solution. It's better to tell everybody what you are doing and then hurry to get ahead of any competitors ready to copy the idea.

Wilhelm Landerholm sees a galaxy of possibilities in front of him, with one crucial detail.

It does not matter how good models I build in my chamber if they can’t be implemented in reality.

Other values in life

After spending the last fifteen years learning how to build models that handle large amounts of information, it is now time for Wilhelm to start capitalizing on the knowledge. His company is profitable, but in recent years, turnover has been about 100 000 euros.

He has formed strategic alliances with Kärnhuset, Novus, Norstat and Prime / United Minds.

I have a very comfortable life where others sell me as part of their projects, and I become part of their solution.

But as well as attracting big money, there are other values in life. For example, to spend a lot of time with the children and to hear his daughter stand up for herself in school:

When I picked her up, there was a little guy there – that kind who seems to need a hug – and says his father is a boss. And my daughter replied, “My father has no boss!”
Skärmavbild 2017-11-14 kl. 10.01.01.png
logo-footer.png

Big data blir business

Skärmavbild 2017-11-14 kl. 10.28.08.png

Av PETER LUNDEGÅRDH  |  peter.lundegardh@di.se  |  Torsdag 30 juni 2016 kl. 14:00

MATEMATIKENS KLAS INGESSON. Att Wilhelm Landerholm skulle vara matematikens svar på Zlatan håller han själv inte med om. "Jag är nog mer en Klas Ingesson-typ", säger han och skrattar.

MATEMATIKENS KLAS INGESSON. Att Wilhelm Landerholm skulle vara matematikens svar på Zlatan håller han själv inte med om. "Jag är nog mer en Klas Ingesson-typ", säger han och skrattar.

Han är matematikern som gett idéer till Richard Branson i utbyte mot lunch, gjort algoritmer som hjälpt Barack Obama i sociala medier. Och så kan han förutspå om pendeltåg kommer att bli försenade.

Jag löser verkliga problem, säger Wilhelm Landerholm.

» Stått och stampat på väg in i ett flygplan någon gång och önskat att det ska gå snabbare? Wilhelm Landerholm har en algoritm för det.

Han har köteori som specialitet och är kvalificerad att slå fast hur man matematiskt sett bäst fyller sätena på kortats tid.

Antingen sätter man passagerarna i rätt ordning redan vid gaten, eller så fyller man på det slumpmässigt. Mitt förslag är att ge resenärerna färgade brickor och släppa in en färg i taget.

Vissa kallar honom matematikens svar på Zlatan, men det är inget han vill kännas vid.

Jag är nog mer en Klas Ingesson-typ. Fel man på fel plats”, säger han och skrattar högt.

FAKTA | WILHELM LANDERHOLM

Ålder: 38 år. Familj: Gift, två barn, 6 och 4 år.

Bor: Radhus i Täby.

Bakgrund: Matematiker, statistiker och statsvetare. Gav 2003 ut en e-bok med titeln Om möjligheter och två år senare boken Skit i kunden på eget förlag. Driver bolaget Queue. Blev i fjol känd efter att ha lanserat en prognostjänst för pendeltågstrafiken via en app kallad Pendelprognosen.

Fritid: Leka med barnen, gärna i naturen. ”Gaisare i själ och hjärta”. Älskar smågodis – lakrits – och trivs bäst i fleecetröja.

Medievanor: Twitter. ”Nyhetsknarkare”, läser Dagens industri, Washington Post och New York Times. Prenumererar på Grönköpings Veckoblad.


FAKTA | 7 PROBLEM SOM WILHELM LANDERHOLM HAR LÖST:

1. Kan förutsäga flyktingströmmar, ett verktyg för biståndsorganisationer.

2. Har utvecklat en funktion som två timmar i förväg kan avslöja vilka pendeltåg som blir försenade.

3. Kan se om en nätdejt blev lyckad, baserat på hur snabbt kvinnan loggar in på sajten igen.

4. Roar sig på fritiden med att förutse vilka filmstjärnor som kommer att vinna Oscarstatyetter.

5. Kan sortera ut vad som triggar folk att retweeta budskap på Twitter. Användes i Obamas återvalskampanj.

6. Har hjälpt Richard Bransons flygbolag Virgin att förenkla incheckningen av flygresenärer.

7. Har utvecklat ett system som varnar för att paket från nätbutiker har fastnat på vägen till kunden.

8. ...och till sist ett problem som saknar lösning: Den optimala placeringen av utbudet på en frukostbuffé.


Fast det där om att vara felplacerad är en direkt lögn.

Wilhelm Landerholm är nämligen en av landets få äkta så kallade data scientists: expert på analys av stora datamängder och hur man med matematikens hjälp, läs algoritmer, kan skapa en begriplig bild och dra konkreta slutsatser av statistikbrus.

I takt med att allt större datamängder genereras i världen – tänk bara på allt du delar med dig via din mobil eller Facebook – finns nya möjligheter att omsätta detta till affärer.

Detaljhandelsjättar och globala koncerner vrålar efter den sortens expertis. Wilhelm

Landerholm sitter alltså på en kunskap och förmåga som om han stod på en fotbollsplan skulle kunna liknas vid en straffsparksläggning – utan målvakt.

Jobbar i sin ”man-cave”

Han är stolt ägare av bolaget Queue, ett laboratorium som skräddarsyr affärskoncept med tyngdpunkt på dataanalys. Kontoret, hans ”man-cave”, ligger i Täby. Det har två rum och plats för åtta personer, men han jobbar ensam.

På väggen vid entrén hänger fem klockor som ska visa tiden i Los Angeles, Stockholm, New York, Mumbai respektive Seoul.

Alla står stilla.

Tanken var att jag skulle kunna hålla koll på tiden hos mina kunder, men de tickade högt som tusan. Efter två dagar blev jag galen och drog ur batterierna.

I hyllorna utmed väggarna finns prydliga staplar med dokumentlådor och även stora kartonger fulla med sötsaker – kaffekolor, som uppenbarligen är favoritgodiset. Han har även ett förråd av Paradischokladkartonger intill några rader pocketböcker om läslusten skulle falla på: från Douglas AdamsLiftarens guide till galaxen till Vilhelm MobergsNybyggarna. Han har också Starta Eget-handboken.

Svenska företag är dåliga på att utnyttja möjligheterna med big data, enligt Wilhelm Landerholm.

Efterfrågan finns hos stora amerikanska koncerner eller bolag som verkar i den miljön, som Schibstedt och Kinnevik, säger han och biter sig i tungan.

I en av vägghyllorna står nämligen två pärmar med sekretessavtal.

Jag har kunder som i stort sett lever på mig och de skulle stämma skiten ur mig om jag berättade vilka de är. Jag måste kolla vilka jag får prata om, Aftonbladet och Tele2 går nog bra, det var ett tag sedan jag levererade algoritmer till dem.

Av allt att döma är några av slutkunderna stora detaljhandelskedjor i Storbritannien. Vissa är särskilt nervösa. De kräver att deras data endast får analyseras på en dator som aldrig varit kopplad till internet.

Det är inget problem. Jag sitter på bra ’burkar’ och en datakraft många drömmer om.

För egen del har han hittills hållit en låg profil. Att prata om sig själv, som nu, är sällsynt.

Jag flyger nog väldigt mycket under radarn. Det är ytterst sällan jag träffar slutkunden. Min privata zon är väldigt stor. Jag är nästan inte redo att prata med dig, egentligen.

Om stereotypen av en matematiker är en inåtvänd och stel person som älskar sifferexercis så är Wilhelm Landerholm motsatsen.

Han tar plats och märks, på ett avväpnande sätt. Trivs bättre i fleecetröja än i kostym. Skrattar högt, ibland i falsett, och pratar som en popcornmaskin. När ett korn poppar skapas en kedjereaktion och han kan snacka i timmar. Skaka till grytan med en fråga eller två så fortsätter det att smattra. Svaren skjuter iväg åt alla möjliga håll.

Jag vet om att jag är sådan och det irriterar mig litegrann. Matematiker är vanligtvis väldigt stringenta och det är på något sätt idealet för mig.

Han har självdistans nog att erkänna att han fick 0,1 poäng på högskoleprovet.

Det fanns två kolumner att fylla i svaren. Jag skrev mina svar i fel kolumn. Man ska inte ha högre poäng om man inte kan läsa instruktionerna...

Men han är desto mer noggrann när han lägger ut texten om vad en data scientist egentligen gör.

Det finns många därute som slänger sig med det uttrycket men inte är i närheten av att använda sig av metoder och analyser på riktigt, säger han och halar upp ett litet kretskort ur jackfickan.
Jag brukar ha med mig det här till kunderna, som olja för tankarna. Det är bra för dem att hålla i medan man pratar.

Big data behöver nämligen inte vara ettor och nollor i servrar packade i datahallar stora som hangarer. Den värdefulla delen av informationen kan hanteras på en liten Raspberry Pi-dator som kostar några hundralappar på Kjell & Company.

Mycket av det jag gör är väldigt abstrakt. Det handlar om automatiserade system, men ingenting man som du och jag som kunder märker av arbetet bakom. Visst, man kan se prislappen, men därifrån till de underliggande prissättningsstrategierna är avståndet stort.
Jag lever på att kombinera en rad tekniker, bland annat en kallad Random Forest.

När jag ber honom beskriva vad Random Forest är – med tillägget att han ska förklara enkelt, som om jag vore hans farmor – svarar han uppriktigt:

Jag har fått många frågor, men aldrig den! Tur att du inte bad mig förklara för min mamma, för hon har en licentiatexamen i oorganisk kemi.
Den stora poängen med Random Forest är att du slumpar ut observationer och variabler och gör ett beslutsträd på din samplade data. Det gör att du får flera träd – en skog. Poängen är att de flesta av träden kommer att klassa datan rätt, och att felen dyker upp på olika ställen. Det gör att du får en tämligen robust skattning i jämförelse med att bara gör det en gång, till exempel.

Försenad post och nätdejting

Men en djupdykning i matematiska termer är egentligen inte nödvändig här. Viktigare är att alla som läser den här artikeln någon gång har använt, utsatts för eller dragit nytta av en teknisk lösning som Wilhelm Landerholm ligger bakom.

Han har hållit på sedan 2003 och hittills har det blivit 1 291 modeller, varav 250 används i detta nu. Ett litet urval från den lista som han rabblar ur sig i en hastighet som bara en stenograf skulle hinna få ned på papper:

”The train brain”. Tågförseningsmodellen till Stockholmståg. | Där jag byggt en modell som kan förutspå två timmar i förväg vilka tåg som kommer att bli försenade. Så vitt vi vet är modellen världsunik då den faktiskt är implementerad och tickar och går.

Centiro | Jag har tagit fram en modell för att varna för att en postförsändelse, leverans från en nätbutik, kommer att bli sen.

Tele2 | Flera olika saker, men det kanske bästa exemplet är modellen för att skapa kundkluster/segment för produktutveckling.

Funktionen C2 | En enkel metod att mäta hur lyckad en nätdejt är baserat på tiden det tar innan tjejen loggar in igen. Men den är så gammal att jag inte vet vad som finns kvar av den.

Han har också tagit fram en modell för att räkna ut hur många Aftonbladet och Aftonbladetbilagor ska levereras till butiksställ.

Jag har gjort modellen för X antal återförsäljare som ska få Y antal tidningar/bilagor.

Obama och Twitter

Pendeltågskollen blev en världsnyhet när den släpptes häromåret och Wilhelm Landerholm bjöds in av BBC:s teknikmagasin Click för att berätta.

Efter att programmet sänts smällde det till i min mobil. Jag hade plötsligt 591 obesvarade samtal. En av dem som ringde var en tågoperatör i Japan.

Han gjorde en taxioptimeringsmodell i samma veva som gänget bakom Uber började lansera sin idé och har snickrat ihop funktioner som förutspår flyktingströmmar, ett verktyg för biståndsorganisationer.

I samband med Barack Obamas presidentvalkampanj flockades datawizards som ville svinga sina trollspön. Wilhelm Landerholm var en av dem som bidrog med en funktion kopplad till Twitter.

Den handlade om att sortera ut vad folk reagerar på och vad som triggar dem att retweeta budskap. Vet man det går det att få dem att föra ut ett liknande budskap, fast med ens egen kandidat som avsändare.

Vid sidan om jonglerandet med ekvationer och analysverktyg i sin entreprenörsverksamhet har han även varit med och startat energimätningsbolaget Ecoguard, som i dag har runt 40 anställda och omsätter 60 miljoner kronor.

Ett av mina första jobb var en plattform där man kan maximera det totala resultatet av investerade pengar i ett filmprojekt. Men den kan inte identifiera floppar eller okonventionella filmsuccéer som Juno.

Modellen kan även användas som förhandlingsvapen – hur mycket man ska betala skådespelarna i förhållande till hur mycket filmen kommer att spela in.

Modellen har 21 parametrar eller mätpunkter som till exempel handling, koncept och genre. Hemligheten ligger i hur dessa skattningar påverkar varandra. Han vill inte berätta vem som använder den, men filmaffischerna som hänger på hans kontor pekar på att det rör sig om 20th Century Fox.

Hur statyetterna skulle fördelas vid årets Oscarsgala visste dock Wilhelm Landerholm redan i förväg. Typ.

Jag och några vänner har en intern tävling där vi försöker utgå ifrån så lätta modeller som möjligt. Vi räknar de tolv tunga statyetterna och där brukar alla ha tio-tolv-ish rätt. Den som kan bygga en modell som är så bra som möjligt med så lite data som möjligt vinner. Mitt bästa resultat hittills vid en Oscarsgala är 20 av totalt 24 vinnare av statyetterna.

Jag gör misstaget att fråga hur det går till – för det är som att öppna fördämningsluckorna till en damm. Ut forsar yrkesjargong som bagging, logistisk regression, klassisk regression (som tycks vara en dålig prediktionsteknik, men bra för att fånga upp variation), Kalmanfilter, tidserieanalys och Markovkedjor (något Wilhelm Landerholm tydligen är särskilt svag för).

En dålig affärsman

Enklare uttryckt går det ut på att skatta och värdera vilka andra priser filmerna eller skådespelarna har fått eller i vilken utsträckning klipp ur filmerna visats på Youtube.

Personligen kombinerar jag ofta flera tekniker. Men jag uppskattar verkligen att skapa kluster. Genom bra grupperingar av data kan du nämligen skapa funktioner som har lägre variationer och avvikelser. Sedan gillar jag avstånd, alltså vektorer där vi beskriver ett objekts egenskaper och sedan betraktar skillnaden, avståndet, mellan dessa objekt. Det är ju i grunden vad de flesta klustertekniker gör, men vad jag menar är korrigeringen. Om du utgår ifrån en väntevärdesriktig modell så kan man med flit tillföra en bias för att ändra förutsättningar.

Han bär alltid med sig en anteckningsbok fullklottrad med idéer. Eller förbättringsförslag, som han väljer att kalla dem. I klartext: ekvationer som har fler bokstäver och grekiska tecken i sig än siffror. Allt nedtecknat med väldigt prydlig handstil och sobert ritade diagram och grafer.

Jag funderar konstant på nya modeller som kan lösa problem av alla möjliga slag. Om du frågar min fru tycker hon att det är tröttsamt. Jag söker hela tiden en tanke bakom allt och kan fundera till döddagar på hur en frukostbuffé på ett hotell ska arrangeras på bästa sätt.

Wilhelm Landerholm försöker upptäcka mönster. Han strukturerar upp verkligheten och testar med olika antaganden: ”Vad skulle hända om man ...”

Trots att han redan i högstadiet övade med att sälja kexchoklad och coca-cola ur sitt skåp ser han sig som en dålig affärsman.

Jag har inte tjänat några stora pengar. En av modellerna jag tagit fram har dragit in 230 miljoner kronor till bolaget jag samarbetade med. Jag fick 28 000 kronor för den algoritmen.

På parkeringen utanför kontoret står dock hans sprillans nya Volvo XC90, där mätarställningen visar 591 kilometer. Firman går knappast knackigt.

Klassades som överintelligent

Wilhelm Landerholm växte upp i ett medelklasstryggt Mölnlycke. Föräldrarna var akademiker. Somliga av kompisarnas föräldrar kallade honom ”Q” efter tekniksnillet i Bondfilmerna, eftersom han byggde om sina cyklar och konstruerade lådbilar. Matte var inget favoritämne. Den kärleken blomstrade först på Örebro universitet, (där Statistiska centralbyrån för övrigt sätter sin prägel på en del av skolan).

Jag ville gå min egen väg efter gymnasiet och valde Örebro eftersom jag inte kände en enda person där.

Docenten på statistikinstitutionen upptäckte potentialen i den reslige västsvensken och såg till att han bättrade på sina jedi-kunskaper inom ämnet hos en läromästare på ett universitet i Wales.

Jag fick med mig ett introduktionsbrev där jag beskrevs som överintelligent – vilket jag definitivt inte är – men jag fick specialbehandling. Jag har samlat på mig väldigt många universitetspoäng. Svårast av alla kurser var fem poäng förvaltningspolitik.

När han skulle ut på arbetsmarknaden var det mer uppförsbacke.

Jag sökte många jobb som analytiker inom logistik och optimering. Men jag var nog för ärlig i mina svar när de frågade om vad jag är bra på, för jag svarade alltid: ’Att skriva tentor’.

Under studietiden i början av 2000-talet skickade Wilhelm Landerholm en lista med förbättringsförslag till Richard Branson med erbjudandet att om något av dem infördes i superentreprenörens företag ville han bli bjuden på lunch.

Det var tre idéer, en av dem handlade om hur man kunde göra incheckningen bättre på Virgin. Det var länge sedan, jag kommer inte ens ihåg vad vi åt. Branson var knappt närvarande. Känslan var som någon sagt: att gilla gåslever och sedan få träffa gåsen.

Wilhelm Landerholm har förmånen att kunna välja uppdrag.

Jag säger nej till ungefär två timmar av tre. Ofta är det uppdrag där det inte finns någon möjlighet att få fram en lösning på den tid som ges.

Väldigt få företag har så stora problem att de inte går att lösa även med en liten dator. Ibland behöver det inte vara krångligt alls. En speditionsfirma som vände sig till honom för att få ordning på köerna vid lastkajen i samband med lastning och lossning fixades med en webbkamera.

Om chaufförerna i sina mobiler kunde se hur det såg ut på platsen kunde de planera bättre och köra fram först när det fanns en ledig lastplats. Alla problem kräver inte komplicerade lösningar.

Under den vänliga och varma ytan finns en mer taggig sida. Wilhelm Landerholm går i gång och blir arg på företag som behandlar sina kunder taffligt. Han har till och med skrivit en bok om fenomenet med titeln Skit i kunden. Tesen han för fram är att företag måste se på sina kunder på samma sätt som rockband behandlar sina fans.

Några företag han ondgjort sig över på Twitter är Post Nord och Mäklarstatistik. Han ser Facebook som omdömeslöst i vissa avseenden, men har inga problem med Google.

Jag har sett hur man på Facebook – i realtid – kan sortera ut vilka resenärer på buss 611 till Danderyd som är hundägare utifrån information om hur personerna rört sig och vilka bilder de delat. För mig är Google mer omdömesgilla. Men det kanske beror på att jag har kontakt med bra personer i det företaget.

Det roligaste experimentet

Somliga råkar ut för hans skämtlynne. Inför senaste valet kunde han inte hålla fingrarna borta utan startade två Twitterkonton med socialdemokratisk respektive moderat profil. Han lät Twitterbotar generera tweets och kopierade partivännernas inlägg.

Det var det roligaste experiment jag gjort. Det fejkade socialdemokratiska kontot fick 2 000 följare, det moderata 800. Sedan bytte jag Twitterprofil så att moderatgänget fick socialdemokratiska tweets och tvärtom. Jag ångrar att jag raderade de där kontona utan att ha dokumenterat trafiken där.

Experimentet lyckades retade gallfeber på flera politiker, inte minst en moderat i Solna kommun.

Twitterdata är fascinerande. För en statistiker finns det mycket man kan göra med det som sägs där. Det går att kartlägga så mycket och testa saker.

Wilhelm Landerholm har ibland en så kallad fredagstävling på sitt Twitterkonto, där folk kan posta problem som behöver en lösning. De bästa skriver han upp på en whiteboard på kontoret. På listan finns nu bland annat ”Slänga mindre mat” och ”Hur tycka om sig själv”.

Jag gillar de där frågorna. Det måste gå att identifiera vilka ingredienser som finns med i den mat som slängs mest till exempel.

Vilka samband finns mellan vad som serveras och vad som slängs? För Wilhelm Landerholm går det att hitta mönster i allt och därmed en öppning för en lösning.

Men vad kan du göra med en känslofråga som vad man tycker om sig själv?

Frågan är så abstrakt att den blir matematiskt intressant. Finns det data man kan använda sig av för att hitta en lösning? Finns det data i vad folk postar på Facebook eller någon annanstans? Och hur mäter man?

Wilhelm Landerholm försökte för några år sedan skapa en standard för statistiska undersökningar. Idén var att ha ett slags femstjärnigt betygsystem. Undermåligt underbyggda undersökningar tänder en speciell glöd i hans ögon:

När jag ser saker som ’En av tre kvinnor får bättre hår av det här schampot’ undrar man ju vad som hände med de andra två tredjedelarna. Tappade de håret? Dog de?

Kan avslöja Ikeas hemlighet

I en värld där stora datamängder går att utnyttja finns stora vinster att göra med automatisering. Och att allt mer är tillgängligt på nätet öppnar möjligheter att ta reda på saker. En av möbeljätten Ikeas bäst bevarade hemligheter är hur mycket varje varuhus omsätter. Men att räkna ut det är i grunden enkelt, enligt Wilhelm Landerholm.

Varornas pris är känt och på nätet kan man se lagersaldo. Jag behöver bara följa hur lagret förändras för ett hundratal produkter för att kunna få en skaplig bild. Vill jag dessutom sätta försäljningen i relation till antal kunder är det bara att räkna bilar som kör in på parkeringen. Man behöver inte ens göra det för hand utan kan sätta upp en liten Raspberry Pi-dator och en sensor vid infarten.

För egen del använder han motvilligt bankkort. Men har heller ingen plånbok.

Jag är väl en av de sista som har kontanter i fickan. Kontanter är bra. Man känner av hur mycket något kostar när man tar fram en femhundralapp jämfört med den vaga känslan att knappa in en kod när man handlar med kort.
Om jag hade en massa pengar skulle jag investera allt i bolag som sysslar med zip teknik, komprimering av stora datamängder, och hur det kan göras säkert med kryptering. Där kommer det att hända oerhört mycket.

Vid sidan om konsultuppdragen har Wilhelm Landerholm en idé om att skapa ”självkörande företag”.

Jag vill koka ihop all soppa jag gjort och starta datadrivna bolag. Varje Raspberry Pi här på bordet kan bli ett eget aktiebolag. Det går att automatisera väldigt många led i ett bolag.

Han tar thaimatskiosken i närheten av kontoret som exempel. Hur många kunder, vilka portioner köper de, vilka rätter går bäst, vilka ingredienser behövs? Allt går att mata in i en datamodell. Få kunder på torsdagar? Använd de kunduppgifter som finns tillgängliga och skicka erbjudanden om rabatt eller att det finns en specialrätt. Följ upp. Bygg vidare.

Ett problem är att lagstiftningen på det här området släpar efter. För vad händer om bolaget hoppar över att betala skatt?

Jag tror inte alltid på att patent är den bästa lösningen. Det är bättre att berätta vad man håller på med och springa snabbt för att hinna före eventuella konkurrenter som är beredda att kopiera ens idé.

Wilhelm Landerholm ser en galax av möjligheter framför sig, med en avgörande detalj:

Det spelar ingen roll hur bra modeller jag gör på min kammare om de inte går att implementera i verkligheten.

Andra värden i livet

Efter att ha ägnat de senaste femton åren att lära sig bygga modeller som hanterar stora informationsmängder är det nu dags att börja kapitalisera på kunskaperna. Hans företag går med vinst men omsättningen har de senaste åren i snitt hovrat kring 1 Mkr.

Han har bildat strategiska allianser med Kärnhuset, Novus, Norstat och Prime/United Minds.

Jag har en väldigt bekväm tillvaro där andra säljer in mig som en del i sina projekt, och jag blir en del i deras lösning.

Men likaväl som att dra in stora pengar finns andra värden i livet. Exempelvis att kunna tillbringa mycket tid med barnen och få höra dottern ge svar på tal på skolan:

När jag hämtade henne stod det en liten kille där – en sådan där som ser ut att behöva en kram – och säger att hans pappa är chef. Dottern svarade: ’Min pappa har ingen chef!’
Skärmavbild 2017-11-14 kl. 10.01.01.png
logo-footer.png

Stukton Rail features The Train Brain in their publication Spåradiskt

TEXT KATARINA BRANDT FOTO MATTON

TEXT KATARINA BRANDT FOTO MATTON

Som pendlare vill man komma fram i tid, men nästa lika viktig är pålitlig information om förseningar.  Med hjälp av Big Data och Artificiell Intelligens bidrar tjänsten The Train Brain till att öka kundnöjdheten genom att förutse förseningar i trafiksystemet.

Siffrorna talar sitt tydliga språk. Under 2015 var 33 procent av alla persontåg i Sverige försenade eller inställda. Eftersom de flesta järnvägsnät körs nästintill på maxkapacitet, är en av de vanligaste orsakerna till tågförseningar en dominoeffekt av andra förseningar. Det innebär att man i varje järnvägsnät kan se ett mönster för hur förseningar sprider sig vidare, ett mönster som är specifikt för just det nätverket.

Genom att analysera mönster i tågförseningar i Stockholms pendeltågsnät, har den svenska matematikern Wilhelm Landerholm skapat en algoritm som resulterat i världens första helautomatiska prognostjänst – The Train Brain.

The Train Brain Fungerar som en hjärna, berättar Jonas Järnfeldt, vd och en av grundarna till Commuter Computer som säljer tjänsten. Den minns vad som hänt ii trafiken tidigare och kan utifrån den informationen göra träffsäkra prognoser på hur trafiken kommer att se ut framåt.

En möjlighet att snabbt agera på troliga händelser

The Train Brain ger helt nya möjligheter till både trafikplanering och trafikinformation. Tjänsten kan hjälpa trafikledare med varningar så att de snabbt får möjlighet att agera på troliga händelser. Dyker det upp en varning om en trolig försening kan de undvika eller minska effekterna genom att till exempel sätta in ett nytt tåg eller sakta in farten lite grann. Tjänsten kan även hjälpa resenärer genom exempelvis en app.

Som jobbpendlare vill jag få en varning om eventuella förseningar i god tid, inte när jag redan är på väg. Får jag en varning när jag står hemma och borstar tänderna kan jag välja att ta bussen, cykeln eller kanske åka med grannen. Det ger mig mer kontroll över situationen, menar Jonas Järnfeldt.

Just nu används The Train Brain hos Öresundstågen i södra Sverige. Genom mobilappen ”Res med Pia” har realtidsinformationen för tåg ersatts med prognoser från The Train Brain.

 I Sverige har The Train Brain redan avtal och långt gånga samarbetsplaner med flera operatörer. Intresset är även stort från resten av världen och man tog nyligen emot en delegation från Singapore som var nyfiken på tjänsten.

I vårt fall är det inte Big Data som utgör den största utmaningen. Snarare att kunna väga olika mönster mot varandra och beräkna olika scenarier tillräckligt snabbt, avslutar Jonas Järnfeldt.