Korbinian gewinnt Code Competition von Materna!
Big Data ist ein Begriff, der geprägt wurde, um die riesige Datenmenge zu beschreiben, die durch das Internet der Dinge, soziale Medien, mobile Geräte und andere Quellen wie Sensoren u.v.m. generiert wird. Diese Daten sind nicht nur plumpe Rohdaten. Sie können analysiert und verwendet werden, um Vorhersagen über die Zukunft zu treffen.
Wir haben im Rahmen eines Programmierwettbewerbs einen Datensatz aus einem realen Rennspiel zur Verfügung gestellt, der mit Hilfe von Techniken wie maschinellem Lernen, Statistik und Data Mining analysiert werden sollte.
Das Ergebnis ist dann von der Fachabteilung unseres Partnerunternehmens Materna bewertet und mit hilfreichem Feedback versehen worden. Korbinian hat bei der Competition den ersten Platz erreicht – herzlichen Glückwunsch!
Tipp: Schau dir unbedingt die Lösung von Korbinian bei GitHub an: https://github.com/epistoteles/Races
Das Interview mit Korbinian – erfahre mehr über seine Lösung und Herangehensweise
IT-Talents: Hallo Korbinian! Herzlichen Glückwunsch zu Deinem beeindruckenden ersten Platz bei der Code Competition. Du konntest mit Deiner Anwendung und Deinem guten Code überzeugen.
Stell Dich den anderen Talenten doch kurz vor.
Korbinian: Hallo, vielen Dank! Ich bin Korbinian und Masterstudent in Intelligent Adaptive Systems an der Universität Hamburg. Gerade verbringe ich zwei Auslandssemester an der University of Toronto. In meinem Studium begeistert mich alles im Themenkomplex Maschinelles Lernen, und meine Projekte darin reichen von Reinforcement Learning über Fairness bis hin zu medizinischer Bildverarbeitung.
IT-Talents: Was hat Dich motiviert, an der Competition teilzunehmen und wie bist Du auf den Wettbewerb aufmerksam geworden?
Korbinian: Erfahren habe ich vom Wettbewerb über euren Newsletter. Das Thema klang interessant, ich hatte Lust, wieder einmal meine Fähigkeiten an einem praktischen Projekt zu testen, und der Wettbewerb lag in meiner vorlesungsfreien Zeit. Deshalb habe ich mich angemeldet.
IT-Talents: Wie bist Du an die Lösung der Aufgabenstellung herangegangen?
Korbinian: Tatsächlich habe ich zuerst versucht, mithilfe von Google, den verfügbaren Informationen und ein paar plausiblen Annahmen herauszufinden, von welchem Spiel der Datensatz stammt. Das hätte die Interpretation einzelner Werte deutlich vereinfacht, war aber leider nicht erfolgreich.
Als nächstes bin ich die Spalten des Datensatzes der Reihe nach durchgegangen und habe nach Auffälligkeiten gesucht – also zum Beispiel offensichtliche Trends oder Werte, die unnatürlich oft vorkommen. Im Anschluss habe ich Hypothesen aufgestellt, warum die Werte so sind wie sie sind und dann versucht diese zu be- oder widerlegen. Manchmal konnte ich so den Ursprung von Anomalien entdecken, manchmal nicht. In jedem Fall half es dabei, spannende Details über das Spiel herauszufinden.
Da am Ende noch etwas Zeit übrig war, habe ich mich entschlossen, TrueSkill™ auf den Daten anzuwenden. Das ist ein Bayessches Modell zur Modellierung von Spielerfertigkeiten, das auch von Microsoft in der Xbox angewendet wird – also sehr passend für die Analyse von Spieldaten.
Die letzten Stunden des Abgabetages habe ich damit verbracht, meine Dokumentation auf GitHub hübsch zu machen und alles noch einmal manuell zu testen. Wie es scheint mit großem Erfolg!
IT-Talents: Wieso hast Du Dich für Deinen Technologie-Stack (Python) entschieden?
Korbinian: Ich habe mich gar nicht aktiv entschieden, sondern einfach die Sprache verwendet, in der ich die meiste Erfahrung habe. Für Python spricht die weite Verbreitung und die grosse Anzahl an verfügbarer Bibliotheken im Bereich Data Science. Python-Code lässt sich außerdem mit Jupyter Notebooks sehr gut dokumentieren und mit dem Einsatz von Bildern erklären. Man hätte die Daten aber sicher auch mit R gut analysieren können.
IT-Talents: Welche Probleme sind bei der Entwicklung der Software aufgekommen? Wie lange hat die Entwicklung gedauert?
Korbinian: Probleme sind keine aufgetreten – ich habe ja hauptsächlich Techniken und Tools angewandt, die ich bereits kenne. Ich schätze insgesamt steckt etwas mehr als eine Woche Entwicklungszeit in meinem Notebook – also knapp über 40 Stunden. Das schließt auch die Analysen mit ein, die am Ende nicht spannend genug für die Abgabe waren.
IT-Talents: Und was hast Du durch die Entwicklung gelernt?
Korbinian: Ich kenne jetzt ein paar coole Features von Jupyter Notebook, die ich vorher nicht kannte. Ich habe auch viel über interaktive IPython Widgets gelernt, also z.B. Graphen, bei denen man mit einem Slider die Visualisierung beeinflussen kann. Leider war nicht mehr genug Zeit, das in meine Abgabe einzubauen.
IT-Talents: Was würdest Du Dir thematisch gerne einmal als Code Competition wünschen?
Korbinian: Das ist einfach: mehr Machine Learning! Ein einfaches Klassifizierungsproblem könnte beispielsweise für Bachelorstudierende ein toller Einstieg in den Themenbereich sein. Die eingereichten Modelle lassen sich dann objektiv auf einem unbekannten Testset evaluieren und das beste gewinnt.
IT-Talents: Zu guter Letzt: Wie findest Du die IT-Talents.de Plattform, welche Verbesserungsmöglichkeiten siehst Du?
Korbinian: Super, vor allem Competitions wie diese! Da für mich auch das Ausland als Arbeitsort infrage kommt, wäre eine Erweiterung der Sponsoren in den DACH-Raum spannend. Firmenbesuche wie mit frühstarter könnte ich mir auch sehr gut vorstellen.
IT-Talents: Vielen Dank für Deine Teilnahme, das Interview und viel Spaß mit Deinem Gewinn 😉
Rückmeldungen