Paul erreicht Platz 3 bei Code Competition
Big Data ist ein Begriff, der sich auf große Datensätze bezieht, die mit herkömmlichen Datenverarbeitungswerkzeugen nur schwer zu verarbeiten sind. Es hat eine breite Definition, umfasst aber typischerweise die Aufbereitung von Daten sowie die Analyse und letztlich das Ableiten von Vorhersagen.
Der Begriff „Big Data“ wurde in den 1990er Jahren geprägt, als die Menge der erstellten und geteilten digitalen Informationen explodierte. Der Begriff „Big Data“ wurde 1986 von Doug Laney, einem Analysten bei Gartner Inc., geprägt, um zu beschreiben, was seiner Meinung nach ein zukünftiges Phänomen sein würde, bei dem so viele Informationen verfügbar sein würden, dass es neue Wege erfordern würde, alles zu analysieren.
Wir haben uns mit unserem Partner, der Materna Information & Communications SE einen Programmierwettbewerb konzipiert und durchgeführt, der sich exakt dieser Thematik widmet. Die Auswertung hat die Fachabteilung von Materna übernommen, jeder Teilnehmer hat ein ausführliches Feedback erhalten – und 3 Talente haben gewonnen!
Paul hat den 3. Platz erreicht – erfahre hier mehr über ihn und seine Motivation!
IT-Talents: Hallo Paul! Herzlichen Glückwunsch zu Deinem beeindruckenden dritten Platz bei der Code Competition. Du konntest mit Deiner Anwendung und Deinem guten Code überzeugen. Stell Dich den anderen Talenten doch kurz vor.
Paul: Hallo, vielen Dank! Ich bin Paul, 24 Jahre alt und studiere gerade noch im Master Informatik. Ich bin gerade in der Endphase meines Masters und habe mich im Studium vor allem mit Themen des Maschinellen Lernens, Robotik und Computer Vision befasst.
IT-Talents: Was hat Dich motiviert, an der Competition teilzunehmen und wie bist Du auf den Wettbewerb aufmerksam geworden?
Paul: Da ich meine Masterarbeit bereits abgegeben habe, war ich auf der Suche nach neuen Herausforderungen und wollte meine Data Science Kenntnisse ein wenig auffrischen. Da ich sowieso hin und wieder auf it-talents nach Neuigkeiten schaue, ist mir die Competition direkt ins Auge gesprungen auf der Webseite.
IT-Talents: Wie bist Du an die Lösung der Aufgabenstellung herangegangen?
Paul: Zunächst habe ich mir einen ausführlichen Überblick über die Daten gemacht. Ich habe sehr viele Diagramme erstellt und einzelne Spalten des Datensatzes genauer analysiert um mir ein Bild vom Informationsgehalt dieser Spalten zu verschaffen. Damit verbunden ist eigentlich auch immer direkt die Bereinigung der Daten – also das Verwerfen überflüssiger oder uninformativer Informationen und das Ersetzen unsinniger Werte durch sinnvolle. Danach habe ich einfach gemacht worauf ich Lust hatte. Ich habe mir Fragen überlegt die man anhand des Datensatzes erforschen und beantworten kann, in der Hoffnung, dass auch die Juroren diese als spannend erachten. So habe ich dann zum Beispiel verschiedene KI-Modelle trainiert und miteinander verglichen.
IT-Talents: Wieso hast Du Dich für Deinen Technologie-Stack (Python) entschieden?
Paul: Ich habe mich für Python entschieden, da sich durch mächtige und effizient programmierte Frameworks – wie z.B. pandas, matplotlib oder numpy – sehr schnell und sehr einfach Datenanalysen umsetzen lassen. Außerdem sind jupyter notebooks eine gute Möglichkeit den Code gleichzeitig auch zu dokumentieren und für den Leser später verständlich zu machen. Praktischerweise ist Python aber auch die Programmiersprache, die ich am meisten benutze und mit der ich die größte Erfahrung habe.
IT-Talents: Welche Probleme sind bei der Entwicklung der Software aufgekommen? Wie lange hat die Entwicklung gedauert?
Paul: Wie eigentlich immer wenn es um das Trainieren von KI-Modellen geht, war das größte Problem, die gestellten Daten in eine Form zu bringen, die für die Modelle gut zu verstehen ist. Die Bereinigung der Daten hat sicherlich am meisten Zeit gekostet. Wie lange die Entwicklung insgesamt gedauert hat fällt mir schwer zu schätzen, da ich immer mal wieder ein oder zwei Stunden in der Bahn oder am Abend daran gearbeitet habe, wenn ich Lust und Zeit hatte.
IT-Talents: Und was hast Du durch die Entwicklung gelernt?
Paul: Die Entwicklung hat mir vorallem geholfen, meine Fertigkeiten mit Python Frameworks wieder aufzufrischen und zu erweitern. Außerdem war es interessant beim Entwickeln auch wirklich mal ordentlich zu dokumentieren was man da eigentlich tut. Als Student kommt man ja nur selten in die Situation, dass jemand anderes den geschriebenen Code verstehen und nachvollziehen muss.
IT-Talents: Was würdest Du Dir thematisch gerne einmal als Code Competition wünschen?
Paul: Thematisch war diese Challenge schon sehr nahe, an dem, was mich interessiert. Auch der Zeitaufwand war sehr angenehm und auch nebenher zu bewältigen ohne, dass man andere Dinge vernachlässigen musste. Für mich persönlich wäre eine änhliche Challenge mit einem Datensatz von Bildern auch sehr spannend.
IT-Talents: Zu guter Letzt: Wie findest Du die IT-Talents.de Plattform, welche Verbesserungsmöglichkeiten siehst Du?
Paul: Eine super Webseite, über die ich jetzt schon mehrfach mit spannenden Firmen in Kontakt getreten bin.
IT-Talents: Vielen Dank für Deine Teilnahme, das Interview und viel Spaß mit Deinem Gewinn 😉
Rückmeldungen