Was macht eigentlich ein Data Scientist?

Das Buzzword "Data Science" geistert derzeit durch die Innovationsabteilungen quer über alle Branchen hinweg. Der Job-Titel "Data Scientist" ist einer der häufigsten in einschlägigen Karriere-Plattformen. Doch worum geht es dabei eigentlich? Wir haben mit drei sehr unterschiedlichen Data Scientists gesprochen.
/was-macht-ein-data-scientist/

Zusammenfassung aus

Zusammenfassung ein

Was macht eigentlich ein Data Scientist? Wir haben das Sclable-Data Science-Team gefragt
(c) Tobias Fittner: Das Sclable-AI- und Data Science-Team (vlnr.): Sanchit Singh, Ronald Luc, Frank Fichtenmüller, Charles Dietz und Viktor Sandner
hr
Der Summary Modus bietet einen raschen
Überblick und regt zum Lesen mehrerer
Artikel an. Der Artikeltext wird AI-basiert
zusammengefasst mit der Unterstützung
des Linzer-Startups Apollo AI.

„Data Science bezeichnet generell die Extraktion von Wissen aus Daten“ – so lautet die verkürzte Definition auf Wikipedia. Daraus lässt sich eines bereits klar ableiten: Der Beruf „Data Scientist“ lässt sich nicht auf einzelne spezifische Tätigkeiten eingrenzen. Tatsächlich bietet der Job, der auf einschlägigen Karriere-Plattformen von Unternehmen jeder Größe derzeit stark nachgefragt wird, einen großen Spielraum. Dabei sind ganz unterschiedliche Kompetenzen vonnöten.

+++ Mehr zum Thema Human Ressources +++

„Lauter offene Münder“

Ein Unternehmen, bei dem Data Science zum Kerngeschäft gehört, ist der Business Accelerator Sclable mit Hauptsitz im Wiener weXelerate. Dort unterstützt man seit sieben Jahren Kunden aus der nationalen und internationalen traditionellen Industrie wie Umdasch Group Ventures und ihr Schwesterunternehmen Doka oder Palfinger in Sachen digitale Transformation. Ein entscheidender Faktor ist dabei die Nutzung von Daten, um Prozesse effizienter zu machen. „Du löst dabei etwas, das für dich eine absolute ‚low hanging fruit‘ ist. Aber beim Kunden siehst du bei der Präsentation der Ergebnisse lauter offene Münder“, sagt Viktor Sandner, Head of Data Science and Methodology bei Sclable.

„Es gibt keinen Data Science Fullstack Developer“

Die Nische Finden

Sandner kommt eigentlich aus dem Biotech-Bereich. „Ich bin in meiner Forschung mit Excel-Tabellen bald an meine Grenzen gestoßen. Ich habe daher programmieren gelernt und es hat sich plötzlich eine ganze neue Welt offenbart“, erzählt er. So habe er begonnen, nach Daten-Lösungen für die gesamte Branche zu suchen und sei damit zum „Experten mit einem gewissen Extra“ geworden – konkret im Bereich Statistik. Denn eines müsse man im breiten Feld der Data Science finden, um zu reüssieren: Eine Nische.

Diverses Data Science-Team

„Es gibt keinen Data Science Fullstack Developer“, sagt auch Sandners Kollege Ronald Luc, Machine Learning Engineer bei Sclable, und ebenfalls ein „Data Scientist“. Man brauche ein diverses Team. Während sich Viktor Sandner mit statistischen Methoden auf die Suche nach teilweise versteckten Korrelationen in großen Datensets macht, ist Lucs Domäne die Vorhersage von Werten mit Hilfe von Deep Learning – teilweise auf Basis von durch seinen Kollegen aufbereiteten Daten. „Manchmal sind aber gar keine Daten vorhanden. Dann erstelle ich mit Hilfe von detaillierten Interviews ein mathematisches Modell zur Vorhersage“, erklärt Luc.

Es braucht nicht immer Deep Learning

Ein weiteres Feld der Data Science deckt bei Sclable Sanchit Singh ab. Der Head of Computer Vision beschäftigt sich mit der Analyse von zwei- und dreidimensionalen Bild-Inhalten. Auch er arbeitet mit Deep Learning – das sei aber nicht zwingend notwendig. „Es lässt sich vieles mit dem klassischen Computer Vision-Ansatz machen, wo auf Basis von mathematischen Modellen Vergleiche durchgeführt werden und Klassifikationen erstellt werden können“, erklärt Singh. Als Beispiel nennt er, der ursprünglich aus dem Medizin-Bereich kommt, die Hautkrebs-Forschung. Dort könnten Bilder von Haut-Anomalien etwa nach dem Abgleich der Parameter Farbe, Form und Symmetrie sehr treffsicher kategorisiert werden. „Das kann z.B. einem Allgemeinmediziner helfen, der selten mit der Krankheit konfrontiert ist, eine erste Verdachtsdiagnose zu stellen“, sagt der Computer Vision-Experte.

Das unvoreingenommene Programm

Deep Learning bringe aber freilich weitere Möglichkeiten. Hier bestünden zwei Ansätze: „Supervised Learning“ und „Unsupervised Learning“. „Während ich beim ‚Supervised Learning‘ gewisse Informationen einfüttere – in unserem Beispiel etwa die bereits als Hautkrebs klassifizierte Bilder, die dem Programm als Grundlage dienen, ist es beim ‚Unsupervised Learning‘ quasi unvoreingenommen und bildet selbstständig Cluster“, erklärt Singh. Dieser Zugang könne unerwartete Zusammenhänge und damit neue Erkenntnisse ans Tageslicht bringen.

Big Data als Fluch und Segen

Voraussetzung für das Gelingen sei gerade beim „Unsupervised Learning“, aber auch in den anderen „Data Science“-Bereichen, das Vorhandensein ausreichender Datenmengen. Und diese können sich für Data Scientists als Fluch und Segen zugleich erweisen. „Wir sprechen hier von Big Data. Je nachdem, um was für Daten es sich handelt, können Datensets aber auch zu groß werden, um sie bearbeiten zu können. Gerade bei Bildern und Videos ist man sehr schnell im Terrabyte-Bereich und muss dann gegebenenfalls ein kleineres Datenset heranziehen oder an großen Computing-Clustern arbeiten“, erklärt Ronald Luc.

Data Scientist – „ein Blick“ für Daten

Und das ist nicht die einzige Herausforderung, mit der man als Data Scientist konfrontiert ist. „Kunden haben häufig zwar große Mengen an Daten, wissen aber gar nicht, was sie damit anfangen können und können daher auch keine Ziele für die Analyse definieren“, erzählt Viktor Sandner. In anderen Fällen würden die Ziele nicht mit den verfügbaren Daten zusammenpassen. „Das kann man aber sehr schnell herausfinden. Nach einiger Zeit hat man einen Blick dafür und sieht sofort, ob das Unterfangen erfolgsversprechend ist“.

„Ich lese jeden Tag zum Frühstück ein Paper“

Ausruhen könne man sich darauf aber nicht. Denn die rapide Entwicklung in dem Bereich erfordere ständige Anpassung. „Die gesamte Technologie, die wir verwenden, ändert sich alle paar Monate“, sagt Sanchit Singh. Für Ronald Luc ergibt sich dadurch eine besondere Morgen-Routine: „Ich lese jeden Tag zum Frühstück ein Paper“.

Redaktionstipps

die Redaktion

Wiener Startup GemüseGepard entwickelt Marktplatz für überschüssiges Gemüse & Obst

GemüseGepard rund um die beiden Gründer Pia Spilauer und Fabian Otto entwickelt eine Internet-Plattform an der Schnittstelle zwischen Lebensmittelproduzenten, Lebensmittelindustrie und Gastronomiebetrieben. Auf einem digitalen Marktplatz können Landwirte Obst und Gemüse aus Überproduktion inserieren. Die Angebote werden anschließend anhand verschiedener Qualitätskriterien bewertet.
/gemuseegepard-greenstart-portraet/
GemüseGepard
Pia Spilauer und Fabian Otto | (c) GemüseGepard
kooperation

GemüseGepard rund um die beiden Gründer Pia Spilauer und Fabian Otto entwickelt eine Internet-Plattform an der Schnittstelle zwischen Lebensmittelproduzenten, Lebensmittelindustrie und Gastronomiebetrieben. Auf einem digitalen Marktplatz können Landwirte Obst und Gemüse aus Überproduktion inserieren. Die Angebote werden anschließend anhand verschiedener Qualitätskriterien bewertet.

Ob Wirtshaus, Haubenlokal, Kantine oder Krankenhausküche – rund um den Herd herrscht immer Stress. „Viele Gastronomiebetriebe kaufen vor allem im Großhandel, denn das geht viel einfacher, als sich regionale Produkte von vielen verschiedenen landwirtschaftlichen Betrieben zu besorgen und viele einzelne Lieferungen zu bekommen“, erklärt GemüseGepard Gründerin Pia Spilauer.

Auch in der Buchhaltung machen viele kleine Rechnungen mehr Arbeit als eine große. Der Nachteil bei der Beschaffung wie bisher: Die Waren kommen oft von weit her – und mitunter bleibt gleich nebenan ein Landwirtschaftsbetrieb auf seinem frischen Obst und Gemüse sitzen. In Österreich fallen pro Jahr zwischen 150.000 und 200.000 Tonnen „Überschussware“ an.

GemüseGepard: Online-Plattform

„Das Ziel unseres Startups ist, zwischen regionaler Gastronomie, regionaler Landwirtschaft und Verarbeitungsbetrieben zu vermitteln“, sagt Co-Founder Fabian Otto. Dazu planen die Firmengründer eine Online-Plattform, auf der die Küchenchefs alles vom Apfel bis zur Zwiebel bestellen können.

„Wir besorgen Obst und Gemüse bei verschiedenen regionalen Betrieben, kümmern uns um die Logistik und liefern die Ware dann mit einer Rechnung.“ Mitgeliefert wird ein Zertifikat, aus dem hervorgeht, wie viel CO2 mit dem Einkauf eingespart wurde. Nur Produkte, die saisonal nicht regional verfügbar sind, werden vom GemüseGepard beim Großhandel besorgt. Aber auch hier soll auf möglichst kurze Transportdistanzen geachtet werden.

Testlauf in der Gastro

Ende August startete ein Testlauf mit zwei Gastronomiebetrieben. Wenn alles wie geplant klappt, soll die Bestellplattform im zweiten Quartal 2021 online gehen.

„Ursprünglich wollten wir uns im Sinne der Vermeidung von Lebensmittelverschwendung auf regionale Überschussprodukte konzentrieren. Denn Landwirte, die Verträge mit dem Handel abschließen, müssen gewisse Kontingente liefern und produzieren in guten Erntejahren oft weit mehr, als sie verkaufen können“, so Spilauer. „Im Zuge der Klimafonds-Startup-Initiative greenstart haben wir uns jedoch dazu entschlossen, das Problem an der Wurzel anzupacken und gleich die ganze Lieferkette neu aufzustellen.“

Ausbau des Angebots

In einem ersten Schritt möchte sich der GemüseGepard auf den Raum Wien beschränken und sein Angebot sukzessive auf andere österreichische Ballungszentren ausdehnen. Auch Convenience-Produkte sollen angeboten werden – schließlich schneiden die meisten Gastronomiebetriebe ihre Pommes nicht mehr selbst.

Bis zum Markteintritt nächstes Jahr freuen sich die Firmengründer auf neue Kontakte zu Betrieben aus den Bereichen Landwirtschaft, Lebensmittelverarbeitung und Gastronomie.


Greenstart: Roundtable Session #1 | GemüseGepard im Pitch (Minute 06:00)

*Disclamier: Das Startup-Porträt von GemüseGepard ist in Kooperation mit dem Klima- und Energiefonds im Rahmen von greensstart entstanden.

Toll dass du so interessiert bist!
Hinterlasse uns bitte ein Feedback über den Button am linken Bildschirmrand.
Und klicke hier um die ganze Welt von der brutkasten zu entdecken.
Möchtest du in Zukunft mehr von diesen Artikeln lesen?

Dann melde dich für unseren Newsletter an!

Leselisten zum Schmökern

Neueste Nachrichten

Summary Modus

Was macht eigentlich ein Data Scientist?

Was macht eigentlich ein Data Scientist? Wir haben das Sclable-Data Science-Team gefragt

Was macht eigentlich ein Data Scientist?

Es gibt neue Nachrichten

Auch interessant