Profil // Evaluierungs-Report · 2026

Marian E. Arenskrieger

AI-Evaluation & Data-Quality an Frontier-Model-Projekten — Auditing, Aufbau und Stresstest der Datensätze hinter agentischer KI.

DOMAINAI Eval · Data Quality · SWE PATHFinance → Data Science
Profil

AI-Evaluation- & Data-Quality-Spezialist, der die Datensätze prüft und aufbaut, an denen Frontier-Modelle trainiert und getestet werden — mit durchgängigem Fokus auf Korrektheit, Verlässlichkeit und Reproduzierbarkeit.

Mein Hintergrund verbindet zwei Welten: eine Bankausbildung und einen B.A. in Finanzmanagement, mehrere Jahre selbstständigen quantitativen Handel und einen bewussten Wechsel in die Data Science. Diese Kombination — finanzielle Präzision plus Data-Science-Werkzeugkasten — bringe ich in die Evaluierung agentischer und Function-Calling-KI-Systeme ein.

Was ich mache

FOKUS / 04
01Evaluierung

AI Evaluation & RLHF

Rubrikbasierte Bewertung auf Korrektheit, Reasoning und Instruction-Following. Paarweise Modellvergleiche, mehrstufiges Prompt-Design sowie dokumentierte Fehlermuster und Edge Cases.

02Data Quality

Auditing & QA

QA und rubrikbasierte Audits der Datensätze anderer Contributoren für Function-Calling- und Agentic-AI-Projekte — Prüfung auf Korrektheit, Formatkonformität und Konsistenz vor der Auslieferung.

03Engineering

Tooling & Umgebungen

Einrichtung lokaler Frontier-Model-Umgebungen zur Datensatz-Erzeugung und Erweiterung von Open-Source-Tooling — JSON-Unterstützung in Cerberus, mehrschichtige Validierung und Error Detection in Haystack.

04Quant

Finanzen & Märkte

Ein Jahrzehnt in Kapitalmärkten, Eigenhandel und Finanzmodellierung — das quantitative Rückgrat hinter der Datenarbeit, plus angewandte KI-Anwendungsfälle in der Finanzberatung.

Berufserfahrung

VERLAUF / NEUESTE ZUERST
[01]Jan. 2026
heute

AI Evaluation, Data Quality & Software Engineering

Labelbox · Remote · Kunden: führende AI-Labs
Agentic AI Master ReviewerSoftware Engineer – Machine LearningSenior Machine Learning Expert
  • QA und rubrikbasiertes Auditing der Datensätze anderer Contributoren für Function-Calling- und Agentic-AI-Projekte — Prüfung auf Korrektheit, Formatkonformität und Konsistenz vor der Auslieferung sowie Durchsetzung von Qualitätsstandards im Master-Review-Team.
  • Einrichtung und Konfiguration lokaler Modell-Umgebungen, um Frontier-Modelle gegen reale Aufgaben laufen zu lassen und Datensätze zu erzeugen; Erstellung von Trainings- und Evaluierungsdatensätzen inkl. HFI-Problemsets für Frontier-Model-Coding-Aufgaben.
  • Forking und interne Erweiterung von Open-Source-Tooling — JSON-Unterstützung in Cerberus; mehrschichtige Validierung und Error Detection in Haystack — ausgeliefert als Teil des Datensatzes.
  • RLHF-Evaluierung und mehrstufiges Prompt-Design für Agentic-Coding-Aufgaben, mit paarweisen Vergleichen von Frontier-Modellen und kalibrierter, rubrikbasierter Bewertung auf Korrektheit, Reasoning und Instruction-Following; systematische Dokumentation von Fehlermustern und Edge Cases.
[02]Okt. 2025
— Mai 2026

Praktikant – Finance & AI

MLP SE · Wiesloch · Teilzeit
Abschlussprojekt: AI for Financial Consulting & Recruiting
  • Consulting: Analyse und konzeptionelle Gestaltung von KI-Anwendungsfällen zur Unterstützung und Personalisierung der Finanzberatung.
  • Recruiting: datengetriebene Ansätze zur Erhöhung qualifizierter Bewerber durch KI-Targeting.
[03]Juni 2025
— März 2026

Machine Learning Specialist

Scale AI · Freelance, Remote
  • Mathematische Evaluierung von ML-Modellen auf Korrektheit, Reasoning-Qualität und quantitative Genauigkeit.
  • Rubrikbasierte Bewertung von Modell-Outputs bei quantitativen und Reasoning-Aufgaben; Identifikation von Fehlern in modellgenerierten Reasoning-Schritten und Lösungen.
[04]Sep. 2019
— Juni 2025

Trader & Marktanalyst

BraveTrade · Selbstständig, Remote
  • Gewerblicher Eigenhandel mit Kryptowährungen, Aktien und Optionen.
  • Entwicklung und Backtesting von Handelsstrategien in Spot- und Derivatemärkten mittels statistischer Modellierung.
  • Datengetriebene Markt- und Risikoanalyse; Marktanalyse und Trading-Coaching für Privatkunden.
[05]Jan. 2018
— Okt. 2021

Cryptocurrency-Mining – Betreiber

BraveTrade · Selbstständig, Remote
  • Gewerblicher Betrieb eines Cryptocurrency-Mining-Geschäfts; Beschaffung (Leasing) und Betrieb von Mining-Hardware.
  • Laufende Profitabilitäts- (ROI) und Energiekostenoptimierung; Konfiguration, Uptime-Monitoring und Dokumentation zur steuerlichen Compliance.
[06]Aug. 2016
— Mai 2018

Bankkaufmann & Bankausbildung

VR-Bank eG Osnabrücker Nordland · Fürstenau
  • Bankbetrieb und Kundenarbeit parallel zur Ausbildung zum Bankkaufmann — das Fundament der Finanzseite meines Profils.

Kompetenzen

MATRIX / 04 DOMAINS
AI / Machine Learning06
Künstliche IntelligenzMachine LearningModellevaluationModellentwicklungKünstliche neuronale NetzeRLHF-Evaluierung
Data Science & Statistik08
Data ScienceDatenanalyseExplorative DatenanalyseStatistische AnalyseStatistische ModellierungPrädiktive AnalytikDatenvisualisierungDatenmodellierung
Engineering & Tooling05
PythonCerberusHaystackFunction-Calling-SystemeLokales Modell-Deployment
Finanzen & Business06
FinanzmodellierungKapitalmärkteTechnische AnalyseQuantitative AnalyseBusiness IntelligenceBeratung

Ausbildung & Zertifikate

VERIFIZIERT / NACHWEISE

Ausbildung

Master of Data Science (MDS)
University of Pittsburgh, USA · Remote
NOV. 2024 – HEUTE · Note A · GPA 3,8
Applied Data Science Program
MIT Professional Education, USA · Remote
MÄRZ 2025 – JUNI 2025 · Note A
Mathematics for Machine Learning
Imperial College London, UK · Remote
SEP. 2024 – NOV. 2024 · Note A · 98,58 %
Bachelor of Arts – Finanzmanagement
IU Internationale Hochschule, Deutschland
AUG. 2018 – JULI 2022 · Note B
Ausbildung zum Bankkaufmann
Genossenschaftsakademie, Rastede
AUG. 2016 – MAI 2018 · Note B

Zertifikate

Google Cloud Certified — Machine Learning Engineer
Applied Data Science Program — MIT Professional EducationJUNI 2025
Mathematics for Machine Learning — Imperial College LondonNOV. 2024
Career Essentials in Data Analysis — MicrosoftJUNI 2025
Generative KI in der Softwareentwicklung — MicrosoftJUNI 2025
Microsoft Azure KI GrundwissenJUNI 2025
Certified Blockchain & Finance Professional™FEB. 2020

Engagement

Akademischer Mentor — University of Pittsburgh · Betreuung zugewiesener Erstsemester2025 –
Code for Germany — Open Knowledge Foundation DE · Open-Source-Projekte2024 –
Sprachen
Deutsch
MUTTERSPRACHE
Englisch
C2
Japanisch
GRUNDLAGEN
Abseits der Arbeit
LesenScience-FictionProgrammierenSchwimmenGamingReisen

Geboren am 15. Mai 1998. Eine langjährige Faszination für Science-Fiction hat mich überhaupt erst zur KI gebracht — und hält meine Neugier wach, wohin sich diese Systeme entwickeln.