Projektbeschreibung

Neuentwicklung OCR Pipeline in Scala 3

Branche FinTech

von 07/2025
bis 08/2025

Neuentwicklung der OCR-Verarbeitungspipeline in funktionalem Scala 3 als Nachfolger des Java-basierten Systems. Integration von Tesseract OCR mit ALTO XML Output. Implementierung von Services für OcrXml-Verarbeitung, Zell-Merging und Debug-Visualisierung. Verwendung von ZIO-Effektsystem für robuste Fehlerbehandlung.

Technologien

  • Scala 3
  • SBT
  • Tesseract OCR
  • ALTO XML
  • ZIO (Effektsystem)
  • ScalaTest
  • JaCoCo (Code Coverage)