Privacy Officer AI Agent
Back to projects

Privacy Officer AI Agent

100% offline triple-layer anonimiseringstool voor studentenfeedback. Combineert Microsoft Presidio, een gespecialiseerd transformer model en een lokale LLM om privacygevoelige informatie te verwijderen uit CSV-bestanden.

School Project
February 1, 2026

Technologies Used

Een groepsproject voor Fontys Hogeschool waarbij studentenfeedback automatisch wordt geanonimiseerd. Het systeem werkt volledig offline — er verlaat geen data de lokale omgeving.

Pipeline

  • Laag 1: Microsoft Presidio — snelle regex en NER voor namen, e-mails, telefoonnummers, studentnummers en locaties
  • Laag 2: EU-PII-Safeguard transformer — vangt entiteiten op die laag 1 miste door complexe opmaak of spellingsvariaties
  • Laag 3: Lokale LLM (Ollama) — begrijpt context voor indirecte PII zoals titels, fysieke beschrijvingen, vakken en unieke situaties

Features

  • 100% offline verwerking, geen data naar externe servers
  • Web UI met drag-and-drop CSV upload en real-time voortgangsbalk
  • Keuze welke lagen en PII-categorieën actief zijn
  • Automatische vlaggen voor rijen die menselijke controle nodig hebben
  • Ondersteunt Nederlands en Engels
  • Volledig gedraaid in Docker

Gebouwd voor

Industryproject (groepsopdracht) voor de GenAI Engineer specialisatie aan Fontys Hogeschool, semester 4.

Project Gallery

flow

flow

#AI #Privacy #Semester 4 #Groepsproject #GenAI