L’Human Activity Recognition (HAR) sfrutta dati da sensori indossabili o smartphone per identificare azioni come camminare, correre o salire le scale. In contesti reali, i dati sono raccolti da utenti diversi con attività e modalità di etichettatura spesso distribuiti in modo non uniforme e soggetti a disaccordi semantici (ad esempio running vs jogging). Questi fenomeni causano:

  • Label Skew: ogni client possiede solo alcune classi, complicando l’apprendimento globale in un sistema di Federated Learning (FL).
  • Disagreement tra label: differenze lessicali o semantiche nelle etichette tra client, che possono degradare la qualità del modello aggregato.

Nell’ottica di preservare la privacy degli utenti e gestire la grande mole di dati distribuiti su dispositivi edge, il Federated Learning (FL) è emerso come una soluzione chiave. Il FL permette di addestrare un modello globale condividendo solo aggiornamenti locali dei modelli senza trasferire i dati grezzi. Questa soluzione presenta però diverse criticità legate a dati non omogenei e label distribuite in modo non uniforme. Inoltre, gli utenti potrebbero usare etichette diverse per descrivere attività simili (es. running vs jogging), introducendo ambiguità semantiche che rendono l’apprendimento ancora più complesso.

 

Per affrontare questi problemi, la tesi propone di integrare il FL con una supervisione basata sul linguaggio naturale (Natural Language Supervision),  rappresentando i dati dei sensori e le etichette in uno spazio semantico condiviso.

Questo approccio permetterebbe di

  • Mitigare il label skew, allineando dati e etichette anche se alcune classi sono assenti localmente.
  • Gestire il disagreement semantico tra label diverse ma semanticamente correlate.
  • Abilitare lo zero-shot learning, permettendo al modello di riconoscere potenzialmente attività non viste durante l’addestramento su nuovi client.

Obiettivi della tesi:

  • Progettare e implementare un sistema di Federated Learning per HAR che integri supervisione in linguaggio naturale per l’allineamento semantico multimodale.
  • Valutare come l’approccio mitighi label skew e disagreement tra etichette su dataset HAR pubblici.
  • Verificare la capacità zero-shot del modello su client mai visti durante la fase di training.

Competenze consigliate per il/la candidato/a:

Preferibilmente laurea magistrale. Necessario aver passato qualche esame di machine learning e l'esame di sistemi distribuiti.

Se interessati, contattare: This email address is being protected from spambots. You need JavaScript enabled to view it.