< Tagasi nimekirja

Matemaatika ja informaatika PhD (informaatika, projekt: Tasude häkkimise leevendamine RLHF-is informatsiooniteoreetilise tasustamise modelleerimise abil/Mitigating reward hacking in RLHF via information-theoretic reward modelling)

1

Pingerida

Nr Avalduse number Punktid
1 TÜ-IND25_2-14-183487 80,00

TÜ-IND25_2-14-185031 30,00