Topic: Training Transformers with Enforced Lipschitz Bounds