Frage im Vorstellungsgespräch bei togetherAI

Code multi-head attention, how to implement speculative decoding, etc