Intel et l'Institut Weizmann ont présenté, mercredi, une technique de « décodage spéculatif », capable d'accélérer l'inférence des modèles d'intelligence artificielle jusqu'à 2,8 fois, sans tailler dans la qualité des réponses.
Pour lire l'article dans son intégralité cliquez-ici.