Alexander Müller. Optimizing Large Language Model Inference: Strategies for Latency Reduction, Energy Efficiency, and Cybersecurity Applications. ijcsis [Internet]. 2025 Nov. 30 [cited 2026 Jan. 25];10(11):93-7. Available from: https://scientiamreearch.org/index.php/ijcsis/article/view/214