这里收录了我写的一些技术文章,主要关注于LLM、AIGC、源码解析等方面的内容。
深入分析VLLM源码,探讨其核心设计理念、关键优化技术和实现细节
Feb 15, 2024
全面解析Llama.cpp的实现原理,包括量化技术、内存优化和推理加速等核心功能
Dec 10, 2023
获得两项软件著作权
Jun 1, 2023