开源分享 今日收揽13星 DeepEP: 为AI大模型MoE/EP量身打造的高性能通信库 作者贝克街的捉虫师 2025年6月19日 大家好,我是贝克街的捉虫师呀! 最近大家都在关注各种大型AI模型,尤其是像Mixture-of-Experts…
开源分享 今日收揽126星,vLLM:让LLM推理快如闪电,人人可用! 作者贝克街的捉虫师 2025年5月2日 大家好,我是贝克街的捉虫师呀! 最近在研究大语言模型(LLM)推理加速方案,发现一个很有意思的项目:vLLM。…