海光 K100 DCU VLLM 推理环境构建

基于国产海光DCU加速卡的硬件基础,通过Docker容器化技术,获取并部署为深度优化定制的软件镜像,以实现高效能计算任务的快速部署与性能释放。

堆栈

浅谈RAG

RAG是权衡LLM的发散性与其准确性而诞生的产物

堆栈

本站由 钟意 使用 Stellar 1.33.1 主题创建。
又拍云 提供CDN加速/云存储服务
vercelnetlifycloudflare 提供托管服务
湘ICP备2023019799号-1
总访问