🎉 解锁高效推理部署核心技术FastDeploy,2.2版本实测活动上线! #4081
ethan7zhanghx
started this conversation in
General
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
FastDeploy 2.2 实测活动现已上线
FastDeploy 2.2版本现已增加对baidu/ERNIE-4.5-21B-A3B-Thinking的支持,参与活动,即可快速部署和体验全新顶尖模型,同时赢取实测奖励!
🎯 ERNIE-4.5高效推理实践
🧑💻 任务描述
基于FastDeploy2.2,实现ERNIE 4.5任意模型的高效推理,并测试验证结果。
💰 完成标准
第1步:进行测试,服务正常启动并且能够响应对话请求
第2步:通过该问卷提交,注意将您所有的作业文件(py文件、日志、截图、blog地址等)上传至问卷最后一题(问卷地址:https://www.wjx.top/vm/meSsp3L.aspx# )
截止时间 2025年10月30日
📕 参考教程:
Step1 环境准备
https://docs.nvidia.com/nvshmem/release-notes-install-guide/install-guide/abstract.html#hardware-requirements
硬件环境
物理机软件环境
Step2 安装 & 模型
https://github.com/PaddlePaddle/FastDeploy/blob/v2.1.1/docs/get_started/installation/nvidia_gpu.md
使用Docker
进入镜像&安装最新版FastDeploy
拉取模型
必要组件
Step3 启动 & 测试
#3883
启动P节点
启动D节点
测试
Beta Was this translation helpful? Give feedback.
All reactions