Lucent's Blog

当时明月在 曾照彩云归

人生不相见,动如参与商。


MindIE部署Qwen2.5-VL-7b-Instruct

启动命令

docker run -itd \
    --device=/dev/davinci6 \
    --device=/dev/davinci7 \
    --device=/dev/davinci_manager \
    --device=/dev/hisi_hdc \
    --device=/dev/devmm_svm \
    -v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \
    -v /usr/local/sbin:/usr/local/sbin:ro \
    --name=Qwen2.5-VL-7B-Instruct \
    --shm-size 1gb \
    -e MIS_CONFIG=atlas800ia2-2x32gb-bf16-vllm-default \
    -e MIS_LIMIT_IMAGE_PER_PROMPT=4 \
    -v /data/4pd-workspace/models/Qwen2.5-VL-7B:/opt/mis/.cache \
    -p 30168:8000 \
    swr.cn-south-1.myhuaweicloud.com/ascendhub/qwen2.5-vl-7b-instruct:7.1.T2-800I-A2-aarch64

上一篇

起因是发现 fget_object 方法一直报AccessDenied,但是无论怎样排查 AK/SK都是权限正常的,并且在Java的框架中所有都是正常的。 然后直接尝试直接使用 ip:9000 连接,是正常使用的,所以问题出在了代理上。 我们使用nginx 反向代理了9000端口,看日志发现,所有H…

阅读
下一篇

上一个文章,我们已经成功在昇腾910B平台上部署了Qwen3,现在我们就利用已经配置好环境的容器,制作一个专门方便部署的推理镜像 制作镜像 编写python脚本用来自动设置推理配置文件 vim /usr/local/Ascend/update_mindie_config.py 在文件中写入下面的代码…

阅读