Lucent's Blog

当时明月在 曾照彩云归

人生不相见,动如参与商。

6LCi5Y2O5qKFLOaIkeaDs+S9oOS6hg==


昇腾910B启动千问QwQ-32B

下载模型

GIT_LFS_SKIP_SMUDGE=1  git clone https://www.modelscope.cn/Qwen/QwQ-32B.git
git lfs pull

启动模型

docker run -itd --name llm-QWQ \
--device=/dev/davinci_manager \
--device=/dev/devmm_svm \
--device=/dev/hisi_hdc \
-v /usr/local/dcmi:/usr/local/dcmi \
-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
-v /usr/local/Ascend/driver/lib64/common:/usr/local/Ascend/driver/lib64/common \
-v /usr/local/Ascend/driver/lib64/driver:/usr/local/Ascend/driver/lib64/driver \
-v /etc/ascend_install.info:/etc/ascend_install.info \
-v /etc/vnpu.cfg:/etc/vnpu.cfg \
-v /usr/local/Ascend/driver/version.info:/usr/local/Ascend/driver/version.info \
-v /home/aicc:/home/aicc \
-v /data/4pd/models/:/models \
--privileged=true \
-e ASCEND_RT_VISIBLE_DEVICES=4,5 \
-p 9996:9996 \
harbor.4pd.io/dooke/mindie-1.0rc3-service:pipe-11-commit-29fd5fd3 \
/usr/local/Ascend/entrypoint.sh \
--model=/models/QwQ-32B  \
--tensor-parallel-size=2 \
--port=9996 \
--max-model-len=32768 \
--served-model-name=QwQ-32B

上一篇

AI Services是什么 AI Services 的设计灵感来源于 Spring Data JPA 和 Retrofit 等框架,采用声明式接口定义所需的 API,然后由框架自动生成实现该接口的代理对象。这种方法隐藏了与 LLM 交互的复杂性,提供了简单直观的 API。 AI Services …

阅读
下一篇

LLMs.txt:AI 时代的新型网络标准解析 在当今快速发展的 AI 时代,一个新的网络标准正在悄然兴起 —— LLMs.txt。这个标准虽然简单,却可能对未来的 AI 搜索和内容理解产生深远影响。今天,让我们一起深入了解这个创新性的提案。…

阅读