Lucent's Blog

vllm + Doocker 服务化部署Qwen3-ASR

简介 Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B，支持 52 种语言和方言的语言识别与语音识别（ASR）。两者均利用大规模语音训练数据以及其基础模型 Qwen3-Omni 强大的音频理解能力。实验表明，1.7B 版本在开源 ASR 模型中达到业界领先…

2026-03-24 • 阅读
微信 Bot API 技术解析：腾讯 iLink 协议首次合法开放

2026 年，微信终于开放了合法的个人 Bot API。本文通过逆向分析 @tencent-weixin/openclaw-weixin 源码，完整还原了这套 iLink Bot 协议的技术细节，并给出可运行的裸调 Demo。一、背景：这是历史性时刻在此之前，开发者想让程序控制微信，只有两条路：…

2026-03-24 • 阅读
别再把Claude Code只当编程工具，Java终于能驱动这个超级智能体了

…

2026-01-22 • 阅读
Java 新增的 String 处理的 9 个现代化方法，轻松应对大模型输出

AI时代的挑战在 AI 大模型盛行的今天，字符串处理变得比以往任何时候都更加重要…

2025-10-09 • AI 阅读
音频转写 + 说话人分离设计与实现思路

实现效果实现思路（Architecture & Design） 1. 系统目标与边界…

2025-08-18 • AI 阅读
Langchain4J实现大模型聊天程序

功能点基于令牌窗口的多轮对话多用户多会话聊天记录持久化实现思路使用大模型流式输出接口 + Langchain4J的记忆管理 + Redis缓存 + 数据库持久化进行实现使用 spring-webflux 进行流式输出 Langchain4J版本: 1.3.0 此时的最新版…

2025-08-15 • AI 大模型阅读
Python minio fget_object 等操作报错AccessDenied的问题

起因是发现 fget_object 方法一直报AccessDenied,但是无论怎样排查 AK/SK都是权限正常的，并且在Java的框架中所有都是正常的。然后直接尝试直接使用 ip:9000 连接，是正常使用的，所以问题出在了代理上。我们使用nginx 反向代理了9000端口，看日志发现，所有H…

2025-06-11 • 阅读
MindIE部署Qwen2.5-VL-7b-Instruct

启动命令 docker run -itd \ --device=/dev/davinci6 \ --device=/dev/davinci7 \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ …

2025-06-03 • 阅读
昇腾910B部署千问3(Qwen3)大模型-封装推理镜像

上一个文章，我们已经成功在昇腾910B平台上部署了Qwen3,现在我们就利用已经配置好环境的容器，制作一个专门方便部署的推理镜像制作镜像编写python脚本用来自动设置推理配置文件 vim /usr/local/Ascend/update_mindie_config.py 在文件中写入下面的代码…

2025-05-09 • AI 大模型阅读
昇腾910B部署千问3(Qwen3)大模型

终于拿到了华为的最新版本Mindie镜像 mindie_2.0.T17.B010-800I-A2-py3.11-openeuler24.03-lts-aarch64.tar.gz 终于可以在昇腾平台上部署Qwen3了 Qwen3简介 Qwen3是Qwen系列中最新一代的大型语言模型，提供了密集和混合…

2025-05-09 • AI 大模型阅读