使用方法
- 在输入框中输入您的问题或消息。
- 点击发送 — 模型在浏览器中加载并运行。
- 响应实时流出;点击清除开始新聊天。
示例
- 提出常识问题并获得即时答案。
- 头脑风暴想法或快速获得主题摘要。
- 测试小型设备语言模型的极限。
与完全在浏览器中运行的小型语言模型聊天 — 无服务器、无上传、完全隐私。由 Qwen2.5-0.5B 提供支持。
由 Qwen2.5-0.5B 提供支持 — 在浏览器中运行,无服务器或上传。需要支持 WebGPU 的桌面浏览器。模型下载可能很大(≈400 MB)。
来源: onnx-community/Qwen2.5-0.5B-Instruct
许可证: Apache 2.0
브라우저 로컬 LLM — transformers.js WebGPU, ~483MB(데스크톱 opt-in 용량정책).