分类 "大语言模型" 下的文章

实测 Z-Image：6B 参数的高效图像生成模型

2025-12-19 340 阅读大语言模型人工智能图像生成

Z-Image是6B参数的高效图像生成模型，8步推理（8 NFEs）即可达到甚至超越主流竞品水平，16G VRAM消费级设备可流畅运行。模型分三个变体：Turbo（轻量实时，适用于AIGC应用、小程序）、Base（基础未蒸馏，支持二次微调）、Edit（图像编辑专用），其中Turbo最具落地价值。实测中，1024×1024分辨率生成耗时0.8秒（Flash Attention+模型编译），显存峰值14G。技术上，其S3-DiT架构提升参数效率，Decoupled-DMD蒸馏算法实现8步推理，DMDR融合RL与DMD优化质量。优势场景包括双语文本渲染、写实生成、低显存部署及图像编辑；局限为仅Turbo开放，极端风格化生成和模型编译耗时待优化。Z-Image兼顾性能、效率与落地性，适合中小团队和开发者降低部署门槛。

阅读全文

部署文心4.5开源模型给Android设备调用

2025-07-05 354 阅读 PaddlePaddle 大语言模型人工智能 PaddlePaddle 大模型

在上一篇文章《文心4.5开源大模型的使用和部署》已经介绍了如何使用fastdeploy部署文心4.5开源大模型的，并且简单调用了接口，本篇文章来介绍Android如何调用这个部署的接口，并实现对话。

阅读全文

快速从零部署一个DeepSeek-R1服务

2025-04-05 595 阅读大语言模型人工智能大语言模型 DeepSeek vllm

这里使用最简单的几条命令介绍如何部署DeepSeek-R1的服务，默认已经安装了Anaconda，使用的是vllm框架，国内也可以轻松部署。

阅读全文

基于大语言模型实现文本端点检测

2025-01-18 644 阅读大语言模型人工智能语言模型自然语言处理

本文介绍了使用大语言模型进行文本端点检测的方法，以改进语音对话中的语音活动检测（VAD）。通过训练一个微调后的模型来预测句子是否完整，可以更准确地判断用户的意图。具体步骤包括： 1. **原理与数据准备**：利用大语言模型的文本生成功能，基于预定义的数据集和特定格式进行微调。 2. **微调模型**：使用LLaMA-Factory工具进行训练，并选择合适的提示模板及优化后的数据格式。 3. **

阅读全文