ms-swift export 导出packing数据：

```bash
# Qwen3-VL 多模态模型导出 cached_dataset
IMAGE_MAX_TOKEN_NUM=5000 \
MAX_PIXELS=1003520 \
VIDEO_MAX_TOKEN_NUM=128 \
FPS_MAX_FRAMES=16 \
swift export \
    --model /mnt/jfs6/model/Qwen3-VL-8B-Instruct/ \
    --dataset 'your_dataset_name' \
    --split_dataset_ratio 0 \
    --dataset_num_proc 16 \
    --max_length 10240 \
    --to_cached_dataset true \
    --output_dir /path/to/output/cached_dataset
```

训练时候使用：

```bash
# 训练时使用
IMAGE_MAX_TOKEN_NUM=5000 \
MAX_PIXELS=1003520 \
VIDEO_MAX_TOKEN_NUM=128 \
FPS_MAX_FRAMES=16 \
swift sft \
    --model /mnt/jfs6/model/Qwen3-VL-8B-Instruct/ \
    --cached_dataset '/mnt/jfs6/g-xiedong/cached_dataset/train' \
    --cached_val_dataset '/mnt/jfs6/g-xiedong/cached_dataset/val' \
    --packing true \
    --packing_num_proc 64 \
    --max_length 10240 \
```

IMAGE_MAX_TOKEN_NUM、max_length 需要一致 ！

ms-swift 数据打包（Packing）

首页

分类

时间线

友链

动态

工具

联系我

ms-swift q3 30a3b 训练记录

修复nvidia-smi无法找到的问题