```bash
# 使用vLLM启动
python -m vllm.entrypoints.openai.api_server \
    --model /mnt/jfs6/model/Qwen3-235B-A22B-Instruct-2507-FP8 \
    --served-model-name gpt \
    --host 0.0.0.0 \
    --port 8000 \
    --max-model-len 8192 \
    --tensor-parallel-size 4 \
    --api-key "123" 
```

Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 部署

首页

分类

时间线

友链

动态

工具

联系我

华北电力大学研究生课程 线性系统理论 试卷 苗苗

sentence-transformers Embedding Models 损失函数