bash
展开代码
FROM registry.us-west-1.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.7.1-py38-torch2.0.1-tf1.15.5-1.8.1
RUN apt-get update && apt-get install -y libjemalloc-dev && rm -rf /var/lib/apt/lists/*
RUN useradd -m -u 1000 user
USER user
ENV HOME=/home/user \
        PATH=/home/user/.local/bin:$PATH
WORKDIR $HOME
RUN chmod 777 $HOME
RUN mkdir $HOME/modelscope_cache
ENV MODELSCOPE_CACHE=$HOME/modelscope_cache
ENV GRADIO_SERVER_NAME=0.0.0.0
EXPOSE 7860
RUN echo 'cloning facechain:hf_space_fact'
RUN git clone -b feat/hf_space_fact https://github.com/modelscope/facechain.git
WORKDIR $HOME/facechain
RUN pip install -r requirements.txt
ENV LD_PRELOAD=/lib/x86_64-linux-gnu/libjemalloc.so
ENV PYTHONPATH=.
CMD ["python", "app.py"]

不以root运行。进去后还需要适配一些代码。

启动

bash
展开代码
docker run -it  --net host --gpus all kevinchina/deeplearning:fact_face_swapev1 /bin/bash
cd facechain
$ GRADIO_SERVER_PORT=9872 python3 app.py

阅读全文

OpenRouter 调用

2025-11-19

深度学习

创建key后调用：

python
展开代码
import requests

# 设置你的 OpenRouter API 密钥
api_key = "sk-or-v1-44855ead77789aba720551ad07a8f7434b935104ef0248cedd6d20f527e5dc"

# OpenRouter API 端点
url = "https://openrouter.ai/api/v1/chat/completions"

# 请求头
headers = {
    "Authorization": f"Bearer {api_key}",
    "Content-Type": "application/json"
}

# 请求体
data = {
    "model": "openai/gpt-oss-120b",  # 指定要使用的模型
    "messages": [
        {"role": "user", "content": "你好！请介绍一下你自己。"}
    ],
    "temperature": 0.7
}

# 发送 POST 请求
response = requests.post(url, headers=headers, json=data)

# 检查响应
if response.status_code == 200:
    result = response.json()
    print(result["choices"][0]["message"]["content"])
else:
    print(f"请求失败，状态码: {response.status_code}")
    print(response.text)

阅读全文

Ollama 本地部署与 OpenAI 兼容指南

2025-11-19

深度学习

Ollama 本地部署与 OpenAI 兼容指南

安装 Ollama 命令行工具

使用官方安装脚本（Linux）

bash
展开代码
curl -fsSL https://ollama.com/install.sh | sh

模型存储路径

默认路径：

Linux/Mac: ~/.ollama/models
Windows: C:\Users\<用户名>\.ollama\models

自定义路径：

bash
展开代码
export OLLAMA_MODELS="/mnt/jfs6/model"  # Linux/Mac
$env:OLLAMA_MODELS="C:\your\custom\path"  # Windows

阅读全文

vLLM多机部署笔记：从环境配置到GLM-4.6服务启动（RoCE网络）

2025-11-19

深度学习

https://zhuanlan.zhihu.com/p/29950052712

模型已经下

阅读全文

构建agent的12个准则：12-factor-agents

2025-11-18

深度学习

https://github.com/humanlayer/12-factor-agents/tree/main

12-Factor Agents 准则详解

准则1：自然语言转工具调用

核心：将用户的自然语言请求转换为结构化的工具调用。

例子：用户说“给Terri创建一个750美元的付款链接，用于2月AI聚会赞助”，转换为：

json
展开代码
{
  "function": "create_payment_link",
  "parameters": {
    "amount": 750,
    "customer": "cust_xxx",
    "memo": "..."
  }
}

然后由确定性代码执行。这是代理的基础能力。

准则2：拥有你的提示词

核心：不要依赖框架的黑盒提示词，要自己编写和控制。

原因：

框架的提示词可能不适合你的场景
难以调试和优化
无法精确控制输入给模型的内容

做法：把提示词当作代码来管理，可以测试、迭代、版本控制。就像写函数一样写提示词。

阅读全文

华北电力大学研究生课程线性系统理论试卷苗苗

2025-11-13

自动控制

https://docs.qq.com/sheet/DUEdqZ2lmbmR6UVdU?tab=BB

阅读全文

Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 部署

2025-11-11

深度学习

bash
展开代码
# 使用vLLM启动
python -m vllm.entrypoints.openai.api_server \
    --model /mnt/jfs6/model/Qwen3-235B-A22B-Instruct-2507-FP8 \
    --served-model-name gpt \
    --host 0.0.0.0 \
    --port 8000 \
    --max-model-len 8192 \
    --tensor-parallel-size 4 \
    --api-key "123"

阅读全文