用途：专为黑白照片上色设计的轻量化模型
核心特点： • 老照片修复/历史影像彩色化的理想选择 • 基于ControlNet架构，采用LoRA（低秩适应）技术实现模型瘦身： • 原版ControlNet：4.7GB → Control-LoRA：仅738MB/377MB • 训练时覆盖多样化图像概念和比例，具备优秀泛化能力

技术文档：HuggingFace项目页

阅读全文

图像质量评估所使用的一些指标计算方法

2025-04-10

深度学习

即使现在有这么高级的质量评估方法：

https://mp.weixin.qq.com/s/77F6JlbLN6cFaU7vR4N0CA

本文写一些以前用的质量评估方法。

阅读全文

ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory

2025-04-10

Linux运维


展开代码
apt update
apt-get install libglib2.0-0 -y

阅读全文

【训练】Qwen 2.5 VL 图片转公式，微调实战教学

2025-04-07

深度学习

要做什么

全量微调Qwen2.5-VL-7B-Instruct的参数，用于图片转公式LaTex。

模型地址：https://huggingface.co/Qwen/Qwen2.5-VL-7B-Instruct

数据集

数据集：https://modelscope.cn/datasets/AI-ModelScope/LaTeX_OCR/summary

数据集下载，约有1.1G大小数据：

bash
展开代码
modelscope download --dataset AI-ModelScope/LaTeX_OCR --local_dir AI-ModelScope/LaTeX_OCR

阅读全文

Python 多进程缩小图片

2025-04-07

Python

该Python脚本用于处理/ssd/xiedong/vlm-r1-train-tasks-json-ui-docto/tasks_json目录下的数据，将其中所有图片等比例缩小（最长边为1024像素），并连同JSON文件一起复制到新目录/ssd/xiedong/vlm-r1-train-tasks-json-ui-docto/tasks_json_small_size中。

功能说明

遍历源目录下所有子文件夹（如"200932"等）
处理每个子文件夹中的所有.jpg图片文件，等比例缩放至最长边为1024像素
同时复制所有step_*.json文件到对应目录
使用Python多进程技术并行处理，大幅提高处理速度

阅读全文

【知识点】DeepSeek R1 解读1

2025-04-03

DL论文

一篇很好的DeepSeek R1 解读： https://zhuanlan.zhihu.com/p/20844750193

DeepSeek R1 论文： https://arxiv.org/abs/2501.12948

如何从DeepSeek-V3-Base得到DeepSeek-R1-Zero，可以看下面这图。编写一个指导性的提示词，让DeepSeek-V3-Base输出一组回答，用奖励模型进行奖励RL训练，这样就可以训练出DeepSeek-R1-Zero。

阅读全文

【训练】VLM-R1GRPO微调，实战训练教程（2）

2025-03-27

GRPO

VLM-R1GRPO微调，实战训练教程（1）：

https://www.dong-blog.fun/post/1961

本博客这次使用多图进行GRPO。

官方git项目：https://github.com/om-ai-lab/VLM-R1?tab=readme-ov-file

阅读全文