Press
esc
to close
请输入并搜索
Dong
Dong
首页
标签
分类
时间线
友链
动态
工具
联系我
Press
Ctrl
+
and
K
to search
深度学习
Linux运维
单片机
Python
CPP
Android/Java
Docker
OpenCV
Matlab
售卖作品
深度学习ban
单片机ban
DL论文
建站教程
树莓派
算法刷题
提示词工程
数学之美
工具使用
课程学习
见闻录
备忘录
隐藏机密
自动控制
摄影技巧
首页
标签
分类
时间线
友链
动态
工具
联系我
深度学习
195 文章 × 1051006 字
深度学习
195篇
+
06-03
【知识点】5种Agent模式
06-03
【深度学习】Fooocus Outpaint 原理
06-03
【知识点】匈牙利算法的计算过程示例
06-02
【知识点】OpenPose姿态检测
06-02
【知识点】CDP人脸聚类,共识驱动传播人脸聚类方法
06-02
InsightFace人脸检测方法分析
06-02
【知识点】U-Net/HRNet 区别
06-02
【知识点】Mask R-CNN
05-30
AstrBot NapCat 消息机器人实战教程教学
05-30
sglang 部署 Qwen/Qwen3-32B
05-28
sglang 部署Qwen/Qwen2.5-VL-7B-Instruct
05-27
【知识点】YOLO编年史,YOLO全系列解析
05-27
【知识点】GAN的常用的损失函数有哪些 ?
05-27
【知识点】SVM支持向量机,松弛变量,核技巧
05-20
【知识点】VLLM 自动前缀缓存,推理加速
05-19
【知识点】强化学习关键术语
05-19
RoPE 旋转位置编码详解与计算示例
05-16
【知识点】深度学习面试题汇总(持续更新)
05-13
【训练】Qwen2.5VL 多机多卡 Grounding Box定位(2)
05-13
【知识点】Transformer中计算最复杂的模块是什么
05-13
【知识点】训练模型时遇到out of memory怎么解决
05-13
【知识点】训练过程出现NaN如何解决
05-13
【知识点】GRPO 训练原理
05-12
【知识点】DPO、PPO reference 模型和 actor 模型是否可以为同一个模型
05-12
【知识点】PPO、DPO、KTO
05-12
【知识点】DPO强化学习
05-12
【知识点】PPO强化学习
05-12
【知识点】sft如何避免灾难性遗忘
05-12
【知识点】为何进行Query改写,Query改写的核心价值
05-12
【知识点】微调模型 VS RAG,为何选RAG?
05-09
【损失函数】InfoNCE损失,多模态模型的对比学习代码
05-09
【知识点】m-RoPE(多模态旋转位置编码)
05-09
如何给transformers库打Python补丁
05-08
【代码解读】LLama-Factory SharegptDatasetConverter
05-07
【API】将SigClip部署为API
05-07
【训练】Qwen2.5VL 多机多卡 Grounding Box定位(1)
05-02
【训练】VLM GRPO训练微调using EasyR1 (1)
05-01
GRPO配置参数文档
04-30
vLLM 如何使用配置 tokenizer_config.json
04-30
Qwen/Qwen3如何支持长的上下文
04-30
Qwen/Qwen3-30B-A3B vllm部署和访问
04-29
Qwen/Qwen3-32B vllm部署和访问
04-27
AMEX vivo UI agents 数据集介绍
04-23
【训练】InternVL2_8B VLM-R1GRPO微调
04-21
上传模型到huggingface
04-19
【训练】InternVL2_8B full sft 多机多卡训练
04-19
LLaMA-Factory 训练参数解读
04-19
【训练】LLaMA-Factory InternVL3-8B 多机多卡训练
04-18
InternVL 1技术深度分析
04-18
InternVL 3的技术深度分析,代码与原理
04-18
InternVL <box>
04-16
ValueError: Image features and image tokens do not match: tokens: 2305, features 2304
04-11
CycleGAN 的原理与代码
04-11
Stable Diffusion:文本提示如何作用于Stable Diffusion的图像生成过程
04-11
Stable Diffusion:CFG Scale 是如何控制文生图的
04-11
Stable Diffusion:噪声采样的调度器的原理
04-11
Stable Diffusion:采样器的数学原理
04-11
Stable Diffusion:文生图的代码执行原理
04-10
Stable Diffusion:使用ControlNet为黑白照片上色
04-10
图像质量评估所使用的一些指标计算方法
04-07
【训练】Qwen 2.5 VL 图片转公式,微调实战教学
04-03
【知识点】DeepSeek R1 解读
03-27
【训练】VLM-R1GRPO微调, 实战训练教程(2)
03-25
LLaMA-Factory多机多卡训练Qwen2.5VL
03-19
使用 device_map 优化 Transformers 模型的多 GPU 显存分配
03-19
vllm部署Qwen2.5-VL-7B-Instruct
03-19
vllm 部署QwQ-32B ,访问代码
03-18
AIGC降重提示词
03-17
【训练】LLaMA-Factory多机多卡微调训练实战
03-14
onnx gpu在docker里支持
03-14
sdwebui docker打包
03-13
ControlNet Reference模型:reference_adain、reference_adain+attn与reference_only的区别与应用场景解析
03-12
【训练】LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct
03-11
Qwen2.5-VL 技术报告总结
03-06
使用mergekit合并大型语言模型
03-05
LiteLLM 做大模型API接口Proxy转发
03-04
跑ZhipuAI/CogView4-6B的效果
03-03
【训练】VLM-R1GRPO微调, 实战训练教程(1)
02-24
阶跃星辰 Step-Vedio-T2V Docker 推理
02-19
llama.cpp 跑 qwen2.5 量化模型
02-17
ktransformers 部署Deepseek-R1
02-14
sglang 启动 Qwen2.5-32B-Instruct-GPTQ-Int4 API
02-14
sglang 启动 DeepSeek-R1-Distill-Qwen-32B API
02-13
旋转位置编码(RoPE)的代码片段
02-12
OpenWebUI使用DeepSeek R1满血版,DeepSeek R1 API调用
02-11
FlashAttention 透彻理解
01-20
DDColor 效果实战教程
01-17
pix2pix pytorch 图片上色,模型训练实战,Docker【3】
01-17
pix2pix mmgeneration 线稿上色,模型训练实战,Docker【2】
01-16
pix2pix mmgeneration通用场景黑白图片上色模型训练,Docker 【1】
12-18
文生图 排行榜
12-14
Open WebUI + Ollama
12-14
OpenWebUI 使用 Azure OpenAI
12-14
Azure OpenAI 转 openai proxy接口
12-10
部署siglip-so400m-patch14-384为API
11-30
flux diffuser 分卡切分运行
11-28
llama-factory 量化数据要求 c4_demo.json
11-28
量化方法的辨析-动态离线量化方法、静态离线量化方法和量化训练方法是什么区别?
11-27
Milvus使用教程(五)总结
11-26
Dify流式请求示例
11-26
mini-omni2 语音对话模型 论文
11-26
Moshi 论文解析
11-25
LLM的不同角色system、user
11-25
Conan-embedding模型使用
11-25
Conan-embedding模型论文解析
11-25
embedding模型排行榜
11-21
TensorRT-LLM,Qwen2.5 加速量化部署
11-21
RoPE 旋转位置编码 解析
11-20
大模型量化方法解析:WO、AWQ、GPTQ 与 SQ 的对比
11-20
开源LLM大模型排行榜
11-18
sglang 部署Qwen2VL7B,大模型部署,速度测试,深度学习
11-14
seeAct 论文解析
11-13
ollama Docker部署qwen2.5:72b-instruct
11-13
ollama Docker部署 Qwen2.5-Coder-32B-Instruct
11-13
Dify,编排应用,随心所欲使用大模型
11-12
Ovis,多模态大模型微调
11-11
pixart Docker部署推理
11-08
vllm 部署 Qwen/Qwen2.5 ,访问代码
11-07
vllm 部署 Qwen/Qwen2.5-Coder-7B-Instruct openai接口
11-04
Docker 官网vLLM镜像 快速部署 Qwen2.5
11-04
测试NanoFlow:比 vLLM 和 TensorRT-LLM 更快
11-03
requests openai api 接口访问
11-01
数据准备详解:打造高质量的语言模型训练数据集
11-01
ChatGPT openai接口,图片对话程序
11-01
ChatGPT openai接口多轮对话程序
10-26
构建最新的LLaMA-Factory镜像
10-21
相机里面的视觉算法(4)
10-21
相机里面的视觉算法(3)
10-21
相机里面的视觉算法(2)
10-21
相机里面的视觉算法(1)
10-21
安装vllm并部署Qwen2VL API
10-21
如何构建自己的vllm镜像,cuda12.1
10-18
使用vllm部署Qwen2VL API
10-16
自监督学习-基础知识分享
10-16
三元损失(triplet loss)
10-14
Qwen2-VL API 快速部署服务教程
10-14
使用LLaMA-Factory微调sft Qwen2-VL-7B-Instruct
10-14
A Cookbook of Self-Supervised Learning 中文翻译
10-13
词汇分割方法:WordPiece Model 和 Byte Pair Encoding 的详细解读
10-13
Transformer的并行化提现在哪个地方?Decoder 端可以做并行化吗?
10-13
Transformer中的前馈神经网络?使用了什么激活函数?相关优缺点?
10-13
Transformer模型中的LayerNorm与BatchNorm:为什么选择LayerNorm?
10-13
为什么在获取输入词向量之后需要对矩阵乘以embedding size的开方?
10-13
为什么在多头注意力中需要对每个 Head 进行降维?
10-13
如何在计算 Attention Score 时对 Padding 做 Mask 操作
10-13
Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?
10-13
【深度学习】Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?
10-13
【知识点】transformer为什么使用多头注意力机制?为什么不使用一个头
10-12
如何理解多模态模型Qwen2-VL中的MIN_PIXELS和MAX_PIXELS
10-11
使用LMDeploy部署InternVL2,速度测试
10-10
【深度学习】Qwen2-VL API速度测试与部署
10-09
【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4,容器即服务启动
10-09
【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4
10-08
【深度学习】FLUX.1,文生图,推理部署实战教程
10-08
stable-diffusion-3-medium部署体验实战教学
10-01
fooocus-api,得到一些训练图片的过程
09-27
fooocus-api访问API得到图,Docker部署
09-26
【深度学习】LLaMA-Factory部署Qwen2-VL
09-24
使用Python和Pydub调整音频音量
09-24
深度学习,TTS AB测试代码
09-20
【深度学习】语音TTS,微调训练 StableTTS V1.1
09-20
【深度学习】语音TTS,微调训练 fishaudio / fish-speech-1.4
09-19
【深度学习】强化学习介绍
09-19
音频格式:OGG、RAW、WAV与AAC的区别
09-18
如何测试 ONNX Runtime 是否使用了 GPU 进行推理
09-18
Python使用 Gradio 实现多张图片上传WebUI
09-18
【深度学习】GOT-OCR2.0:一款端到端的 OCR 模型,镜像
09-14
使用Kubernetes(K8s)进行多机多卡分布式训练
09-13
【深度学习】torch.distributed.launch、torchrun、accelerate 和 deepspeed 对比解析
09-13
多机多卡训练中的极速数据互联:NVLink、RDMA与NCCL配置详解
09-12
【深度学习】如何评估大语言模型(LLM)性能
09-11
【深度学习】探索大模型训练中的关键标签:system、user、role、content、assistant、observation、function
09-11
【深度学习】什么是PPO训练?
09-11
【深度学习】LLaMA-Factory,Why is LoRA much slower than Freeze?
09-10
【深度学习】使用ms-swift微调训练Qwen2-VL做印章识别
09-09
【深度学习】Python,印章数据集制作,印章制作
09-06
机器视觉的一些题目
09-04
【深度学习】LLaMA-Factory微调sft Qwen2-VL进行印章识别
09-04
【深度学习】如何安装xformer?flash-attn?
09-04
【深度学习】Qwen2-VL最强开源OCR模型,手写字体识别、印章识别
09-04
【深度学习】Python,金融欺诈行为检测
09-02
【深度学习】安全帽检测,目标检测,Faster RCNN训练
09-02
【深度学习】安全帽检测,目标检测,yolov10算法,yolov10训练
09-01
【推理框架】MNN框架 C++、Python、Java使用例子 Demo
09-01
【深度学习】深度学习推理框架 TensorRT MNN OpenVINO ONNXRuntime
09-01
insightface 人脸识别模型训练 RecordIO数据格式
09-01
【深度学习】人脸聚类算法的评估指标程序,精准率、召回率、F1分数
09-01
深度学习 人脸识别 优秀开源项目 state-of-the-art SOTA deepface 项目 使用过程 教程
09-01
【深度学习】表情识别A Dual-Direction Attention Mixed Feature Network for Facial Expression Recognition 训练
09-01
【深度学习】miniCPM2.6,微调sft训练用于印章识别
09-01
【深度学习】【语音TTS】GPT-SoVITS v2 实战,训练一个人的音色,Docker镜像
09-01
【知识点】决策树算法详解:ID3、C4.5 和 CART 的原理与实现
09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常【3】
09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常
09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵
Dong
个人博客|深度学习|编程开发|嵌入电子|自动控制|算法深耕|
2124
日志
25
分类
4630
标签