esc

请输入并搜索

深度学习

275 文章 × 1344094 字

LlamaFactory Qwen3-Omni 多模态 Token 计算说明

LlamaFactory训 Qwen3-Omni-30B-A3B-Instruct

Qwen3-Omni 视频与音频 Token 机制详解

Qwen3-Omni 多模态 Token 计算深度解析：从训练到推理

vllm / vllm-omni 推理关键点

opencode的工作原理

Claude Code 直连配置（使用自己的 API）

估算大模型所需显存

Hugging Face 仓库下载指南

Claude Skills 完全指南：从零开始创建你的第一个 AI 技能

ms-swift q3 30a3b 训练记录

修复nvidia-smi无法找到的问题

Nemotron-Cascade的简化GRPO目标函数

深入理解奖励模型：从训练到RLHF应用

奖励塑形(Reward Shaping)技术解释

大模型训练中的混合策略

GAE (Generalized Advantage Estimation)

PPO 奖励模型和价值模型

Megatron GRPO GSPO 参数设置指南

容器找不到nvidia-smi的解决方法

使用uv安装vllm

nvidia apex 安装

nvidia PyTorch Release 25.11

EvoLM LLM炼丹师最优配方

qwen3vl的tools设计验证

stepfun-ai/GELab-Zero-4B-preview

深入理解 GRPO 强化学习:从 PPO 到 Group Relative Policy Optimization

深入理解大模型采样参数：Temperature、Top-p 与 Top-k

时序预测深度学习技术全面汇总

FaceChain FACT 换脸 Docker镜像实战

OpenRouter 调用

Ollama 本地部署与 OpenAI 兼容指南

vLLM多机部署笔记：从环境配置到GLM-4.6服务启动（RoCE网络）

构建agent的12个准则：12-factor-agents

Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 部署

sentence-transformers Embedding Models 损失函数

微调owl32b，让mobile agent v3更聪明

微调owl32bmobile agent v3模型训练+2

推理能力（QwQ）、多模态交互（Omni）、架构创新（Next）

qwen模型推理能力多模态交互+2

一个接口同时支持 HTTP 和 Streamable HTTP：MCP 双协议实现深度解析

json-rpcmcp协议streamable http+2

如何调用MCP服务器获取信息？

mcp服务器调用知乎新闻获取python异步编程+2

如何获取 MCP 工具的描述信息？

mcp工具描述信息获取python mcp客户端mcp inspector+2

部署mPLUG/GUI-Owl-32B

mpluggui-owlvllm+2

uiautomator2的完整能力

uiautomator2自动化测试元素查找+2

huggingface-cli 下载模型

huggingface-cli模型下载国内镜像加速+2

UI-TARS-72B-DPO vllm部署和请求

ui-tars-72b-dpo部署vllm模型请求openai api server+2

一些MCP部署记录

crawl4aidocker部署网页爬取+2

MCP 四种服务传输类型详解：STDIO、SSE、Streamable HTTP 与 InMemory

mcp协议传输类型stdio+3

Cursor如何支持ctrl+c？

cursor配置ctrl+c复制vscode终端复制+2

huggingface 续传模型

huggingface模型续传git lfs+2

在 Windows 系统上安装 Node.js

node.js安装windows系统长期支持版本+2

小红书mcp运营

小红书mcp运营小红书内容发布mcp服务配置+2

AI Agent 如何做好？

ai agent认知流程chatbot区别+2

stable-diffusion-webui 写真

stable-diffusion-webui写真git clone+2

FishAudioTTS 请求

fish audiotts apipython文本转语音fish audiotts请求示例+2

【深度学习】【语音TTS】GPT-SoVITS v2 实战，训练一个人的音色，Docker镜像-2

gpt-sovits v4实战docker部署gpt-sovits语音合成tts教程+2

vllm 部署 Meta-Llama-3-70B-Instruct-abliterated-v3.5

vllm部署Meta-Llama-3-70B-Instruct大模型部署+2

大模型安全研究1-abliteration

大模型安全研究模型正交化模型微调+2

显卡性能测试方法vllm吞吐量测试延迟测试

显卡性能测试vllm吞吐量测试延迟测试+2

sudo pkill -9 -f launcher.py

linux命令pkill命令sudo pkill+2

llamafactory-cli train 快速训练测试

llamafactory-cliQwen2.5-3B-Instruct模型训练alpaca_en_demo数据集+2

gguf这种文件如何启动为openai式的接口？

gguf文件启动llama-cpp-python服务器OpenAI接口替代+2

大模型的涌现能力

大模型的涌现能力大型语言模型人工智能发展+5

神经语言模型缩放定律：核心观点解读

神经语言模型缩放定律模型性能幂律关系+16

72B蒸馏到3B，在3B上再微调？

蒸馏模型通用模型专用模型+2

大型语言模型尚无法实现推理自纠错！CoT为什么提升准确率？

chain of thought思维链大型语言模型+2

基于大模型的外卖词槽提取完整方案

意图识别词槽提取大模型+2

vivo BlueLM-2.5-3B

vivo bluelm-2.5-3b多模态大语言模型边缘设备部署+2

超长上下文的大模型训练

超长上下文大模型训练注意力机制优化状态空间模型+2

美团LongCat-Flash-Thinking

longcat-flash-thinking美团longcat混合专家模型+2

做agent的坑的记录

agent开发数据不一致训练数据问题+1

强化学习数据格式gui自动化强化学习训练+2

transformer加普通token

transformerstokenizerhuggingface+2

占用显卡显存代码

占用显存gpu监控pytorch显存管理+2

claude web 转 openai api 接口

claude apiclaude web interfaceopenai api integration+2

LLama-Factory数据预处理

llama-factory数据预处理qwen2vl模型预处理数据加载与转换+8

BLEU和ROUGE评估指标详解

bleu评估指标详解rouge评估指标详解自然语言生成质量评估+2

NCCL 官方文档手册位置

nccl官方文档手册nvidia deep learning ncclnccl docs+2

LLaMA-Factory 多机多卡训练配置

llm多机多卡训练配置llama-factory配置教程多机多卡训练优化+2

Linux系统支持中文字符处理

linux中文字符处理linux安装中文字体linux配置中文语言环境+2

rlaunch vllm Qwen2.5-VL-7B-Instruct

qwen2.5-vl-7b-instructvllm api图像分析+2

阶跃星辰 stepfun api

stepfun apiopenaichat completion+2

new_special_tokens

huggingface tokenizerspecial tokens参数配置+2

如何向 Transformers 模型词表中添加新 token

transformers模型词表新token+2

tokenizer_config.json

tokenizer_config.jsonHuggingFace Transformers特殊token添加+2

LLaMA-Factory EXTRAS

llama-factoryextras参数dockerfile+2

LLaMA-Factory AWS S3 文件读写

llamma-factoryaws s3boto3+2

【知识点】5种Agent模式

agent模式反思模式工具使用模式+2

【深度学习】Fooocus Outpaint 原理

fooocus outpaint原理画布扩展与遮罩创建内容感知填充+2

【知识点】匈牙利算法的计算过程示例

匈牙利算法示例最佳分配问题外卖配送优化+2

【知识点】OpenPose姿态检测

openpose姿态检测输入输出形状vgg网络结构+2

【知识点】CDP人脸聚类，共识驱动传播人脸聚类方法

cdp人脸聚类共识驱动传播无标签聚类方法+2

InsightFace人脸检测方法分析

insightface人脸检测retinaface算法scrfd优化+2

【知识点】U-Net/HRNet 区别

u-net结构hrnet特征融合编码器解码器+2

【知识点】Mask R-CNN

mask r cnn 损失函数mask r cnn 实例分割mask r cnn 原理+2

AstrBot NapCat 消息机器人实战教程教学

astrbot napcat 部署教程qq机器人大模型接入docker 部署 astrbot+2

sglang 部署 Qwen/Qwen3-32B

sglang部署教程qwen3-32b模型部署docker模型服务配置+2

sglang 部署Qwen/Qwen2.5-VL-7B-Instruct

sglang部署qwen2-vlqwen2-vl模板配置多模态模型部署+2

【知识点】YOLO编年史，YOLO全系列解析

yolo v1 v2 v3 v4 v5yolo 模型演进yolo 检测原理+2

【知识点】GAN的常用的损失函数有哪些？

gan损失函数比较生成对抗网络训练技巧wasserstein gan原理+2

【知识点】SVM支持向量机，松弛变量，核技巧

svm分类器原理支持向量机优化目标松弛变量软间隔+4

【知识点】VLLM 自动前缀缓存，推理加速

vllm自动前缀缓存推理加速优化llm性能优化+2

【知识点】强化学习关键术语

强化学习术语强化学习状态动作奖励q函数与v函数+2

RoPE 旋转位置编码详解与计算示例

rope 旋转位置编码transformer 位置编码位置编码计算示例+2

【知识点】深度学习面试题汇总（持续更新）

深度学习面试题汇总梯度消失与梯度爆炸过拟合解决方案+2

【训练】Qwen2.5VL 多机多卡 Grounding Box定位（2）

qwen2.5-vl训练grounding box定位多机多卡训练+2

【知识点】Transformer中计算最复杂的模块是什么

transformer自注意力机制transformer时间复杂度transformer计算瓶颈+2

【知识点】训练模型时遇到out of memory怎么解决

深度学习内存优化模型训练out of memory解决梯度累积技巧+2

【知识点】训练过程出现NaN如何解决

深度学习训练nan问题模型loss变为nan解决方法梯度爆炸处理+2

【知识点】DPO、PPO reference 模型和 actor 模型是否可以为同一个模型

dpo与ppo对比dpo reference模型actor模型训练+2

【知识点】PPO、DPO、KTO

ppo算法原理dpo强化学习kto训练方法+2

【知识点】DPO强化学习

dpo算法详解强化学习替代方案语言模型对齐技术+4

【知识点】PPO强化学习

ppo算法原理ppo-clip实现强化学习算法+2

【知识点】sft如何避免灾难性遗忘

sft灾难性遗忘弹性权重整合ewc渐进神经网络+7

【知识点】为何进行Query改写，Query改写的核心价值

query改写核心价值信息残缺问题处理语义模糊优化+3

【知识点】微调模型 VS RAG，为何选RAG？

rag技术优势微调模型对比大模型幻觉问题+2

【损失函数】InfoNCE损失，多模态模型的对比学习代码

infonceloss多模态对比学习对比学习代码实现+2

【知识点】m-RoPE(多模态旋转位置编码)

m-rope多模态旋转位置编码三维位置编码技术视觉与文本多模态处理+2

如何给transformers库打Python补丁

transformers库补丁python库修改技巧docker环境调试+2

【代码解读】LLama-Factory SharegptDatasetConverter

llama factory 数据集转换器sharegpt 数据格式处理多模态对话数据处理+2

【API】将SigClip部署为API

siglip api部署图像特征提取fastapi图像服务+2

【训练】Qwen2.5VL 多机多卡 Grounding Box定位（1）

qwen2.5vl grounding box定位多机多卡训练配置绝对坐标处理方法+2

vLLM 如何使用配置 tokenizer_config.json

vllm tokenizer_config.json配置qwen3模型部署教程vllm工具调用解析+2

Qwen/Qwen3如何支持长的上下文

qwen3长上下文处理qwen3-30b-a3b模型长文本处理技术+2

Qwen/Qwen3-30B-A3B vllm部署和访问

qwen3-30b-a3b部署vllm模型服务配置docker模型部署教程+2

Qwen/Qwen3-32B vllm部署和访问

qwen3 32b 部署vllm docker 部署教程modelscope 模型下载+2

AMEX vivo UI agents 数据集介绍

amex数据集介绍gui交互元素定位gui功能描述生成+2

上传模型到huggingface

huggingface模型上传git初始化教程hf access token生成+3

【训练】InternVL2_8B full sft 多机多卡训练

internvl2_8b 多机多卡训练多模态模型 finetune 教程图像点到框检测训练+2

LLaMA-Factory 训练参数解读

llama factory 参数解析image_max_pixels 图像处理lora_rank 低秩适配+2

【训练】LLaMA-Factory InternVL3-8B 多机多卡训练

llama-factory 多机多卡训练internvl3-8b 模型训练多模态模型部署+2

InternVL 1技术深度分析

internvl 1技术解析多模态模型架构视觉语言融合技术+2

InternVL 3的技术深度分析，代码与原理

internvl 3 技术解析variable visual position encodingnative multimodal pre-training+2

internvl box tokenspatial layout projector边界框表示方法+2

ValueError: Image features and image tokens do not match: tokens: 2305, features 2304

image token mismatch errorimage features vs tokenspytorch vision model error+2

CycleGAN 的原理与代码

cyclegan原理cyclegan代码实现生成对抗网络+2

Stable Diffusion：文本提示如何作用于Stable Diffusion的图像生成过程

stable diffusion文本提示原理stable diffusion图像生成流程clip文本编码器工作原理+2

Stable Diffusion：CFG Scale 是如何控制文生图的

stable diffusion cfg scale文生图参数详解classifier free guidance scale+2

Stable Diffusion：噪声采样的调度器的原理

stable diffusion噪声调度器karras调度器原理扩散模型采样器优化+2

Stable Diffusion：采样器的数学原理

stable diffusion采样器数学原理stable diffusion去噪算法stable diffusion euler采样器+2

Stable Diffusion：文生图的代码执行原理

stable diffusion 文本生成图像文生图代码原理stable diffusion 采样器解析+2

Stable Diffusion：使用ControlNet为黑白照片上色

stable diffusion黑白照片上色controlnet recolor模型图像修复历史照片+2

图像质量评估所使用的一些指标计算方法

图像质量评估指标计算图像上色质量评估方法ssim计算原理+2

【训练】Qwen 2.5 VL 图片转公式，微调实战教学

qwen2.5-vl 微调实战图片转公式 latex模型微调教学+2

LLaMA-Factory多机多卡训练Qwen2.5VL

llama factory多机多卡训练qwen2.5 vl模型微调多模态数据集构建+2

使用 device_map 优化 Transformers 模型的多 GPU 显存分配

device_map 多 gpu 显存分配transformers 模型优化hugging face 模型并行+2

vllm部署Qwen2.5-VL-7B-Instruct

vllm部署教程qwen2.5-vl模型docker启动vllm+2

vllm 部署QwQ-32B ，访问代码

vllm部署教程qwq-32b模型部署docker compose配置+2

AIGC降重提示词

aigc降重技巧aigc提示词优化降重ai写作风格+3

【训练】LLaMA-Factory多机多卡微调训练实战

llama-factory多机多卡训练qwen2.5vl微调实战docker镜像制作与训练+2

onnx gpu在docker里支持

onnx gpu docker部署onnxruntime-gpu 安装配置docker容器cuda支持+2

sdwebui docker打包

sdwebui docker部署docker stable diffusionpytorch cuda docker镜像+2

ControlNet Reference模型：reference_adain、reference_adain+attn与reference_only的区别与应用场景解析

controlnet reference模型对比reference_adain应用场景reference_adain+attn详解+2

【训练】LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct

llama-factory 微调qwen2.5-vl 7b instruct 训练lora 模型微调配置+2

Qwen2.5-VL 技术报告总结

qwen2.5-vl 技术报告多模态大模型创新视觉语言理解技术+2

使用mergekit合并大型语言模型

mergekit模型合并slerp合并方法ties模型合并+3

LiteLLM 做大模型API接口Proxy转发

litellm proxy 配置教程大模型 api 接口转发litellm 多模型管理+2

跑ZhipuAI/CogView4-6B的效果

zhipuai cogview4-6b 效果测试深度学习模型 docker 部署模型推理显存占用+2

阶跃星辰 Step-Vedio-T2V Docker 推理

step-video-t2v docker部署step-video-t2v 推理教程step-video-t2v 高性能视频生成+2

llama.cpp 跑 qwen2.5 量化模型

llama.cpp量化模型部署qwen2.5模型优化深度学习模型蒸馏+2

ktransformers 部署Deepseek-R1

ktransformers部署deepseek-r1deepseek模型优化llm本地部署教程+2

sglang 启动 Qwen2.5-32B-Instruct-GPTQ-Int4 API

sglang部署教程qwen2.5 32b instruct apidocker启动大模型+2

sglang 启动 DeepSeek-R1-Distill-Qwen-32B API

sglang部署大模型deepseek-r1-distill-qwen-32b教程docker启动sglang+2

旋转位置编码（RoPE）的代码片段

rope实现代码旋转位置编码数学原理transformer位置编码优化+2

OpenWebUI使用DeepSeek R1满血版，DeepSeek R1 API调用

openwebui deepseek r1deepseek r1 api调用openai api 教程+2

FlashAttention 透彻理解

flashattention原理详解transformer优化技术attention机制优化+2

DDColor 效果实战教程

ddcolor 图像上色教程深度学习模型部署docker 部署教程+2

pix2pix pytorch 图片上色，模型训练实战，Docker【3】

pix2pix 图像上色pytorch 模型训练docker 环境配置+2

pix2pix mmgeneration 线稿上色，模型训练实战，Docker【2】

pix2pix 线稿上色mmgeneration 模型训练docker 部署深度学习+2

pix2pix mmgeneration通用场景黑白图片上色模型训练，Docker 【1】

pix2pix 黑白图片上色docker 环境配置mmgeneration 模型训练+2

文生图排行榜

文生图排行榜text to image benchmark图像生成模型对比+2

Open WebUI + Ollama

open webui 部署教程ollama 安装配置docker 运行 open webui+2

OpenWebUI 使用 Azure OpenAI

azure openai 配置openwebui 教程openai proxy 接口+2

Azure OpenAI 转 openai proxy接口

azure openai 接口配置openai proxy 设置litellm azure 教程+2

部署siglip-so400m-patch14-384为API

siglip模型部署fastapi图像特征提取python图像处理api+2

flux diffuser 分卡切分运行

flux模型分卡运行多gpu推理优化transformer模型拆分+2

llama-factory 量化数据要求 c4_demo.json

llama-factory量化教程c4_demo.json格式转换alpaca转c4数据+2

量化方法的辨析-动态离线量化方法、静态离线量化方法和量化训练方法是什么区别？

动态离线量化方法静态离线量化方法量化训练方法+3

Milvus使用教程（五）总结

milvus使用教程milvus集合创建pymilvus接口调用+2

Dify流式请求示例

dify流式请求示例python流式处理接口fastapi流式返回+2

mini-omni2 语音对话模型论文

mini-omni2 训练方法多模态对话模型语音中断机制+2

Moshi 论文解析

moshi论文解析语音到语音模型全双工对话技术+2

LLM的不同角色system、user

llm角色system和usercompletion_to_prompt函数解析messages_to_prompt格式化处理+2

Conan-embedding模型使用

conan-embedding模型句子嵌入技术深度学习模型应用+2

Conan-embedding模型论文解析

conan-embedding模型解析动态困难负样本挖掘跨gpu批次平衡损失+2

embedding模型排行榜

embedding模型排行榜mteb基准测试huggingface模型评估+2

TensorRT-LLM，Qwen2.5 加速量化部署

tensorrt-llm 部署qwen2.5 模型量化nvidia tensorrt 引擎构建+2

RoPE 旋转位置编码解析

rope 旋转位置编码transformer 位置编码原理位置编码高频低频分析+2

大模型量化方法解析：WO、AWQ、GPTQ 与 SQ 的对比

大模型量化技术对比awq量化方法gptq模型优化+2

开源LLM大模型排行榜

开源大模型评测llm性能排行榜opencompass评测平台+2

sglang 部署Qwen2VL7B，大模型部署，速度测试，深度学习

sglang部署qwen2vl7b大模型速度测试深度学习模型优化+2

seeAct 论文解析

seeact 论文解析多模态网络代理gpt-4v 视觉理解+2

ollama Docker部署qwen2.5:72b-instruct

ollama docker部署qwen2.5 72b instructdocker run命令+2

ollama Docker部署 Qwen2.5-Coder-32B-Instruct

ollama docker部署qwen2.5-coder 32bdocker运行大模型+2

Dify，编排应用，随心所欲使用大模型

dify安装教程docker compose部署大模型编排技术+2

Ovis，多模态大模型微调

多模态大模型微调ovis模型教程gemma2 9b模型部署+2

pixart Docker部署推理

pixart docker部署pixart 推理代码pytorch docker环境配置+2

vllm 部署 Qwen/Qwen2.5 ，访问代码

vllm部署教程qwen模型部署docker运行vllm+2

vllm 部署 Qwen/Qwen2.5-Coder-7B-Instruct openai接口

vllm部署教程qwen2.5-coder-7b-instruct部署openai接口配置+2

Docker 官网vLLM镜像快速部署 Qwen2.5

docker部署qwen2.5vllm镜像使用教程nvidia gpu加速docker+2

测试NanoFlow：比 vLLM 和 TensorRT-LLM 更快

nanoflow测试vllm对比tensorrt-llm优化+2

requests openai api 接口访问

requests调用openai apipython访问chat completions接口openai api接口参数设置+2

数据准备详解：打造高质量的语言模型训练数据集

数据集配置指令监督微调alpaca格式数据+2

ChatGPT openai接口，图片对话程序

chatgpt图片识别openai api使用教程python图片对话程序+2

ChatGPT openai接口多轮对话程序

chatgpt多轮对话实现openai接口调用教程chatgpt python代码示例+2

构建最新的LLaMA-Factory镜像

llama-factory 镜像构建docker 镜像更新深度学习环境配置+2

相机里面的视觉算法（4）

相机视觉算法图像超分辨率人像美颜技术+12

相机里面的视觉算法（3）

相机成像系统详解isp图像处理算法raw域降噪与深度学习+2

相机里面的视觉算法（2）

isp流水线优化图像信号处理算法raw到rgb转换+2

相机里面的视觉算法（1）

相机视觉算法光学镜头技术自动对焦原理+2

安装vllm并部署Qwen2VL API

vllm部署教程qwen2vl api配置cuda12.1镜像构建+2

如何构建自己的vllm镜像，cuda12.1

vllm镜像构建cuda12.1编译docker自定义镜像+2

使用vllm部署Qwen2VL API

qwen2vl api部署vllm docker部署图像处理性能优化+3

自监督学习-基础知识分享

自监督学习基础生成式自监督方法对比学习算法+2

三元损失（triplet loss）

triplet loss原理三元损失函数人脸识别深度学习+2

Qwen2-VL API 快速部署服务教程

qwen2-vl api部署教程transformers部署模型fastapi图像识别服务+2

使用LLaMA-Factory微调sft Qwen2-VL-7B-Instruct

llama-factory 微调教程qwen2-vl-7b 模型训练图像文字信息提取json输出+2

A Cookbook of Self-Supervised Learning 中文翻译

self-supervised learningssl cookbookself-supervised learning tutorial+7

词汇分割方法：WordPiece Model 和 Byte Pair Encoding 的详细解读

wordpiece model原理byte pair encoding实现nlp分词技术+2

Transformer的并行化提现在哪个地方?Decoder 端可以做并行化吗?

transformer并行化原理decoder自回归限制自注意力机制并行计算+2

Transformer中的前馈神经网络?使用了什么激活函数?相关优缺点?

transformer前馈网络结构transformer激活函数relu前馈神经网络优缺点+2

Transformer模型中的LayerNorm与BatchNorm：为什么选择LayerNorm？

transformer layernormbatchnorm vs layernormtransformer正则化方法+2

为什么在获取输入词向量之后需要对矩阵乘以embedding size的开方？

词向量缩放embedding size开方transformer模型优化+2

为什么在多头注意力中需要对每个 Head 进行降维？

多头注意力降维原理transformer模型优化注意力机制计算复杂度+2

如何在计算 Attention Score 时对 Padding 做 Mask 操作

attention mask 实现transformer padding 处理pytorch attention score mask+2

Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?

transformer attention机制点乘与加法对比attention计算复杂度+2

【深度学习】Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?

transformer架构自注意力机制q和k权重矩阵区别+2

【知识点】transformer为什么使用多头注意力机制？为什么不使用一个头

transformer多头注意力机制多头注意力与单头注意力区别transformer模型原理+2

如何理解多模态模型Qwen2-VL中的MIN_PIXELS和MAX_PIXELS

qwen2-vl 图像处理参数min_pixels 作用解析max_pixels 限制详解+2

使用LMDeploy部署InternVL2，速度测试

internvl2 部署教程lmdeploy 多模态模型部署docker 显存占用测试+2

【深度学习】Qwen2-VL API速度测试与部署

qwen2-vl api测试深度学习模型部署显存占用优化+2

【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4，容器即服务启动

llama-factory部署qwen2-vl模型配置docker容器部署教程+2

【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4

Qwen2-VL-72B-Instruct-GPTQ-Int4

【深度学习】FLUX.1，文生图，推理部署实战教程

stable-diffusion-3-medium部署体验实战教学

stable-diffusion-3-medium部署教程huggingface模型下载配置pytorch环境搭建实战+2

fooocus-api，得到一些训练图片的过程

fooocus api使用图像训练教程ai绘画数据集+2

fooocus-api访问API得到图，Docker部署

fooocus api使用教程docker部署文生图文生图api接口调用+2

【深度学习】LLaMA-Factory部署Qwen2-VL

使用Python和Pydub调整音频音量

深度学习，TTS AB测试代码

【深度学习】语音TTS，微调训练 StableTTS V1.1

【深度学习】语音TTS，微调训练 fishaudio / fish-speech-1.4

语音TTSfishaudiofish-speech-1.4

【深度学习】强化学习介绍

强化学习基础马尔可夫决策过程深度强化学习算法+2

音频格式：OGG、RAW、WAV与AAC的区别

ogg音频格式raw音频处理wav文件特点+2

如何测试 ONNX Runtime 是否使用了 GPU 进行推理

测试onnxruntime-gpu

Python使用 Gradio 实现多张图片上传WebUI

gradio多张图片上传

【深度学习】GOT-OCR2.0：一款端到端的 OCR 模型，镜像

使用Kubernetes（K8s）进行多机多卡分布式训练

K8s多机多卡训练

【深度学习】torch.distributed.launch、torchrun、accelerate 和 deepspeed 对比解析

deepspeedaccelerate

多机多卡训练中的极速数据互联：NVLink、RDMA与NCCL配置详解

多机多卡训练NVLink、RDMA与NCCL配置

【深度学习】如何评估大语言模型（LLM）性能

大模型质量评估

【深度学习】探索大模型训练中的关键标签：system、user、role、content、assistant、observation、function

大模型训练中的关键标签

【深度学习】什么是PPO训练?

【深度学习】LLaMA-Factory，Why is LoRA much slower than Freeze?

【深度学习】Python，印章数据集制作，印章制作

印章数据集深度学习印章制作+1

机器视觉的一些题目

机器视觉题目

【深度学习】LLaMA-Factory微调sft Qwen2-VL进行印章识别

微调LLaMA-Factorysft+1

【深度学习】如何安装xformer？flash-attn？

安装xformerflash-attn

【深度学习】Qwen2-VL最强开源OCR模型，手写字体识别、印章识别

深度学习OCR手写字体+3

【深度学习】Python，金融欺诈行为检测

金融欺诈行为检测深度学习+1

【深度学习】安全帽检测，目标检测，Faster RCNN训练

Faster RCNN训练深度学习

【深度学习】安全帽检测，目标检测，yolov10算法，yolov10训练

安全帽检测目标检测yolov10

【推理框架】MNN框架 C++、Python、Java使用例子 Demo

【深度学习】深度学习推理框架 TensorRT MNN OpenVINO ONNXRuntime

深度学习mnn

insightface 人脸识别模型训练 RecordIO数据格式

python深度学习ubuntu

【深度学习】人脸聚类算法的评估指标程序，精准率、召回率、F1分数

深度学习聚类算法

深度学习人脸识别优秀开源项目 state-of-the-art SOTA deepface 项目使用过程教程

深度学习人脸识别deepface使用教程人脸检测与对齐+2

【深度学习】表情识别A Dual-Direction Attention Mixed Feature Network for Facial Expression Recognition 训练

人工智能深度学习

【深度学习】miniCPM2.6，微调sft训练用于印章识别

深度学习,大模型,miniCPM,sft,微调,印章识别

【深度学习】【语音TTS】GPT-SoVITS v2 实战，训练一个人的音色，Docker镜像

深度学习gpttts+1

【知识点】决策树算法详解：ID3、C4.5 和 CART 的原理与实现

算法决策树机器学习

【深度学习】【机器学习】用神经网络进行入侵检测，NSL-KDD数据集，基于机器学习（深度学习）判断网络入侵，网络攻击，流量异常【3】

深度学习机器学习神经网络

【深度学习】【机器学习】用神经网络进行入侵检测，NSL-KDD数据集，基于机器学习（深度学习）判断网络入侵，网络攻击，流量异常

深度学习机器学习神经网络

【深度学习】【机器学习】用神经网络进行入侵检测，NSL-KDD数据集，基于机器学习（深度学习）判断网络入侵

深度学习NSL-KDD入侵检测+1

Dong

个人博客|深度学习|编程开发|嵌入电子|自动控制|算法深耕|