Press
esc
to close
请输入并搜索
Dong
Dong
首页
标签
分类
时间线
友链
动态
工具
联系我
Press
Ctrl
+
and
K
to search
深度学习
Linux运维
单片机
Python
CPP
Android/Java
Docker
OpenCV
Matlab
售卖作品
深度学习ban
单片机ban
DL论文
建站教程
树莓派
算法刷题
提示词工程
数学之美
工具使用
课程学习
见闻录
备忘录
隐藏机密
自动控制
摄影技巧
Git
LLaMA-Factory
ROS
GRPO
Vanblog
Distill
usefulScripts
首页
标签
分类
时间线
友链
动态
工具
联系我
深度学习
238 文章 × 1117968 字
2025-10-31
推理能力(QwQ)、多模态交互(Omni)、架构创新(Next)
2025-10-29
一个接口同时支持 HTTP 和 Streamable HTTP:MCP 双协议实现深度解析
2025-10-28
如何调用MCP服务器获取信息?
2025-10-28
如何获取 MCP 工具的描述信息?
2025-10-27
部署mPLUG/GUI-Owl-32B
2025-10-24
uiautomator2的完整能力
2025-10-24
huggingface-cli 下载模型
2025-10-24
UI-TARS-72B-DPO vllm部署和请求
2025-10-24
一些MCP部署记录
2025-10-24
MCP 四种服务传输类型详解:STDIO、SSE、Streamable HTTP 与 InMemory
2025-10-23
Cursor如何支持ctrl+c?
2025-10-21
huggingface 续传模型
2025-10-21
在 Windows 系统上安装 Node.js
node.js安装
windows系统
长期支持版本
+2
2025-10-21
小红书mcp运营
小红书mcp运营
小红书内容发布
mcp服务配置
+2
2025-10-21
AI Agent 如何做好?
ai agent
认知流程
chatbot区别
+2
2025-10-20
stable-diffusion-webui 写真
stable-diffusion-webui
写真
git clone
+2
2025-10-18
FishAudioTTS 请求
fish audiotts api
python文本转语音
fish audiotts请求示例
+2
2025-10-17
【深度学习】【语音TTS】GPT-SoVITS v2 实战,训练一个人的音色,Docker镜像-2
gpt-sovits v4实战
docker部署gpt-sovits
语音合成tts教程
+2
2025-10-17
vllm 部署 Meta-Llama-3-70B-Instruct-abliterated-v3.5
vllm部署
Meta-Llama-3-70B-Instruct
大模型部署
+2
2025-10-15
大模型安全研究1-abliteration
大模型安全研究
模型正交化
模型微调
+2
2025-10-15
显卡性能测试方法vllm吞吐量测试延迟测试
显卡性能测试
vllm吞吐量测试
延迟测试
+2
2025-10-14
sudo pkill -9 -f launcher.py
linux命令
pkill命令
sudo pkill
+2
2025-10-14
llamafactory-cli train 快速训练测试
llamafactory-cli
Qwen2.5-3B-Instruct模型训练
alpaca_en_demo数据集
+2
2025-10-14
gguf这种文件如何启动为openai式的接口?
gguf文件启动
llama-cpp-python服务器
OpenAI接口替代
+2
2025-09-26
大模型的涌现能力
大模型的涌现能力
大型语言模型
人工智能发展
+5
2025-09-26
神经语言模型缩放定律:核心观点解读
神经语言模型缩放定律
模型性能
幂律关系
+16
2025-09-25
72B蒸馏到3B,在3B上再微调?
蒸馏模型
通用模型
专用模型
+2
2025-09-25
大型语言模型尚无法实现推理自纠错!CoT为什么提升准确率?
chain of thought
思维链
大型语言模型
+2
2025-09-25
基于大模型的外卖词槽提取完整方案
意图识别
词槽提取
大模型
+2
2025-09-25
vivo BlueLM-2.5-3B
vivo bluelm-2.5-3b
多模态大语言模型
边缘设备部署
+2
2025-09-24
超长上下文的大模型训练
超长上下文大模型训练
注意力机制优化
状态空间模型
+2
2025-09-24
美团LongCat-Flash-Thinking
longcat-flash-thinking
美团longcat
混合专家模型
+2
2025-09-05
做agent的坑的记录
agent开发
数据不一致
训练数据问题
+1
2025-08-15
AgentCPM-GUI
强化学习数据格式
gui自动化
强化学习训练
+2
2025-08-13
transformer加普通token
transformers
tokenizer
huggingface
+2
2025-08-05
占用显卡显存代码
占用显存
gpu监控
pytorch显存管理
+2
2025-08-03
claude web 转 openai api 接口
claude api
claude web interface
openai api integration
+2
2025-08-02
ms-swift 多机多卡训练
ms-swift多机多卡训练
分布式深度学习
多GPU训练
+2
2025-08-02
LLama-Factory数据预处理
llama-factory数据预处理
qwen2vl模型预处理
数据加载与转换
+8
2025-08-01
BLEU和ROUGE评估指标详解
bleu评估指标详解
rouge评估指标详解
自然语言生成质量评估
+2
2025-08-01
NCCL 官方文档手册位置
nccl官方文档手册
nvidia deep learning nccl
nccl docs
+2
2025-08-01
LLaMA-Factory 多机多卡训练配置
llm多机多卡训练配置
llama-factory配置教程
多机多卡训练优化
+2
2025-07-19
Linux系统支持中文字符处理
linux中文字符处理
linux安装中文字体
linux配置中文语言环境
+2
2025-07-18
rlaunch vllm Qwen2.5-VL-7B-Instruct
qwen2.5-vl-7b-instruct
vllm api
图像分析
+2
2025-07-16
阶跃星辰 stepfun api
stepfun api
openai
chat completion
+2
2025-07-16
new_special_tokens
huggingface tokenizer
special tokens
参数配置
+2
2025-07-16
如何向 Transformers 模型词表中添加新 token
transformers模型
词表
新token
+2
2025-07-16
tokenizer_config.json
tokenizer_config.json
HuggingFace Transformers
特殊token添加
+2
2025-07-14
LLaMA-Factory EXTRAS
llama-factory
extras参数
dockerfile
+2
2025-07-11
LLaMA-Factory AWS S3 文件读写
llamma-factory
aws s3
boto3
+2
2025-06-03
【知识点】5种Agent模式
agent模式
反思模式
工具使用模式
+2
2025-06-03
【深度学习】Fooocus Outpaint 原理
fooocus outpaint原理
画布扩展与遮罩创建
内容感知填充
+2
2025-06-03
【知识点】匈牙利算法的计算过程示例
匈牙利算法示例
最佳分配问题
外卖配送优化
+2
2025-06-02
【知识点】OpenPose姿态检测
openpose姿态检测
输入输出形状
vgg网络结构
+2
2025-06-02
【知识点】CDP人脸聚类,共识驱动传播人脸聚类方法
cdp人脸聚类
共识驱动传播
无标签聚类方法
+2
2025-06-02
InsightFace人脸检测方法分析
insightface人脸检测
retinaface算法
scrfd优化
+2
2025-06-02
【知识点】U-Net/HRNet 区别
u-net结构
hrnet特征融合
编码器解码器
+2
2025-06-02
【知识点】Mask R-CNN
mask r cnn 损失函数
mask r cnn 实例分割
mask r cnn 原理
+2
2025-05-30
AstrBot NapCat 消息机器人实战教程教学
astrbot napcat 部署教程
qq机器人 大模型接入
docker 部署 astrbot
+2
2025-05-30
sglang 部署 Qwen/Qwen3-32B
sglang部署教程
qwen3-32b模型部署
docker模型服务配置
+2
2025-05-28
sglang 部署Qwen/Qwen2.5-VL-7B-Instruct
sglang部署qwen2-vl
qwen2-vl模板配置
多模态模型部署
+2
2025-05-27
【知识点】YOLO编年史,YOLO全系列解析
yolo v1 v2 v3 v4 v5
yolo 模型演进
yolo 检测原理
+2
2025-05-27
【知识点】GAN的常用的损失函数有哪些 ?
gan损失函数比较
生成对抗网络训练技巧
wasserstein gan原理
+2
2025-05-27
【知识点】SVM支持向量机,松弛变量,核技巧
svm分类器原理
支持向量机优化目标
松弛变量软间隔
+4
2025-05-20
【知识点】VLLM 自动前缀缓存,推理加速
vllm自动前缀缓存
推理加速优化
llm性能优化
+2
2025-05-19
【知识点】强化学习关键术语
强化学习术语
强化学习状态动作奖励
q函数与v函数
+2
2025-05-19
RoPE 旋转位置编码详解与计算示例
rope 旋转位置编码
transformer 位置编码
位置编码计算示例
+2
2025-05-16
【知识点】深度学习面试题汇总(持续更新)
深度学习面试题汇总
梯度消失与梯度爆炸
过拟合解决方案
+2
2025-05-13
【训练】Qwen2.5VL 多机多卡 Grounding Box定位(2)
qwen2.5-vl训练
grounding box定位
多机多卡训练
+2
2025-05-13
【知识点】Transformer中计算最复杂的模块是什么
transformer自注意力机制
transformer时间复杂度
transformer计算瓶颈
+2
2025-05-13
【知识点】训练模型时遇到out of memory怎么解决
深度学习内存优化
模型训练out of memory解决
梯度累积技巧
+2
2025-05-13
【知识点】训练过程出现NaN如何解决
深度学习训练nan问题
模型loss变为nan解决方法
梯度爆炸处理
+2
2025-05-12
【知识点】DPO、PPO reference 模型和 actor 模型是否可以为同一个模型
dpo与ppo对比
dpo reference模型
actor模型训练
+2
2025-05-12
【知识点】PPO、DPO、KTO
ppo算法原理
dpo强化学习
kto训练方法
+2
2025-05-12
【知识点】DPO强化学习
dpo算法详解
强化学习替代方案
语言模型对齐技术
+4
2025-05-12
【知识点】PPO强化学习
ppo算法原理
ppo-clip实现
强化学习算法
+2
2025-05-12
【知识点】sft如何避免灾难性遗忘
sft灾难性遗忘
弹性权重整合ewc
渐进神经网络
+7
2025-05-12
【知识点】为何进行Query改写,Query改写的核心价值
query改写核心价值
信息残缺问题处理
语义模糊优化
+3
2025-05-12
【知识点】微调模型 VS RAG,为何选RAG?
rag技术优势
微调模型对比
大模型幻觉问题
+2
2025-05-09
【损失函数】InfoNCE损失,多模态模型的对比学习代码
infonceloss
多模态对比学习
对比学习代码实现
+2
2025-05-09
【知识点】m-RoPE(多模态旋转位置编码)
m-rope多模态旋转位置编码
三维位置编码技术
视觉与文本多模态处理
+2
2025-05-09
如何给transformers库打Python补丁
transformers库补丁
python库修改技巧
docker环境调试
+2
2025-05-08
【代码解读】LLama-Factory SharegptDatasetConverter
llama factory 数据集转换器
sharegpt 数据格式处理
多模态对话数据处理
+2
2025-05-07
【API】将SigClip部署为API
siglip api部署
图像特征提取
fastapi图像服务
+2
2025-05-07
【训练】Qwen2.5VL 多机多卡 Grounding Box定位(1)
qwen2.5vl grounding box定位
多机多卡训练配置
绝对坐标处理方法
+2
2025-04-30
vLLM 如何使用配置 tokenizer_config.json
vllm tokenizer_config.json配置
qwen3模型部署教程
vllm工具调用解析
+2
2025-04-30
Qwen/Qwen3如何支持长的上下文
qwen3长上下文处理
qwen3-30b-a3b模型
长文本处理技术
+2
2025-04-30
Qwen/Qwen3-30B-A3B vllm部署和访问
qwen3-30b-a3b部署
vllm模型服务配置
docker模型部署教程
+2
2025-04-29
Qwen/Qwen3-32B vllm部署和访问
qwen3 32b 部署
vllm docker 部署教程
modelscope 模型下载
+2
2025-04-27
AMEX vivo UI agents 数据集介绍
amex数据集介绍
gui交互元素定位
gui功能描述生成
+2
2025-04-21
上传模型到huggingface
huggingface模型上传
git初始化教程
hf access token生成
+3
2025-04-19
【训练】InternVL2_8B full sft 多机多卡训练
internvl2_8b 多机多卡训练
多模态模型 finetune 教程
图像点到框检测训练
+2
2025-04-19
LLaMA-Factory 训练参数解读
llama factory 参数解析
image_max_pixels 图像处理
lora_rank 低秩适配
+2
2025-04-19
【训练】LLaMA-Factory InternVL3-8B 多机多卡训练
llama-factory 多机多卡训练
internvl3-8b 模型训练
多模态模型部署
+2
2025-04-18
InternVL 1技术深度分析
internvl 1技术解析
多模态模型架构
视觉语言融合技术
+2
2025-04-18
InternVL 3的技术深度分析,代码与原理
internvl 3 技术解析
variable visual position encoding
native multimodal pre-training
+2
2025-04-18
InternVL <box>
internvl box token
spatial layout projector
边界框表示方法
+2
2025-04-16
ValueError: Image features and image tokens do not match: tokens: 2305, features 2304
image token mismatch error
image features vs tokens
pytorch vision model error
+2
2025-04-11
CycleGAN 的原理与代码
cyclegan原理
cyclegan代码实现
生成对抗网络
+2
2025-04-11
Stable Diffusion:文本提示如何作用于Stable Diffusion的图像生成过程
stable diffusion文本提示原理
stable diffusion图像生成流程
clip文本编码器工作原理
+2
2025-04-11
Stable Diffusion:CFG Scale 是如何控制文生图的
stable diffusion cfg scale
文生图参数详解
classifier free guidance scale
+2
2025-04-11
Stable Diffusion:噪声采样的调度器的原理
stable diffusion噪声调度器
karras调度器原理
扩散模型采样器优化
+2
2025-04-11
Stable Diffusion:采样器的数学原理
stable diffusion采样器数学原理
stable diffusion去噪算法
stable diffusion euler采样器
+2
2025-04-11
Stable Diffusion:文生图的代码执行原理
stable diffusion 文本生成图像
文生图代码原理
stable diffusion 采样器解析
+2
2025-04-10
Stable Diffusion:使用ControlNet为黑白照片上色
stable diffusion黑白照片上色
controlnet recolor模型
图像修复历史照片
+2
2025-04-10
图像质量评估所使用的一些指标计算方法
图像质量评估指标计算
图像上色质量评估方法
ssim计算原理
+2
2025-04-07
【训练】Qwen 2.5 VL 图片转公式,微调实战教学
qwen2.5-vl 微调实战
图片转公式 latex
模型微调教学
+2
2025-03-25
LLaMA-Factory多机多卡训练Qwen2.5VL
llama factory多机多卡训练
qwen2.5 vl模型微调
多模态数据集构建
+2
2025-03-19
使用 device_map 优化 Transformers 模型的多 GPU 显存分配
device_map 多 gpu 显存分配
transformers 模型优化
hugging face 模型并行
+2
2025-03-19
vllm部署Qwen2.5-VL-7B-Instruct
vllm部署教程
qwen2.5-vl模型
docker启动vllm
+2
2025-03-19
vllm 部署QwQ-32B ,访问代码
vllm部署教程
qwq-32b模型部署
docker compose配置
+2
2025-03-18
AIGC降重提示词
aigc降重技巧
aigc提示词优化
降重ai写作风格
+3
2025-03-17
【训练】LLaMA-Factory多机多卡微调训练实战
llama-factory多机多卡训练
qwen2.5vl微调实战
docker镜像制作与训练
+2
2025-03-14
onnx gpu在docker里支持
onnx gpu docker部署
onnxruntime-gpu 安装配置
docker容器cuda支持
+2
2025-03-14
sdwebui docker打包
sdwebui docker部署
docker stable diffusion
pytorch cuda docker镜像
+2
2025-03-13
ControlNet Reference模型:reference_adain、reference_adain+attn与reference_only的区别与应用场景解析
controlnet reference模型对比
reference_adain应用场景
reference_adain+attn详解
+2
2025-03-12
【训练】LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct
llama-factory 微调
qwen2.5-vl 7b instruct 训练
lora 模型微调配置
+2
2025-03-11
Qwen2.5-VL 技术报告总结
qwen2.5-vl 技术报告
多模态大模型创新
视觉语言理解技术
+2
2025-03-06
使用mergekit合并大型语言模型
mergekit模型合并
slerp合并方法
ties模型合并
+3
2025-03-05
LiteLLM 做大模型API接口Proxy转发
litellm proxy 配置教程
大模型 api 接口转发
litellm 多模型管理
+2
2025-03-04
跑ZhipuAI/CogView4-6B的效果
zhipuai cogview4-6b 效果测试
深度学习模型 docker 部署
模型推理显存占用
+2
2025-02-24
阶跃星辰 Step-Vedio-T2V Docker 推理
step-video-t2v docker部署
step-video-t2v 推理教程
step-video-t2v 高性能视频生成
+2
2025-02-19
llama.cpp 跑 qwen2.5 量化模型
llama.cpp量化模型部署
qwen2.5模型优化
深度学习模型蒸馏
+2
2025-02-17
ktransformers 部署Deepseek-R1
ktransformers部署deepseek-r1
deepseek模型优化
llm本地部署教程
+2
2025-02-14
sglang 启动 Qwen2.5-32B-Instruct-GPTQ-Int4 API
sglang部署教程
qwen2.5 32b instruct api
docker启动大模型
+2
2025-02-14
sglang 启动 DeepSeek-R1-Distill-Qwen-32B API
sglang部署大模型
deepseek-r1-distill-qwen-32b教程
docker启动sglang
+2
2025-02-13
旋转位置编码(RoPE)的代码片段
rope实现代码
旋转位置编码数学原理
transformer位置编码优化
+2
2025-02-12
OpenWebUI使用DeepSeek R1满血版,DeepSeek R1 API调用
openwebui deepseek r1
deepseek r1 api调用
openai api 教程
+2
2025-02-11
FlashAttention 透彻理解
flashattention原理详解
transformer优化技术
attention机制优化
+2
2025-01-20
DDColor 效果实战教程
ddcolor 图像上色教程
深度学习模型部署
docker 部署教程
+2
2025-01-17
pix2pix pytorch 图片上色,模型训练实战,Docker【3】
pix2pix 图像上色
pytorch 模型训练
docker 环境配置
+2
2025-01-17
pix2pix mmgeneration 线稿上色,模型训练实战,Docker【2】
pix2pix 线稿上色
mmgeneration 模型训练
docker 部署深度学习
+2
2025-01-16
pix2pix mmgeneration通用场景黑白图片上色模型训练,Docker 【1】
pix2pix 黑白图片上色
docker 环境配置
mmgeneration 模型训练
+2
2024-12-18
文生图 排行榜
文生图排行榜
text to image benchmark
图像生成模型对比
+2
2024-12-14
Open WebUI + Ollama
open webui 部署教程
ollama 安装配置
docker 运行 open webui
+2
2024-12-14
OpenWebUI 使用 Azure OpenAI
azure openai 配置
openwebui 教程
openai proxy 接口
+2
2024-12-14
Azure OpenAI 转 openai proxy接口
azure openai 接口配置
openai proxy 设置
litellm azure 教程
+2
2024-12-10
部署siglip-so400m-patch14-384为API
siglip模型部署
fastapi图像特征提取
python图像处理api
+2
2024-11-30
flux diffuser 分卡切分运行
flux模型分卡运行
多gpu推理优化
transformer模型拆分
+2
2024-11-28
llama-factory 量化数据要求 c4_demo.json
llama-factory量化教程
c4_demo.json格式转换
alpaca转c4数据
+2
2024-11-28
量化方法的辨析-动态离线量化方法、静态离线量化方法和量化训练方法是什么区别?
动态离线量化方法
静态离线量化方法
量化训练方法
+3
2024-11-27
Milvus使用教程(五)总结
milvus使用教程
milvus集合创建
pymilvus接口调用
+2
2024-11-26
Dify流式请求示例
dify流式请求示例
python流式处理接口
fastapi流式返回
+2
2024-11-26
mini-omni2 语音对话模型 论文
mini-omni2 训练方法
多模态对话模型
语音中断机制
+2
2024-11-26
Moshi 论文解析
moshi论文解析
语音到语音模型
全双工对话技术
+2
2024-11-25
LLM的不同角色system、user
llm角色system和user
completion_to_prompt函数解析
messages_to_prompt格式化处理
+2
2024-11-25
Conan-embedding模型使用
conan-embedding模型
句子嵌入技术
深度学习模型应用
+2
2024-11-25
Conan-embedding模型论文解析
conan-embedding模型解析
动态困难负样本挖掘
跨gpu批次平衡损失
+2
2024-11-25
embedding模型排行榜
embedding模型排行榜
mteb基准测试
huggingface模型评估
+2
2024-11-21
TensorRT-LLM,Qwen2.5 加速量化部署
tensorrt-llm 部署
qwen2.5 模型量化
nvidia tensorrt 引擎构建
+2
2024-11-21
RoPE 旋转位置编码 解析
rope 旋转位置编码
transformer 位置编码原理
位置编码 高频低频分析
+2
2024-11-20
大模型量化方法解析:WO、AWQ、GPTQ 与 SQ 的对比
大模型量化技术对比
awq量化方法
gptq模型优化
+2
2024-11-20
开源LLM大模型排行榜
开源大模型评测
llm性能排行榜
opencompass评测平台
+2
2024-11-18
sglang 部署Qwen2VL7B,大模型部署,速度测试,深度学习
sglang部署qwen2vl7b
大模型速度测试
深度学习模型优化
+2
2024-11-14
seeAct 论文解析
seeact 论文解析
多模态网络代理
gpt-4v 视觉理解
+2
2024-11-13
ollama Docker部署qwen2.5:72b-instruct
ollama docker部署
qwen2.5 72b instruct
docker run命令
+2
2024-11-13
ollama Docker部署 Qwen2.5-Coder-32B-Instruct
ollama docker部署
qwen2.5-coder 32b
docker运行大模型
+2
2024-11-13
Dify,编排应用,随心所欲使用大模型
dify安装教程
docker compose部署
大模型编排技术
+2
2024-11-12
Ovis,多模态大模型微调
多模态大模型微调
ovis模型教程
gemma2 9b模型部署
+2
2024-11-11
pixart Docker部署推理
pixart docker部署
pixart 推理代码
pytorch docker环境配置
+2
2024-11-08
vllm 部署 Qwen/Qwen2.5 ,访问代码
vllm部署教程
qwen模型部署
docker运行vllm
+2
2024-11-07
vllm 部署 Qwen/Qwen2.5-Coder-7B-Instruct openai接口
vllm部署教程
qwen2.5-coder-7b-instruct部署
openai接口配置
+2
2024-11-04
Docker 官网vLLM镜像 快速部署 Qwen2.5
docker部署qwen2.5
vllm镜像使用教程
nvidia gpu加速docker
+2
2024-11-04
测试NanoFlow:比 vLLM 和 TensorRT-LLM 更快
nanoflow测试
vllm对比
tensorrt-llm优化
+2
2024-11-03
requests openai api 接口访问
requests调用openai api
python访问chat completions接口
openai api接口参数设置
+2
2024-11-01
数据准备详解:打造高质量的语言模型训练数据集
数据集配置
指令监督微调
alpaca格式数据
+2
2024-11-01
ChatGPT openai接口,图片对话程序
chatgpt图片识别
openai api使用教程
python图片对话程序
+2
2024-11-01
ChatGPT openai接口多轮对话程序
chatgpt多轮对话实现
openai接口调用教程
chatgpt python代码示例
+2
2024-10-26
构建最新的LLaMA-Factory镜像
llama-factory 镜像构建
docker 镜像更新
深度学习环境配置
+2
2024-10-21
相机里面的视觉算法(4)
相机视觉算法
图像超分辨率
人像美颜技术
+12
2024-10-21
相机里面的视觉算法(3)
相机成像系统详解
isp图像处理算法
raw域降噪与深度学习
+2
2024-10-21
相机里面的视觉算法(2)
isp流水线优化
图像信号处理算法
raw到rgb转换
+2
2024-10-21
相机里面的视觉算法(1)
相机视觉算法
光学镜头技术
自动对焦原理
+2
2024-10-21
安装vllm并部署Qwen2VL API
vllm部署教程
qwen2vl api配置
cuda12.1镜像构建
+2
2024-10-21
如何构建自己的vllm镜像,cuda12.1
vllm镜像构建
cuda12.1编译
docker自定义镜像
+2
2024-10-18
使用vllm部署Qwen2VL API
qwen2vl api部署
vllm docker部署
图像处理性能优化
+3
2024-10-16
自监督学习-基础知识分享
自监督学习基础
生成式自监督方法
对比学习算法
+2
2024-10-16
三元损失(triplet loss)
triplet loss原理
三元损失函数
人脸识别深度学习
+2
2024-10-14
Qwen2-VL API 快速部署服务教程
qwen2-vl api部署教程
transformers部署模型
fastapi图像识别服务
+2
2024-10-14
使用LLaMA-Factory微调sft Qwen2-VL-7B-Instruct
llama-factory 微调教程
qwen2-vl-7b 模型训练
图像文字信息提取json输出
+2
2024-10-14
A Cookbook of Self-Supervised Learning 中文翻译
self-supervised learning
ssl cookbook
self-supervised learning tutorial
+7
2024-10-13
词汇分割方法:WordPiece Model 和 Byte Pair Encoding 的详细解读
wordpiece model原理
byte pair encoding实现
nlp分词技术
+2
2024-10-13
Transformer的并行化提现在哪个地方?Decoder 端可以做并行化吗?
transformer并行化原理
decoder自回归限制
自注意力机制并行计算
+2
2024-10-13
Transformer中的前馈神经网络?使用了什么激活函数?相关优缺点?
transformer前馈网络结构
transformer激活函数relu
前馈神经网络优缺点
+2
2024-10-13
Transformer模型中的LayerNorm与BatchNorm:为什么选择LayerNorm?
transformer layernorm
batchnorm vs layernorm
transformer正则化方法
+2
2024-10-13
为什么在获取输入词向量之后需要对矩阵乘以embedding size的开方?
词向量缩放
embedding size开方
transformer模型优化
+2
2024-10-13
为什么在多头注意力中需要对每个 Head 进行降维?
多头注意力降维原理
transformer模型优化
注意力机制计算复杂度
+2
2024-10-13
如何在计算 Attention Score 时对 Padding 做 Mask 操作
attention mask 实现
transformer padding 处理
pytorch attention score mask
+2
2024-10-13
Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?
transformer attention机制
点乘与加法对比
attention计算复杂度
+2
2024-10-13
【深度学习】Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?
transformer架构
自注意力机制
q和k权重矩阵区别
+2
2024-10-13
【知识点】transformer为什么使用多头注意力机制?为什么不使用一个头
transformer多头注意力机制
多头注意力与单头注意力区别
transformer模型原理
+2
2024-10-12
如何理解多模态模型Qwen2-VL中的MIN_PIXELS和MAX_PIXELS
qwen2-vl 图像处理参数
min_pixels 作用解析
max_pixels 限制详解
+2
2024-10-11
使用LMDeploy部署InternVL2,速度测试
internvl2 部署教程
lmdeploy 多模态模型部署
docker 显存占用测试
+2
2024-10-10
【深度学习】Qwen2-VL API速度测试与部署
qwen2-vl api测试
深度学习模型部署
显存占用优化
+2
2024-10-09
【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4,容器即服务启动
llama-factory部署
qwen2-vl模型配置
docker容器部署教程
+2
2024-10-09
【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4
Qwen2-VL-72B-Instruct-GPTQ-Int4
2024-10-08
【深度学习】FLUX.1,文生图,推理部署实战教程
FLUX.1
2024-10-08
stable-diffusion-3-medium部署体验实战教学
stable-diffusion-3-medium部署教程
huggingface模型下载配置
pytorch环境搭建实战
+2
2024-10-01
fooocus-api,得到一些训练图片的过程
fooocus api使用
图像训练教程
ai绘画数据集
+2
2024-09-27
fooocus-api访问API得到图,Docker部署
fooocus api使用教程
docker部署文生图
文生图api接口调用
+2
2024-09-26
【深度学习】LLaMA-Factory部署Qwen2-VL
Qwen2-VL
2024-09-24
使用Python和Pydub调整音频音量
tts
2024-09-24
深度学习,TTS AB测试代码
AB测试
2024-09-20
【深度学习】语音TTS,微调训练 StableTTS V1.1
StableTTS
2024-09-20
【深度学习】语音TTS,微调训练 fishaudio / fish-speech-1.4
语音TTS
fishaudio
fish-speech-1.4
2024-09-19
【深度学习】强化学习介绍
强化学习基础
马尔可夫决策过程
深度强化学习算法
+2
2024-09-19
音频格式:OGG、RAW、WAV与AAC的区别
ogg音频格式
raw音频处理
wav文件特点
+2
2024-09-18
如何测试 ONNX Runtime 是否使用了 GPU 进行推理
测试onnxruntime-gpu
2024-09-18
Python使用 Gradio 实现多张图片上传WebUI
gradio
多张图片上传
2024-09-18
【深度学习】GOT-OCR2.0:一款端到端的 OCR 模型,镜像
GOT-OCR2.0
2024-09-14
使用Kubernetes(K8s)进行多机多卡分布式训练
K8s
多机多卡训练
2024-09-13
【深度学习】torch.distributed.launch、torchrun、accelerate 和 deepspeed 对比解析
deepspeed
accelerate
2024-09-13
多机多卡训练中的极速数据互联:NVLink、RDMA与NCCL配置详解
多机多卡训练
NVLink、RDMA与NCCL配置
2024-09-12
【深度学习】如何评估大语言模型(LLM)性能
大模型质量评估
2024-09-11
【深度学习】探索大模型训练中的关键标签:system、user、role、content、assistant、observation、function
大模型训练中的关键标签
2024-09-11
【深度学习】什么是PPO训练?
PPO
2024-09-11
【深度学习】LLaMA-Factory,Why is LoRA much slower than Freeze?
LLaMA-Factory
2024-09-10
【深度学习】使用ms-swift微调训练Qwen2-VL做印章识别
微调训练Qwen2-VL
2024-09-09
【深度学习】Python,印章数据集制作,印章制作
印章数据集
深度学习
印章制作
+1
2024-09-06
机器视觉的一些题目
机器视觉
题目
2024-09-04
【深度学习】LLaMA-Factory微调sft Qwen2-VL进行印章识别
微调
LLaMA-Factory
sft
+1
2024-09-04
【深度学习】如何安装xformer?flash-attn?
安装xformer
flash-attn
2024-09-04
【深度学习】Qwen2-VL最强开源OCR模型,手写字体识别、印章识别
深度学习
OCR
手写字体
+3
2024-09-04
【深度学习】Python,金融欺诈行为检测
金融欺诈
行为检测
深度学习
+1
2024-09-02
【深度学习】安全帽检测,目标检测,Faster RCNN训练
Faster RCNN训练
深度学习
2024-09-02
【深度学习】安全帽检测,目标检测,yolov10算法,yolov10训练
安全帽检测
目标检测
yolov10
2024-09-01
【推理框架】MNN框架 C++、Python、Java使用例子 Demo
python
java
mnn
2024-09-01
【深度学习】深度学习推理框架 TensorRT MNN OpenVINO ONNXRuntime
深度学习
mnn
2024-09-01
insightface 人脸识别模型训练 RecordIO数据格式
python
深度学习
ubuntu
2024-09-01
【深度学习】人脸聚类算法的评估指标程序,精准率、召回率、F1分数
深度学习
聚类
算法
2024-09-01
深度学习 人脸识别 优秀开源项目 state-of-the-art SOTA deepface 项目 使用过程 教程
深度学习人脸识别
deepface使用教程
人脸检测与对齐
+2
2024-09-01
【深度学习】表情识别A Dual-Direction Attention Mixed Feature Network for Facial Expression Recognition 训练
人工智能
深度学习
2024-09-01
【深度学习】miniCPM2.6,微调sft训练用于印章识别
深度学习,大模型,miniCPM,sft,微调,印章识别
2024-09-01
【深度学习】【语音TTS】GPT-SoVITS v2 实战,训练一个人的音色,Docker镜像
深度学习
gpt
tts
+1
2024-09-01
【知识点】决策树算法详解:ID3、C4.5 和 CART 的原理与实现
算法
决策树
机器学习
2024-09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常【3】
深度学习
机器学习
神经网络
2024-09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常
深度学习
机器学习
神经网络
2024-09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵
深度学习
NSL-KDD
入侵检测
+1
Dong
个人博客|深度学习|编程开发|嵌入电子|自动控制|算法深耕|
2256
日志
32
分类
5205
标签