深度学习

238 文章 × 1117968 字
2025-10-31
推理能力(QwQ)、多模态交互(Omni)、架构创新(Next)
2025-10-29
一个接口同时支持 HTTP 和 Streamable HTTP:MCP 双协议实现深度解析
2025-10-28
如何调用MCP服务器获取信息?
2025-10-28
如何获取 MCP 工具的描述信息?
2025-10-27
部署mPLUG/GUI-Owl-32B
2025-10-24
uiautomator2的完整能力
2025-10-24
huggingface-cli 下载模型
2025-10-24
UI-TARS-72B-DPO vllm部署和请求
2025-10-24
一些MCP部署记录
2025-10-24
MCP 四种服务传输类型详解:STDIO、SSE、Streamable HTTP 与 InMemory
2025-10-23
Cursor如何支持ctrl+c?
2025-10-21
huggingface 续传模型
2025-10-21
在 Windows 系统上安装 Node.js
node.js安装windows系统长期支持版本+2
2025-10-21
小红书mcp运营
小红书mcp运营小红书内容发布mcp服务配置+2
2025-10-21
AI Agent 如何做好?
ai agent认知流程chatbot区别+2
2025-10-20
stable-diffusion-webui 写真
stable-diffusion-webui写真git clone+2
2025-10-18
FishAudioTTS 请求
fish audiotts apipython文本转语音fish audiotts请求示例+2
2025-10-17
【深度学习】【语音TTS】GPT-SoVITS v2 实战,训练一个人的音色,Docker镜像-2
gpt-sovits v4实战docker部署gpt-sovits语音合成tts教程+2
2025-10-17
vllm 部署 Meta-Llama-3-70B-Instruct-abliterated-v3.5
vllm部署Meta-Llama-3-70B-Instruct大模型部署+2
2025-10-15
大模型安全研究1-abliteration
大模型安全研究模型正交化模型微调+2
2025-10-15
显卡性能测试方法vllm吞吐量测试延迟测试
显卡性能测试vllm吞吐量测试延迟测试+2
2025-10-14
sudo pkill -9 -f launcher.py
linux命令pkill命令sudo pkill+2
2025-10-14
llamafactory-cli train 快速训练测试
llamafactory-cliQwen2.5-3B-Instruct模型训练alpaca_en_demo数据集+2
2025-10-14
gguf这种文件如何启动为openai式的接口?
gguf文件启动llama-cpp-python服务器OpenAI接口替代+2
2025-09-26
大模型的涌现能力
大模型的涌现能力大型语言模型人工智能发展+5
2025-09-26
神经语言模型缩放定律:核心观点解读
神经语言模型缩放定律模型性能幂律关系+16
2025-09-25
72B蒸馏到3B,在3B上再微调?
蒸馏模型通用模型专用模型+2
2025-09-25
大型语言模型尚无法实现推理自纠错!CoT为什么提升准确率?
chain of thought思维链大型语言模型+2
2025-09-25
基于大模型的外卖词槽提取完整方案
意图识别词槽提取大模型+2
2025-09-25
vivo BlueLM-2.5-3B
vivo bluelm-2.5-3b多模态大语言模型边缘设备部署+2
2025-09-24
超长上下文的大模型训练
超长上下文大模型训练注意力机制优化状态空间模型+2
2025-09-24
美团LongCat-Flash-Thinking
longcat-flash-thinking美团longcat混合专家模型+2
2025-09-05
做agent的坑的记录
agent开发数据不一致训练数据问题+1
2025-08-15
AgentCPM-GUI
强化学习数据格式gui自动化强化学习训练+2
2025-08-13
transformer加普通token
transformerstokenizerhuggingface+2
2025-08-05
占用显卡显存代码
占用显存gpu监控pytorch显存管理+2
2025-08-03
claude web 转 openai api 接口
claude apiclaude web interfaceopenai api integration+2
2025-08-02
ms-swift 多机多卡训练
ms-swift多机多卡训练分布式深度学习多GPU训练+2
2025-08-02
LLama-Factory数据预处理
llama-factory数据预处理qwen2vl模型预处理数据加载与转换+8
2025-08-01
BLEU和ROUGE评估指标详解
bleu评估指标详解rouge评估指标详解自然语言生成质量评估+2
2025-08-01
NCCL 官方文档手册位置
nccl官方文档手册nvidia deep learning ncclnccl docs+2
2025-08-01
LLaMA-Factory 多机多卡训练配置
llm多机多卡训练配置llama-factory配置教程多机多卡训练优化+2
2025-07-19
Linux系统支持中文字符处理
linux中文字符处理linux安装中文字体linux配置中文语言环境+2
2025-07-18
rlaunch vllm Qwen2.5-VL-7B-Instruct
qwen2.5-vl-7b-instructvllm api图像分析+2
2025-07-16
阶跃星辰 stepfun api
stepfun apiopenaichat completion+2
2025-07-16
new_special_tokens
huggingface tokenizerspecial tokens参数配置+2
2025-07-16
如何向 Transformers 模型词表中添加新 token
transformers模型词表新token+2
2025-07-16
tokenizer_config.json
tokenizer_config.jsonHuggingFace Transformers特殊token添加+2
2025-07-14
LLaMA-Factory EXTRAS
llama-factoryextras参数dockerfile+2
2025-07-11
LLaMA-Factory AWS S3 文件读写
llamma-factoryaws s3boto3+2
2025-06-03
【知识点】5种Agent模式
agent模式反思模式工具使用模式+2
2025-06-03
【深度学习】Fooocus Outpaint 原理
fooocus outpaint原理画布扩展与遮罩创建内容感知填充+2
2025-06-03
【知识点】​​匈牙利算法的计算过程示例
匈牙利算法示例最佳分配问题外卖配送优化+2
2025-06-02
【知识点】OpenPose姿态检测
openpose姿态检测输入输出形状vgg网络结构+2
2025-06-02
【知识点】CDP人脸聚类,共识驱动传播人脸聚类方法
cdp人脸聚类共识驱动传播无标签聚类方法+2
2025-06-02
InsightFace人脸检测方法分析
insightface人脸检测retinaface算法scrfd优化+2
2025-06-02
【知识点】U-Net/HRNet 区别
u-net结构hrnet特征融合编码器解码器+2
2025-06-02
【知识点】Mask R-CNN
mask r cnn 损失函数mask r cnn 实例分割mask r cnn 原理+2
2025-05-30
AstrBot NapCat 消息机器人实战教程教学
astrbot napcat 部署教程qq机器人 大模型接入docker 部署 astrbot+2
2025-05-30
sglang 部署 Qwen/Qwen3-32B
sglang部署教程qwen3-32b模型部署docker模型服务配置+2
2025-05-28
sglang 部署Qwen/Qwen2.5-VL-7B-Instruct
sglang部署qwen2-vlqwen2-vl模板配置多模态模型部署+2
2025-05-27
【知识点】YOLO编年史,YOLO全系列解析
yolo v1 v2 v3 v4 v5yolo 模型演进yolo 检测原理+2
2025-05-27
【知识点】GAN的常用的损失函数有哪些 ?
gan损失函数比较生成对抗网络训练技巧wasserstein gan原理+2
2025-05-27
【知识点】SVM支持向量机,松弛变量,核技巧
svm分类器原理支持向量机优化目标松弛变量软间隔+4
2025-05-20
【知识点】VLLM 自动前缀缓存,推理加速
vllm自动前缀缓存推理加速优化llm性能优化+2
2025-05-19
【知识点】强化学习关键术语
强化学习术语强化学习状态动作奖励q函数与v函数+2
2025-05-19
RoPE 旋转位置编码详解与计算示例
rope 旋转位置编码transformer 位置编码位置编码计算示例+2
2025-05-16
【知识点】深度学习面试题汇总(持续更新)
深度学习面试题汇总梯度消失与梯度爆炸过拟合解决方案+2
2025-05-13
【训练】Qwen2.5VL 多机多卡 Grounding Box定位(2)
qwen2.5-vl训练grounding box定位多机多卡训练+2
2025-05-13
【知识点】Transformer中计算最复杂的模块是什么
transformer自注意力机制transformer时间复杂度transformer计算瓶颈+2
2025-05-13
【知识点】训练模型时遇到out of memory怎么解决
深度学习内存优化模型训练out of memory解决梯度累积技巧+2
2025-05-13
【知识点】训练过程出现NaN如何解决
深度学习训练nan问题模型loss变为nan解决方法梯度爆炸处理+2
2025-05-12
【知识点】DPO、PPO reference 模型和 actor 模型是否可以为同一个模型
dpo与ppo对比dpo reference模型actor模型训练+2
2025-05-12
【知识点】PPO、DPO、KTO
ppo算法原理dpo强化学习kto训练方法+2
2025-05-12
【知识点】DPO强化学习
dpo算法详解强化学习替代方案语言模型对齐技术+4
2025-05-12
【知识点】PPO强化学习
ppo算法原理ppo-clip实现强化学习算法+2
2025-05-12
【知识点】sft如何避免灾难性遗忘
sft灾难性遗忘弹性权重整合ewc渐进神经网络+7
2025-05-12
【知识点】为何进行Query改写,Query改写的核心价值
query改写核心价值信息残缺问题处理语义模糊优化+3
2025-05-12
【知识点】微调模型 VS RAG,为何选RAG?
rag技术优势微调模型对比大模型幻觉问题+2
2025-05-09
【损失函数】InfoNCE损失,多模态模型的对比学习代码
infonceloss多模态对比学习对比学习代码实现+2
2025-05-09
【知识点】m-RoPE(多模态旋转位置编码)
m-rope多模态旋转位置编码三维位置编码技术视觉与文本多模态处理+2
2025-05-09
如何给transformers库打Python补丁
transformers库补丁python库修改技巧docker环境调试+2
2025-05-08
【代码解读】LLama-Factory SharegptDatasetConverter
llama factory 数据集转换器sharegpt 数据格式处理多模态对话数据处理+2
2025-05-07
【API】将SigClip部署为API
siglip api部署图像特征提取fastapi图像服务+2
2025-05-07
【训练】Qwen2.5VL 多机多卡 Grounding Box定位(1)
qwen2.5vl grounding box定位多机多卡训练配置绝对坐标处理方法+2
2025-04-30
vLLM 如何使用配置 tokenizer_config.json
vllm tokenizer_config.json配置qwen3模型部署教程vllm工具调用解析+2
2025-04-30
Qwen/Qwen3如何支持长的上下文
qwen3长上下文处理qwen3-30b-a3b模型长文本处理技术+2
2025-04-30
Qwen/Qwen3-30B-A3B vllm部署和访问
qwen3-30b-a3b部署vllm模型服务配置docker模型部署教程+2
2025-04-29
Qwen/Qwen3-32B vllm部署和访问
qwen3 32b 部署vllm docker 部署教程modelscope 模型下载+2
2025-04-27
AMEX vivo UI agents 数据集介绍
amex数据集介绍gui交互元素定位gui功能描述生成+2
2025-04-21
上传模型到huggingface
huggingface模型上传git初始化教程hf access token生成+3
2025-04-19
【训练】InternVL2_8B full sft 多机多卡训练
internvl2_8b 多机多卡训练多模态模型 finetune 教程图像点到框检测训练+2
2025-04-19
LLaMA-Factory 训练参数解读
llama factory 参数解析image_max_pixels 图像处理lora_rank 低秩适配+2
2025-04-19
【训练】LLaMA-Factory InternVL3-8B 多机多卡训练
llama-factory 多机多卡训练internvl3-8b 模型训练多模态模型部署+2
2025-04-18
InternVL 1技术深度分析
internvl 1技术解析多模态模型架构视觉语言融合技术+2
2025-04-18
InternVL 3的技术深度分析,代码与原理
internvl 3 技术解析variable visual position encodingnative multimodal pre-training+2
2025-04-18
InternVL <box>
internvl box tokenspatial layout projector边界框表示方法+2
2025-04-16
ValueError: Image features and image tokens do not match: tokens: 2305, features 2304
image token mismatch errorimage features vs tokenspytorch vision model error+2
2025-04-11
CycleGAN 的原理与代码
cyclegan原理cyclegan代码实现生成对抗网络+2
2025-04-11
Stable Diffusion:文本提示如何作用于Stable Diffusion的图像生成过程
stable diffusion文本提示原理stable diffusion图像生成流程clip文本编码器工作原理+2
2025-04-11
Stable Diffusion:CFG Scale 是如何控制文生图的
stable diffusion cfg scale文生图参数详解classifier free guidance scale+2
2025-04-11
Stable Diffusion:噪声采样的调度器的原理
stable diffusion噪声调度器karras调度器原理扩散模型采样器优化+2
2025-04-11
Stable Diffusion:采样器的数学原理
stable diffusion采样器数学原理stable diffusion去噪算法stable diffusion euler采样器+2
2025-04-11
Stable Diffusion:文生图的代码执行原理
stable diffusion 文本生成图像文生图代码原理stable diffusion 采样器解析+2
2025-04-10
Stable Diffusion:使用ControlNet为黑白照片上色
stable diffusion黑白照片上色controlnet recolor模型图像修复历史照片+2
2025-04-10
图像质量评估所使用的一些指标计算方法
图像质量评估指标计算图像上色质量评估方法ssim计算原理+2
2025-04-07
【训练】Qwen 2.5 VL 图片转公式,微调实战教学
qwen2.5-vl 微调实战图片转公式 latex模型微调教学+2
2025-03-25
LLaMA-Factory多机多卡训练Qwen2.5VL
llama factory多机多卡训练qwen2.5 vl模型微调多模态数据集构建+2
2025-03-19
使用 device_map 优化 Transformers 模型的多 GPU 显存分配
device_map 多 gpu 显存分配transformers 模型优化hugging face 模型并行+2
2025-03-19
vllm部署Qwen2.5-VL-7B-Instruct
vllm部署教程qwen2.5-vl模型docker启动vllm+2
2025-03-19
vllm 部署QwQ-32B ,访问代码
vllm部署教程qwq-32b模型部署docker compose配置+2
2025-03-18
AIGC降重提示词
aigc降重技巧aigc提示词优化降重ai写作风格+3
2025-03-17
【训练】LLaMA-Factory多机多卡微调训练实战
llama-factory多机多卡训练qwen2.5vl微调实战docker镜像制作与训练+2
2025-03-14
onnx gpu在docker里支持
onnx gpu docker部署onnxruntime-gpu 安装配置docker容器cuda支持+2
2025-03-14
sdwebui docker打包
sdwebui docker部署docker stable diffusionpytorch cuda docker镜像+2
2025-03-13
ControlNet Reference模型:reference_adain、reference_adain+attn与reference_only的区别与应用场景解析
controlnet reference模型对比reference_adain应用场景reference_adain+attn详解+2
2025-03-12
【训练】LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct
llama-factory 微调qwen2.5-vl 7b instruct 训练lora 模型微调配置+2
2025-03-11
Qwen2.5-VL 技术报告总结
qwen2.5-vl 技术报告多模态大模型创新视觉语言理解技术+2
2025-03-06
使用mergekit合并大型语言模型
mergekit模型合并slerp合并方法ties模型合并+3
2025-03-05
LiteLLM 做大模型API接口Proxy转发
litellm proxy 配置教程大模型 api 接口转发litellm 多模型管理+2
2025-03-04
跑ZhipuAI/CogView4-6B的效果
zhipuai cogview4-6b 效果测试深度学习模型 docker 部署模型推理显存占用+2
2025-02-24
阶跃星辰 Step-Vedio-T2V Docker 推理
step-video-t2v docker部署step-video-t2v 推理教程step-video-t2v 高性能视频生成+2
2025-02-19
llama.cpp 跑 qwen2.5 量化模型
llama.cpp量化模型部署qwen2.5模型优化深度学习模型蒸馏+2
2025-02-17
ktransformers 部署Deepseek-R1
ktransformers部署deepseek-r1deepseek模型优化llm本地部署教程+2
2025-02-14
sglang 启动 Qwen2.5-32B-Instruct-GPTQ-Int4 API
sglang部署教程qwen2.5 32b instruct apidocker启动大模型+2
2025-02-14
sglang 启动 DeepSeek-R1-Distill-Qwen-32B API
sglang部署大模型deepseek-r1-distill-qwen-32b教程docker启动sglang+2
2025-02-13
旋转位置编码(RoPE)的代码片段
rope实现代码旋转位置编码数学原理transformer位置编码优化+2
2025-02-12
OpenWebUI使用DeepSeek R1满血版,DeepSeek R1 API调用
openwebui deepseek r1deepseek r1 api调用openai api 教程+2
2025-02-11
FlashAttention 透彻理解
flashattention原理详解transformer优化技术attention机制优化+2
2025-01-20
DDColor 效果实战教程
ddcolor 图像上色教程深度学习模型部署docker 部署教程+2
2025-01-17
pix2pix pytorch 图片上色,模型训练实战,Docker【3】
pix2pix 图像上色pytorch 模型训练docker 环境配置+2
2025-01-17
pix2pix mmgeneration 线稿上色,模型训练实战,Docker【2】
pix2pix 线稿上色mmgeneration 模型训练docker 部署深度学习+2
2025-01-16
pix2pix mmgeneration通用场景黑白图片上色模型训练,Docker 【1】
pix2pix 黑白图片上色docker 环境配置mmgeneration 模型训练+2
2024-12-18
文生图 排行榜
文生图排行榜text to image benchmark图像生成模型对比+2
2024-12-14
Open WebUI + Ollama
open webui 部署教程ollama 安装配置docker 运行 open webui+2
2024-12-14
OpenWebUI 使用 Azure OpenAI
azure openai 配置openwebui 教程openai proxy 接口+2
2024-12-14
Azure OpenAI 转 openai proxy接口
azure openai 接口配置openai proxy 设置litellm azure 教程+2
2024-12-10
部署siglip-so400m-patch14-384为API
siglip模型部署fastapi图像特征提取python图像处理api+2
2024-11-30
flux diffuser 分卡切分运行
flux模型分卡运行多gpu推理优化transformer模型拆分+2
2024-11-28
llama-factory 量化数据要求 c4_demo.json
llama-factory量化教程c4_demo.json格式转换alpaca转c4数据+2
2024-11-28
量化方法的辨析-动态离线量化方法、静态离线量化方法和量化训练方法是什么区别?
动态离线量化方法静态离线量化方法量化训练方法+3
2024-11-27
Milvus使用教程(五)总结
milvus使用教程milvus集合创建pymilvus接口调用+2
2024-11-26
Dify流式请求示例
dify流式请求示例python流式处理接口fastapi流式返回+2
2024-11-26
mini-omni2 语音对话模型 论文
mini-omni2 训练方法多模态对话模型语音中断机制+2
2024-11-26
Moshi 论文解析
moshi论文解析语音到语音模型全双工对话技术+2
2024-11-25
LLM的不同角色system、user
llm角色system和usercompletion_to_prompt函数解析messages_to_prompt格式化处理+2
2024-11-25
Conan-embedding模型使用
conan-embedding模型句子嵌入技术深度学习模型应用+2
2024-11-25
Conan-embedding模型论文解析
conan-embedding模型解析动态困难负样本挖掘跨gpu批次平衡损失+2
2024-11-25
embedding模型排行榜
embedding模型排行榜mteb基准测试huggingface模型评估+2
2024-11-21
TensorRT-LLM,Qwen2.5 加速量化部署
tensorrt-llm 部署qwen2.5 模型量化nvidia tensorrt 引擎构建+2
2024-11-21
RoPE 旋转位置编码 解析
rope 旋转位置编码transformer 位置编码原理位置编码 高频低频分析+2
2024-11-20
大模型量化方法解析:WO、AWQ、GPTQ 与 SQ 的对比
大模型量化技术对比awq量化方法gptq模型优化+2
2024-11-20
开源LLM大模型排行榜
开源大模型评测llm性能排行榜opencompass评测平台+2
2024-11-18
sglang 部署Qwen2VL7B,大模型部署,速度测试,深度学习
sglang部署qwen2vl7b大模型速度测试深度学习模型优化+2
2024-11-14
seeAct 论文解析
seeact 论文解析多模态网络代理gpt-4v 视觉理解+2
2024-11-13
ollama Docker部署qwen2.5:72b-instruct
ollama docker部署qwen2.5 72b instructdocker run命令+2
2024-11-13
ollama Docker部署 Qwen2.5-Coder-32B-Instruct
ollama docker部署qwen2.5-coder 32bdocker运行大模型+2
2024-11-13
Dify,编排应用,随心所欲使用大模型
dify安装教程docker compose部署大模型编排技术+2
2024-11-12
Ovis,多模态大模型微调
多模态大模型微调ovis模型教程gemma2 9b模型部署+2
2024-11-11
pixart Docker部署推理
pixart docker部署pixart 推理代码pytorch docker环境配置+2
2024-11-08
vllm 部署 Qwen/Qwen2.5 ,访问代码
vllm部署教程qwen模型部署docker运行vllm+2
2024-11-07
vllm 部署 Qwen/Qwen2.5-Coder-7B-Instruct openai接口
vllm部署教程qwen2.5-coder-7b-instruct部署openai接口配置+2
2024-11-04
Docker 官网vLLM镜像 快速部署 Qwen2.5
docker部署qwen2.5vllm镜像使用教程nvidia gpu加速docker+2
2024-11-04
测试NanoFlow:比 vLLM 和 TensorRT-LLM 更快
nanoflow测试vllm对比tensorrt-llm优化+2
2024-11-03
requests openai api 接口访问
requests调用openai apipython访问chat completions接口openai api接口参数设置+2
2024-11-01
数据准备详解:打造高质量的语言模型训练数据集
数据集配置指令监督微调alpaca格式数据+2
2024-11-01
ChatGPT openai接口,图片对话程序
chatgpt图片识别openai api使用教程python图片对话程序+2
2024-11-01
ChatGPT openai接口多轮对话程序
chatgpt多轮对话实现openai接口调用教程chatgpt python代码示例+2
2024-10-26
构建最新的LLaMA-Factory镜像
llama-factory 镜像构建docker 镜像更新深度学习环境配置+2
2024-10-21
相机里面的视觉算法(4)
相机视觉算法图像超分辨率人像美颜技术+12
2024-10-21
相机里面的视觉算法(3)
相机成像系统详解isp图像处理算法raw域降噪与深度学习+2
2024-10-21
相机里面的视觉算法(2)
isp流水线优化图像信号处理算法raw到rgb转换+2
2024-10-21
相机里面的视觉算法(1)
相机视觉算法光学镜头技术自动对焦原理+2
2024-10-21
安装vllm并部署Qwen2VL API
vllm部署教程qwen2vl api配置cuda12.1镜像构建+2
2024-10-21
如何构建自己的vllm镜像,cuda12.1
vllm镜像构建cuda12.1编译docker自定义镜像+2
2024-10-18
使用vllm部署Qwen2VL API
qwen2vl api部署vllm docker部署图像处理性能优化+3
2024-10-16
自监督学习-基础知识分享
自监督学习基础生成式自监督方法对比学习算法+2
2024-10-16
三元损失(triplet loss)
triplet loss原理三元损失函数人脸识别深度学习+2
2024-10-14
Qwen2-VL API 快速部署服务教程
qwen2-vl api部署教程transformers部署模型fastapi图像识别服务+2
2024-10-14
使用LLaMA-Factory微调sft Qwen2-VL-7B-Instruct
llama-factory 微调教程qwen2-vl-7b 模型训练图像文字信息提取json输出+2
2024-10-14
A Cookbook of Self-Supervised Learning 中文翻译
self-supervised learningssl cookbookself-supervised learning tutorial+7
2024-10-13
词汇分割方法:WordPiece Model 和 Byte Pair Encoding 的详细解读
wordpiece model原理byte pair encoding实现nlp分词技术+2
2024-10-13
Transformer的并行化提现在哪个地方?Decoder 端可以做并行化吗?
transformer并行化原理decoder自回归限制自注意力机制并行计算+2
2024-10-13
Transformer中的前馈神经网络?使用了什么激活函数?相关优缺点?
transformer前馈网络结构transformer激活函数relu前馈神经网络优缺点+2
2024-10-13
Transformer模型中的LayerNorm与BatchNorm:为什么选择LayerNorm?
transformer layernormbatchnorm vs layernormtransformer正则化方法+2
2024-10-13
为什么在获取输入词向量之后需要对矩阵乘以embedding size的开方?
词向量缩放embedding size开方transformer模型优化+2
2024-10-13
为什么在多头注意力中需要对每个 Head 进行降维?
多头注意力降维原理transformer模型优化注意力机制计算复杂度+2
2024-10-13
如何在计算 Attention Score 时对 Padding 做 Mask 操作
attention mask 实现transformer padding 处理pytorch attention score mask+2
2024-10-13
Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?
transformer attention机制点乘与加法对比attention计算复杂度+2
2024-10-13
【深度学习】Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?
transformer架构自注意力机制q和k权重矩阵区别+2
2024-10-13
【知识点】transformer为什么使用多头注意力机制?为什么不使用一个头
transformer多头注意力机制多头注意力与单头注意力区别transformer模型原理+2
2024-10-12
如何理解多模态模型Qwen2-VL中的MIN_PIXELS和MAX_PIXELS
qwen2-vl 图像处理参数min_pixels 作用解析max_pixels 限制详解+2
2024-10-11
使用LMDeploy部署InternVL2,速度测试
internvl2 部署教程lmdeploy 多模态模型部署docker 显存占用测试+2
2024-10-10
【深度学习】Qwen2-VL API速度测试与部署
qwen2-vl api测试深度学习模型部署显存占用优化+2
2024-10-09
【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4,容器即服务启动
llama-factory部署qwen2-vl模型配置docker容器部署教程+2
2024-10-09
【深度学习】LLaMA-Factory部署Qwen2-VL-72B-Instruct-GPTQ-Int4
Qwen2-VL-72B-Instruct-GPTQ-Int4
2024-10-08
【深度学习】FLUX.1,文生图,推理部署实战教程
FLUX.1
2024-10-08
stable-diffusion-3-medium部署体验实战教学
stable-diffusion-3-medium部署教程huggingface模型下载配置pytorch环境搭建实战+2
2024-10-01
fooocus-api,得到一些训练图片的过程
fooocus api使用图像训练教程ai绘画数据集+2
2024-09-27
fooocus-api访问API得到图,Docker部署
fooocus api使用教程docker部署文生图文生图api接口调用+2
2024-09-26
【深度学习】LLaMA-Factory部署Qwen2-VL
Qwen2-VL
2024-09-24
使用Python和Pydub调整音频音量
tts
2024-09-24
深度学习,TTS AB测试代码
AB测试
2024-09-20
【深度学习】语音TTS,微调训练 StableTTS V1.1
StableTTS
2024-09-20
【深度学习】语音TTS,微调训练 fishaudio / fish-speech-1.4
语音TTSfishaudiofish-speech-1.4
2024-09-19
【深度学习】强化学习介绍
强化学习基础马尔可夫决策过程深度强化学习算法+2
2024-09-19
音频格式:OGG、RAW、WAV与AAC的区别
ogg音频格式raw音频处理wav文件特点+2
2024-09-18
如何测试 ONNX Runtime 是否使用了 GPU 进行推理
测试onnxruntime-gpu
2024-09-18
Python使用 Gradio 实现多张图片上传WebUI
gradio多张图片上传
2024-09-18
【深度学习】GOT-OCR2.0:一款端到端的 OCR 模型,镜像
GOT-OCR2.0
2024-09-14
使用Kubernetes(K8s)进行多机多卡分布式训练
K8s多机多卡训练
2024-09-13
【深度学习】torch.distributed.launch、torchrun、accelerate 和 deepspeed 对比解析
deepspeedaccelerate
2024-09-13
多机多卡训练中的极速数据互联:NVLink、RDMA与NCCL配置详解
多机多卡训练NVLink、RDMA与NCCL配置
2024-09-12
【深度学习】如何评估大语言模型(LLM)性能
大模型质量评估
2024-09-11
【深度学习】探索大模型训练中的关键标签:system、user、role、content、assistant、observation、function
大模型训练中的关键标签
2024-09-11
【深度学习】什么是PPO训练?
PPO
2024-09-11
【深度学习】LLaMA-Factory,Why is LoRA much slower than Freeze?
LLaMA-Factory
2024-09-10
【深度学习】使用ms-swift微调训练Qwen2-VL做印章识别
微调训练Qwen2-VL
2024-09-09
【深度学习】Python,印章数据集制作,印章制作
印章数据集深度学习印章制作+1
2024-09-06
机器视觉的一些题目
机器视觉题目
2024-09-04
【深度学习】LLaMA-Factory微调sft Qwen2-VL进行印章识别
微调LLaMA-Factorysft+1
2024-09-04
【深度学习】如何安装xformer?flash-attn?
安装xformerflash-attn
2024-09-04
【深度学习】Qwen2-VL最强开源OCR模型,手写字体识别、印章识别
深度学习OCR手写字体+3
2024-09-04
【深度学习】Python,金融欺诈行为检测
金融欺诈行为检测深度学习+1
2024-09-02
【深度学习】安全帽检测,目标检测,Faster RCNN训练
Faster RCNN训练深度学习
2024-09-02
【深度学习】安全帽检测,目标检测,yolov10算法,yolov10训练
安全帽检测目标检测yolov10
2024-09-01
【推理框架】MNN框架 C++、Python、Java使用例子 Demo
pythonjavamnn
2024-09-01
【深度学习】深度学习推理框架 TensorRT MNN OpenVINO ONNXRuntime
深度学习mnn
2024-09-01
insightface 人脸识别模型训练 RecordIO数据格式
python深度学习ubuntu
2024-09-01
【深度学习】人脸聚类算法的评估指标程序,精准率、召回率、F1分数
深度学习聚类算法
2024-09-01
深度学习 人脸识别 优秀开源项目 state-of-the-art SOTA deepface 项目 使用过程 教程
深度学习人脸识别deepface使用教程人脸检测与对齐+2
2024-09-01
【深度学习】表情识别A Dual-Direction Attention Mixed Feature Network for Facial Expression Recognition 训练
人工智能深度学习
2024-09-01
【深度学习】miniCPM2.6,微调sft训练用于印章识别
深度学习,大模型,miniCPM,sft,微调,印章识别
2024-09-01
【深度学习】【语音TTS】GPT-SoVITS v2 实战,训练一个人的音色,Docker镜像
深度学习gpttts+1
2024-09-01
【知识点】决策树算法详解:ID3、C4.5 和 CART 的原理与实现
算法决策树机器学习
2024-09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常【3】
深度学习机器学习神经网络
2024-09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵,网络攻击,流量异常
深度学习机器学习神经网络
2024-09-01
【深度学习】【机器学习】用神经网络进行入侵检测,NSL-KDD数据集,基于机器学习(深度学习)判断网络入侵
深度学习NSL-KDD入侵检测+1