2025-08-21

Linux设置NPC开机自启动（systemd方法）

关键步骤

创建服务文件：

bash
展开代码
sudo nano /etc/systemd/system/npc.service

阅读全文

UI-Venus Technical Report

2025-08-18

DL论文

https://arxiv.org/pdf/2508.10833

GRPO公式：

阅读全文

Cursor 调试C++代码

2025-08-18

CPP

安装插件

C/C++

CMake

CMake Tools

阅读全文

ROS C++编程 msg srv

2025-08-16

ROS

js
展开代码
docker run \
-e QT_X11_NO_MITSHM=1 \
-e DISPLAY \
-v ~/.Xauthority:/root/.Xauthority:rw \
-v ~/tmp/.X11-unix:/tmp/.X11-unix:ro \
--net host \
--gpus all \
-v ~/out_home:/out_home \
-v /data/xiedong/xd_ws:/xd_ws \
-it kevinchina/deeplearning:ros-noetic-cuda11.4.2-v5 bash

阅读全文

AgentCPM-GUI

2025-08-15

深度学习

🎯 强化学习数据格式总览

1. 原始JSONL数据格式

训练数据存储在JSONL文件中，每行是一个JSON对象，包含以下关键字段：

json
展开代码
{
  "image": {
    "<image_00>": "/path/to/step_0.png",
    "<image_01>": "/path/to/step_1.png"
  },
  "conversations": [
    {
      "role": "system",
      "content": "系统提示词..."
    },
    {
      "role": "user", 
      "content": "<Question>用户问题</Question>\n当前屏幕截图：<image_00>"
    },
    {
      "role": "assistant",
      "content": "{\"POINT\":[723,536],\"to\":\"up\"}"
    }
  ],
  "bbox": [[x1,y1,x2,y2], ...],  // 可选：边界框信息
  "bbox2": [...],                 // 可选：第二个边界框
  "id": 0
}

阅读全文

ROS 编写简单的服务和客户端（C++）

2025-08-15

ROS

在beginner_tutorials包中创建src/add_two_ints_server.cpp文件并粘贴以下内容进去：

bash
展开代码
#include "ros/ros.h"
#include "beginner_tutorials/AddTwoInts.h"

bool add(beginner_tutorials::AddTwoInts::Request  &req,
         beginner_tutorials::AddTwoInts::Response &res)
{
  res.sum = req.a + req.b;
  ROS_INFO("request: x=%ld, y=%ld", (long int)req.a, (long int)req.b);
  ROS_INFO("sending back response: [%ld]", (long int)res.sum);
  return true;
}

int main(int argc, char **argv)
{
  ros::init(argc, argv, "add_two_ints_server");
  ros::NodeHandle n;

  ros::ServiceServer service = n.advertiseService("add_two_ints", add);
  ROS_INFO("Ready to add two ints.");
  ros::spin();

  return 0;
}

阅读全文

ROS 编写简单的发布者和订阅者（C++）

2025-08-15

ROS

https://wiki.ros.org/cn/ROS/Tutorials/WritingPubli

阅读全文

论文 AgentCPM-GUI

2025-08-15

DL论文

https://github.com/OpenBMB/AgentCPM-GUI/blob/main/README_zh.md

AgentCPM-GUI是由清华大学THUNLP实验室、中国人民大学与面壁智能团队联合开发的开源端侧智能体大模型，基于MiniCPM-V构建，总参数量8B，接受手机屏幕图像作为输入，自动执行用户提出的任务。AgentCPM-GUI的主要特性包括：

高质量GUI Grounding：通过在大规模中英文Android数据集上进行预训练，有效提升了对常见GUI控件（如按钮、输入框、标签、图标等）的定位与理解能力；
中文APP操作能力：首个针对中文APP精细优化的开源GUI Agent，覆盖高德地图、大众点评、哔哩哔哩、小红书等30余个主流中文APP；
增强的规划推理能力：通过强化微调技术（RFT），让模型输出动作前进行推理思考，有效提升复杂任务执行的成功率；
紧凑的动作空间设计：采用优化的动作空间和紧凑的JSON格式，平均动作长度压缩至9.7个token，提升端侧推理的效率。

阅读全文

LLaMA-Factory neat_packing

2025-08-14

LLaMA-Factory

使用neat_packing进行sft训练，模型性能指标下降明显 #5426

Benchmark performance gap between packing or not #30

https://github.com/MeetKai/functionary/tree/main/functionary/train/packing

阅读全文

LLaMA-Factory 合并cache

2025-08-14

LLaMA-Factory

LLaMA-Factory使用HuggingFace的datasets库来管理数据。

1. 核心数据存储库

python
展开代码
from datasets import Dataset, DatasetDict, load_from_disk, save_to_disk

阅读全文