赵 航

机器人开发工程师

"知不足而奋进, 望远山而前行。"

持续学习 无限进步

关于我

赵航

一名充满热情并热爱探索的机器人开发工程师,现居北京。

拥有持续4年的机器人开发经验,我专注于运用 C++/Python、ROS 和 Qt 构建高效可靠的机器人应用。 研究生毕业后进入国家级研究所从事软件开发工作,负责的核心软件模块实现了交付军方零故障记录,这锻炼了我严谨的工程素养。

技术专长
  • 多模态交互系统设计 (VLM, STT, TTS)
  • 端侧AI大模型部署 (Qwen2.5-VL, LLava, DeepSeek)
  • ROS机器人开发 (Node, Topic, Services, Action, 分布式通信)
  • 高级机器人仿真 (Nvidia Isaac Sim, Gazebo)
  • 多传感器融合SLAM和障碍物检测

持续追踪LLM Agent与具身智能等前沿动态,致力于在机器人领域不断学习与创造价值。

技术栈

编程语言

  • C++ (熟练)
  • Python (熟练)
  • QML (熟练)
  • Java (Android软件开发入门)

开发框架

  • ROS (熟练)
  • Qt (熟练)
  • MoveIt (熟练)

AI工具链

  • ChatGPT
  • Gemini 2.5
  • Grok3
  • DeepSeek:r1

仿真工具

  • Isaac Sim (熟练)
  • Gazebo (熟练)
  • Rviz (熟练)
  • SolidWorks (熟练)

系统工程

  • 传感器标定
  • URDF/Xacro建模
  • 网络通信 (Socket)
  • 串口通信

其他工具

  • Git / GitHub
  • Linux (Ubuntu)
  • VS Code / Qt Creator
  • Android Studio

教育经历

求学之路

  • 北京科技大学

    机械工程硕士

    2020.09 - 2023.06

  • 西安建筑科技大学

    机械工程学士

    2015.09 - 2019.06

学术与荣誉

  • 多传感器融合环境感知
  • 智能机器人系统开发
  • SLAM与障碍物检测

  • 发表国际期刊论文2篇:
    • Obstacle detection for intelligent robots based on the fusion of 2D lidar and depth camera. Intl Journal of Hydromechatronics Scopus/Web of Science-ESCI
    • Research and implementation of intelligent robot SLAM based on fusion of 2D LiDAR and depth camera. Intl Journal of Intelligent Machines and Robotics Google Scholar
  • 获多功能康复车实用新型专利2项

优秀共青团员、优秀共青团干部、2020年度校研会“优秀个人”、机械工程学院研究生会主席团成员、第十五届研究生代表大会机械学院研究生代表、优秀(三好)毕业生

证书展示 (校内)

一种多功能康复车 预览

专利:一种多功能康复车

一种辅助手脚康复锻炼的座椅 预览

专利:一种辅助手脚康复锻炼的座椅

优秀共青团员 预览

荣誉:优秀共青团员

优秀研究生干部 预览

荣誉:优秀共青团干部

2020年度校研会“优秀个人” 预览

荣誉:校研会“优秀个人”

研会主席团成员聘书 预览

聘书:学院研会主席团成员

优秀(三好)毕业生 预览

荣誉:优秀(三好)毕业生

工作经验

中国电子科技集团第三研究所 事业编

软件设计工程师 | 2023.07 - 至今

核心项目

水下无人探障潜航器 (UUV) Qt/C++全栈开发 (2024.04 - 至今)

负责UUV地面操控软件与潜航器端主控软件的研发。已获得比测第一名进入研制阶段。

数字集成影音系统 Android开发 (2023.07 - 2024.03)

负责核心Android软件研发,成功交付374套设备,负责模块零反馈问题。

获得荣誉与证书
最佳新员工 缩略图 最佳新员工 (2023)
优秀师徒 缩略图 优秀师徒 (2023-24)
重大任务保障奖 缩略图 重大任务保障奖

澳特拉斯(北京)科技有限公司 - 机器人事业部

软件开发工程师 (实习) | 2022.07 - 2022.10

项目:骨科手术机器人

参与全膝置换术(TKA)骨科手术机器人的研发。

获得荣誉与证书
优秀实习生 缩略图 优秀实习生

项目经历

个人独立开发项目

本地部署AI多模态机器人系统

时间:2024.03

项目简介

从零到一设计并实现机器人大脑系统,实现多模态视觉 (LLaVA, Qwen2.5-VL) 与语音 (STT/TTS) 模型在本地PC的高效运行与深度集成。该系统使机器人能够在完全离线的情况下,完成复杂的视觉环境理解、自然语言交互及动作指令生成与执行,达成端到端AI调用流程秒级响应。 B站 7000+播放 & 1600+互动

主要工作与技术实现
  • 本地AI大模型部署与集成:
    • 在本地PC部署LLaVA/Qwen2.5-VL视觉大模型(VLM),集成STT/TTS模型语音引擎(sherpa-onnx),实现机器人的“看”、“听”、“说”。
  • ROS系统设计与开发:
    • 搭建机器人端与PC端分布式通信架构。
    • 开发ROS节点处理音频/图像数据流,参照模型API调用示例,设计实现图像数据到VLM的输入以及处理结果的获取。
  • 核心交互逻辑与控制流:
    • 设计创建自定义ROS Service,将STT识别的文本作为Prompt,结合VLM对图像的分析,生成包含场景描述和机器人动作指令 (如前进、后退、转向) 的JSON格式化结果。
  • 语音反馈生成与传输:
    • 解析VLM返回的JSON数据,提取场景描述文本,调用本地TTS模型将描述文本转换为音频,将生成的音频编码并通过ROS Topic发送回机器人端。
    • 在机器人端实现订阅、解码并通过扬声器播放接收到的音频。
  • 动作指令执行:
    • 设计创建自定义ROS Action,将VLM返回的机器人动作指令发送至Action Server进行处理。
    • 利用Action机制管理异步任务执行,确保机器人完成当前动作后,VLM再进行下一步的感知与决策。
关键技能与收获
  • AI大模型本地化部署及API使用
  • 精进ROS相关Nodes, Topics, Services, Actions
  • 机器人感知与交互系统设计(视觉、语音)
  • 系统集成与调试
  • 独立项目设计/开发与问题解决能力
项目图片

基于Isaac Sim的机器人遥操作仿真

时间:2024.03

项目简介

主导设计并独立实现基于Isaac Sim的仿真平台,成功构建Xbox手柄对阿克曼转向机器人及Franka机械臂的实时、精确控制链路,实现了轮式机器人流畅转向与多自由度机械臂末端精细操控(模拟抓取/放置)。

主要工作与技术实现
  • 仿真环境搭建与机器人建模 (Isaac Sim & URDF):
    • 使用SolidWorks设计阿克曼机器人模型,并通过sw_urdf_exporter插件导出为URDF格式,在URDF模型中添加了悬架结构以实现前轮转向。
    • 将URDF模型导入 Isaac Sim 场景 (Stage),精细配置了环境物理属性。
  • ROS 集成与仿真控制 (Isaac Sim OmniGraph & ROS Bridge):
    • 利用Isaac Sim内置的OmniGraph可视化编程工具,为机器人(底盘和机械臂)创建控制逻辑图。
    • 配置并使用了Isaac Sim的 ROS1 Bridge 功能,使仿真环境能够订阅ROS网络中的控制指令话题 (AckermannDriveStamped, JointState) 来驱动机器人关节运动。
  • 阿克曼转向移动机器人遥操作 (ROS & Ackermann Control):
    • 编写 ROS 节点 (C++) 订阅Xbox手柄的 /joy 话题,实时获取摇杆和按键状态。
    • 将手柄输入映射为标准的 AckermannDriveStamped 消息,并通过Topic发布,从而控制Isaac Sim中阿克曼底盘的线速度和转向角。
  • 机械臂遥操作与运动学控制 (ROS, MoveIt & IK):
    • 使用 MoveIt Setup Assistant 基于Franka机械臂的URDF模型,快速生成了运动规划和控制所需的moveit_config功能包。
    • 编写 ROS节点 (C++),将手柄输入转换为机械臂末端执行器 (End-Effector) 在笛卡尔空间下的目标速度 (Twist 消息)。
    • 集成MoveIt (MoveGroupInterface) 库,利用其运动学求解器进行逆运动学 (IK) 计算,将笛卡尔空间的目标速度实时解算为各关节的目标状态 (JointState 消息)。
    • 将计算得到的 JointState 消息通过 ROS Topic 发布,驱动Isaac Sim中的Franka机械臂关节运动,实现精确的末端遥操作。
关键技能与收获
  • NVIDIA Isaac Sim
  • OmniGraph
  • URDF Import
  • ROS Bridge
  • MoveIt
  • 机器人建模
  • 独立项目设计实施与调试能力
项目图片

校内科研项目

基于激光雷达与视觉融合的智能机器人环境感知研究

时间:2020.09 - 2023.04

项目简介

针对移动机器人自主导航需求,开发了一种基于2D激光雷达与RGB-D深度相机的高效多传感器融合SLAM及障碍物检测方法,旨在为机器人提供鲁棒且经济高效的环境理解能力,以支持其自主导航等任务。

主要工作与技术实现
  • 机器人平台设计与搭建:
    • 基于阿克曼底盘运动模型,设计机器人整体方案,并选型、集成关键传感器,包括2D激光雷达和RGB-D深度相机,搭建了用于研究和实验的实体机器人平台。
    • 使用SolidWorks完成机器人三维装配体设计,并导出为URDF模型,以供接下来进行仿真模拟。
  • 改进RTAB-map SLAM算法:
    • 在ROS框架下,将RGB-D点云投影为二维激光扫描,通过tf发布的相机到激光雷达坐标转化关系,将RGB-D点云二维投影转换到2D激光雷达坐标系平面,实现与LiDAR数据的无缝集成。
    • 使用ekf_localization_node节点,利用扩展卡尔曼滤波器(EKF)融合IMU和里程计数据,输出/odom和/base_link坐标系之间的变换,以及提供鲁棒且高精度的滤波里程计。
    • 将RGB-D深度相机与2D激光雷达融合后的点云数据和EKF节点提供的里程计信息,传入RTAB-Map算法节点,生成融合后的二维栅格地图以及三维点云地图,以供执行导航任务。
  • 仿真实验与实车部署:
    • 利用Gazebo构建仿真环境并通过Rviz可视化验证改进RTAB-Map算法的有效性,成功进行仿真建图实验
    • 在实体机器人平台上,完成深度相机的内参标定、激光雷达与深度相机的外参标定以及传感器间的时间同步,为传感器数据精确融合奠定基础。
    • 将改进融合算法移植部署至实体机器人,经过实际环境场景的检验,验证了融合建图方案的精度与鲁棒性显著提升,成功实现Sim2Real。
  • 融合感知与障碍物检测/跟踪:
    • 基于obstacle_detector功能包进行深度改进开发,采用基于密度的聚类方法对2D激光雷达与深度相机点云数据进行分组,并创建障碍物的几何表示,显著增强障碍物检测能力。
    • 集成了卡尔曼滤波对检测到的障碍物进行动态状态(位置、速度、加速度)估计和跟踪。
    • 融合后对障碍物的位置检测相比于单传感器检测,在X和Y方向的绝对误差降低了约60%。
主要研究成果 (发表论文)
  • Obstacle detection for intelligent robots based on the fusion of 2D lidar and depth camera[J]. International Journal of Hydromechatronics. Scopus/Web of Science-ESCI
  • Research and implementation of intelligent robot SLAM based on fusion of 2D LiDAR and depth camera[J]. International Journal of Intelligent Machines and Robotics. Google Scholar
关键技能与收获
  • C++/Python (ROS 开发)
  • Gazebo/Rviz仿真
  • 多传感器融合
  • SLAM (RTAB-Map)
  • 障碍物检测与跟踪
  • 相机内参/外参标定
  • 机器人建模(URDF/Xacro/SolidWorks)
项目图片

实习项目

骨科手术机器人

时间:2022.07 - 2022.10 (实习 @ 澳特拉斯(北京)科技有限公司 )

项目简介

参与全膝置换术(TKA)骨科手术机器人的研发 获“优秀实习生”

主要工作与技术实现
  • 机器人系统标定:
    • 负责UR5机械臂与NDI光学定位装置之间的手-眼标定(Hand-Eye Calibration)。应用机器人运动学原理,求解机械臂基坐标系到NDI跟踪器坐标系的转换矩阵。
  • 实时目标追踪与控制:
    • 编写算法计算工具中心点 (TCP)与目标点间的实时相对位姿偏差,通过Socket通信将解算的目标位姿发送给机械臂控制器,驱动机械臂进行高精度、实时的跟随运动。
    • 实现了UR5机械臂末端工具对目标点(模拟患者部位)的连续、闭环追踪功能。
  • 术前配准算法实现:
    • 负责术前配准模块的关键算法开发。深入研究并掌握了迭代最近点 (Iterative Closest Point, ICP) 算法原理。
    • 编写点云配准程序,成功实现了NDI采集的物理点集与三维医学影像点集之间的粗配准与精配准,准确计算出两者间的坐标系转换关系,应用于机械臂三维医学图像间的坐标转换。
  • 语音控制系统开发:
    • 基于SpeechBox语音识别引擎,使用 C++ 开发了机器人的远程语音控制系统。实现了语音指令的解析与机器人运动控制的联动,支持通过语音命令启停机器人,并进行前进、后退、左右、上下等方向的毫米级精度移动控制。
关键技能与收获
  • C++软件开发
  • 机械臂手眼标定
  • 机械臂运动控制
  • 坐标变换
  • 机器人运动学
  • 语音控制开发
项目图片

工作项目

水下无人探障潜航器(UUV)

时间:2024.04 - 至今 (中国电科三所)

项目简介

深度参与无人探障航潜航器 (UUV) 软件系统的核心研发,包括地面操控软件和潜航器主控软件,旨在实现潜航器的远程操控、状态监控、任务规划、自主航行及中小协同作业能力。 已获得比测第一名顺利进入研制阶段

主要工作与技术实现
  • Qt/C++/QML 全栈,UUV 操控软件界面与交互开发:
    • 运用QML深度定制并开发了现代化、高交互性的前端UUV操控界面。采用C++工厂模式模块化开发后端包括包括实时数据显示(首页)、多维度状态监控(系统、能源、动力、自检)、复杂参数设置(平台、载荷、电源)、任务规划与可视化(轨迹下发、障碍物列表)等核心模块,显著提升了操作员对潜航器状态的感知和操控效率。
    • 熟练掌握QML与C++高效交互机制(含信号槽高级应用),实现了前端复杂界面逻辑与后端实时数据(传感器、状态、控制指令)的无缝、低延迟对接。
    • 针对UUV控制界面的特点,设计并封装了可复用的QML组件(如状态指示器、控制按钮组),提高了代码复用率和界面开发效率。
  • 深入理解UUV控制与作业流程,负责核心功能实现:
    • 实时数据链路与处理: 负责建立和维护基于TCP/UDP和WebSocket的通信链路,高效接收、解析、处理来自UUV的多源异构数据流(导航、声呐、状态、图像),并成功解决数据传输与解析中的关键技术挑战。
    • UUV 状态监控与管理: 实现对潜航器导航信息(惯导、位姿)、能源系统、动力系统、任务执行状态等复杂状态的精确计算、管理与可视化。
    • 运动控制与载荷管理: 开发了对UUV的运动控制逻辑(定深定向、姿态调整等)以及对关键载荷(如前视/侧扫声呐)的参数配置与上下电控制逻辑。
    • 自主与协同能力: 主导了UUV自主航行(基于经纬度轨迹规划与任务装订)、中小协同探障(中型探测与小型抵近侦察)以及自主避障等高级功能的算法对接与逻辑实现。
    • 协助将UUV运行过程中的关键数据(状态、指令、探测目标、规划轨迹)高效、结构化地存入数据库。
关键技能与收获
  • Qt (熟练)
  • QML (熟练)
  • C++ (熟练)
  • 无人潜航器 (UUV) / 无人系统软件开发
  • 嵌入式软件交互
  • TCP/IP, WebSocket
  • 通信协议设计
  • 自主控制逻辑
  • 多智能体协同
  • UI界面设计
项目图片

数字集成影音系统

时间:2023.07 - 2024.03 (中国电科三所)

项目简介

深度参与为某军方陆军政治工作部宣传局研制的数字集成影音系统项目,负责核心 Android 软件的研发工作。 已成功将374套设备交付到各个省份地区的营级单位,我负责的相关软件模块无任何反馈问题。

主要工作与技术实现
  • Android 应用开发与硬件通信:
    • 使用Java和Android Studio独立开发和优化了关键的Android应用,主要包括数字调音台和调频广播软件。
  • 数字调音台软件:
    • 成功建立并维护了Android应用与物理调音台硬件板卡之间基于TCP Socket的双向通信链路,实现了控制指令的下发与调音台硬件状态的实时反馈。
    • 负责前端界面 (UI) 和后端控制逻辑的完整开发,涵盖输入/输出管理、信号路由分配、音频效果控制、场景切换等专业调音台复杂功能。
    • 为精细化参数调整(如噪声门、压限器、参量均衡器)设计并实现了图表化交互控制界面,将用户交互直观地映射为底层硬件参数配置。
    • 使用嵌套Dialog实现了悬浮式快捷控制面板,提升了操作便捷性。
  • 调频广播:
    • 实现了Android应用通过串口通信与FM硬件模块板卡的可靠连接与数据交换。
    • 开发了调频广播的控制界面和功能逻辑,包括频率调节、播放/暂停控制、自动/手动频道搜索、频道存储/查询以及收藏列表管理。
关键技能与收获
  • Android应用开发 (Java, Android Studio)
  • 硬件接口与控制经验
  • 掌握网络通信(UDP Socket)与串口通信(Serial/UART)
  • UI设计
  • 软件控制逻辑设计与实现
  • 嵌入式系统软件交互

联系我

期待与您的交流,可以通过以下方式联系我。

电话 / 微信

17300121726

(微信同号)