基于手势识别的 PPT 智能控制系统

毕业设计答辩 · 钟文清 · 深圳职业技术大学 · 2026年5月

研究背景与目标

人机交互从键盘鼠标发展到触摸、语音,手势交互是下一代自然交互方式。演讲场景中演示者受限于遥控器,无法在台上自由走动与观众互动。

本系统基于 MediaPipe + OpenCV + CustomTkinter 实现低延迟、高精度的实时手势识别,通过手势控制 PPT 翻页与放映。

6
种支持手势
21
个手部关键点
15
帧防抖缓冲
20ms
UI刷新间隔

支持手势一览

☝️
食指伸出
仅食指
✌️
剪刀手
食指 + 中指
🖐️
张开手掌
五根手指
👍
点赞手势
仅拇指
握拳
零根手指 · 死锁
👌
OK 手势
拇指 + 食指 · 解锁

技术架构

处理流程: 视频采集(OpenCV)关键点检测(MediaPipe 21点)手势识别(骨架分析)防抖缓冲(15帧投票)死锁保护(冷却时间)UI展示(CustomTkinter)

核心识别算法

手指状态分析

防抖平滑机制

死锁保护

系统架构

文件职责
main.py程序入口,启动 CustomTkinter 主循环
gesture_detector.py手势识别核心(MediaPipe)
ppt_controller.pyPPT 控制(PyAutoGUI 按键注入)
ctk_app.pyUI 界面(暗色仪表盘 + 手势图鉴双栏卡片)

技术栈

技术用途
MediaPipe 0.10手部检测 + 21点骨架提取
OpenCV 4.x摄像头采集 + 图像处理
PyAutoGUI模拟键盘按键(翻页/放映/退出)
CustomTkinter现代化暗色 GUI 框架
Threading多线程解耦:AI后台计算 + UI主线程20ms轮询

UI 设计亮点

测试结果与总结

系统优势

已知限制

未来展望

← 返回作品集