الرؤية الحاسوبية

التعرف على الأفعال

Action Recognition

التعريف

يصنف التعرف على الأفعال ما يفعله الشخص عبر مقطع فيديو قصير — المشي والتسلق والرفع والسقوط والقتال. تستخدم البنى الحديثة شبكات CNN ثلاثية الأبعاد (X3D، SlowFast)، أو محولات الفيديو (VideoMAE، MViT)، أو نماذج تيار الوضعية (ST-GCN، PoseConv3D). بالنسبة لإف آي تك، يدعم التعرف على الأفعال كشف الانزلاق والتعثر والسقوط، وتنبيهات القتال أو العدوان في مناطق إقامة العمال، وكشف المهام غير المصرح بها (العمل الساخن دون تصريح، دخول الخزان دون مراقب). تجمع أفضل النتائج بين تيار RGB وتيار الوضعية — يتعامل الهيكل العظمي مع الحركة، ويتعامل RGB مع السياق مثل النار أو إطار الأماكن المضيقة.

→ العودة إلى المصطلحات

التعريف

مصطلحات ذات صلة

حيث يلتقي الذكاء الاصطناعي بالعالم الحقيقي