
06048303: DEEP LEARNING FOR COMPUTER VISION
Description
หลักการพื้นฐานและการประยุกต์ใช้คอนโวลูชันนัล นิวรอล เน็ตเวิร์ค (CNN) ในคอมพิวเตอร์วิทัศน์ ครอบคลุมตั้งแต่สถาปัตยกรรมพื้นฐานไปจนถึงสถาปัตยกรรมที่ทันสมัย เช่น VGG, ResNet, EfficientNet และ ViT เนื้อหาประกอบด้วยโมเดลเชิงเส้น ฟังก์ชันแอคทิเวชัน ฟังก์ชันลอส การหาค่าที่ดีที่สุดด้วยวิธีการสุ่ม และสถาปัตยกรรม GAN (Generative Adversarial Network) สำหรับการสร้างภาพ รวมถึงการประยุกต์ใช้ CNN ในด้านการแยกแยะและการตรวจหาวัตถุ ซึ่งรวมถึงหัวข้อขั้นสูงอย่าง YOLO Pose Estimation สำหรับการวิเคราะห์ท่าทางของมนุษย์ และ SAM (Segment Anything) สำหรับการแบ่งส่วนภาพอย่างแม่นยำ นอกจากนี้ ยังมีการประยุกต์ใช้ประโยชน์จากโมเดลที่ผ่านการฝึกฝนล่วงหน้า (pre-trained models) และเครื่องมือจาก Hugging Face สำหรับงานคอมพิวเตอร์วิทัศน์หลากหลายประเภท
Fundamental principles and applications of Convolutional Neural Networks (CNNs) in computer vision are covered, ranging from basic to modern architectures such as VGG, ResNet, EfficientNet, and ViT. Content includes linear models, activation functions, loss functions, stochastic optimization methods, and Generative Adversarial Network (GAN) architectures for image generation. It also explores CNN applications in classification and object detection, encompassing advanced topics like YOLO Pose Estimation for human pose analysis and SAM (Segment Anything) for precise image segmentation. Additionally, the practical application of pre-trained models and tools from Hugging Face for diverse computer vision tasks is examined.
Credits
3 Credits (3-0-6)
Level
Graduate
This subject is part of the following programs