Abstract:
งานวิจัยนี้นำเสนอการรู้จำการแสดงอารมณ์ออกทาง ใบหน้าด้วยวิธีโครงข่ายประสาทเทียมแบบคอนโวลูชั่นร่วมกับ การประมวลผลภาพ 18 รูปแบบ เริ่มจากการนำชุดข้อมูล ภาพถ่ายใบหน้า Fer2013 มาจำแนกออกเป็น 3 ประเภท อารมณ์ ได้แก่ อารมณ์เชิงลบ อารมณ์ปกติ และอารมณ์ เชิงบวก ชุดข้อมูลภาพถูกแบ่งเป็นชุดสำหรับฝึกสอน และ ชุดสำหรับทดสอบ โดยชุดข้อมูลภาพดังกล่าวได้ผ่านวิธีการประมวลผลภาพเบื้องต้น 18 รูปแบบ ได้แก่ Original, Alignment, Crop20-80,Crop30-70, Crop40-60, Crop50-50, Crop60-40, Crop70-30, Crop80-20, Original with Flip, Alignment with Flip, Crop20-80 with Flip, Crop30-70 with Flip, Crop40-60-with Flip, Crop50-50 with Flip, Crop60-40 with Flip, Crop70-30 with Flip และ Crop80-20 with Flip จากนั้นนำชุดข้อมูลภาพทั้งหมดมาสร้างเป็นแบบจำลองโครงข่ายประสาทเทียมแบบคอนโวลูชั่นจำนวน 8 แบบจำลอง ได้แก่แบบจำลอง 3CNNs, Mememoji- CNNs, DenseNet121, DenseNet169, DenseNet 201, InceptionResNetV2, MobileNet, และ MobileNetV2 รวมการเปรียบเทียบแบบจำลองกับชุดข้อมูลภาพจำนวนทั้งสิ้น 144 แบบจำลองผลลัพธ์จากการเปรียบเทียบค่าความถูกต้องของแบบจำลองพบว่าแบบจำลอง 3CNNs ที่ถูกสร้างขึ้นด้วยชุดข้อมูลภาพ Alignment with Flip มีค่าความถูกต้องสูงที่สุดอยู่ที่ ร้อยละ 82.41 ซึ่งเหมาะสมกับการนำไปปรับใช้สำหรับการเรียนการสอนแบบออนไลน์""
Abstract:
This paper proposes the design of a Facial Expression Recognition using convolutional neural network based on 18 variations of image processing adapted for the FER2013 Challenge dataset. The dataset is divided into three emotions: negative emotion, neutral emotion, and positive emotion. The network is trained for classification using the training subset and tested using the testing subset. The dataset is divided into 18 variations of image processing: Original, Alignment, Crop20-80, Crop30-70, Crop40-60, Crop50-50, Crop60-40, Crop-70-30, Crop80-20, Original with Flip, Alignment with Flip, Crop20-80 with Flip, Crop30-70 with Flip, Crop-40-60 with Flip, Crop50-50 with Flip, Crop60-40 with Flip, Crop70-30 with Flip, and Crop80-20 with Flip. Eight convolutional neural network models applied to this experiment are as follows: 3CNNs, Mememoji CNNs, DenseNet121, Dense-Net169, DenseNet 201, InceptionResNetV2, MobileNet, and MobileNet-V2. The model is compared with datasets of 144 models. The proposed model, 3CNNs on the alignment with Flip dataset, yields highest accuracy at 82.41 percent. It is suitable for online learning.""