แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th ติดต่อเจ้าหน้าที่เจ้าของเอกสาร กรณีเอกสารไม่ครบหรือไม่ตรง

การพัฒนาแบบจำลองเรียนรู้แบบลึกเชิงพื้นที่และเวลาสำหรับการจดจำคำพูดด้วยภาพ
Development of Spatio-temporal deep learning model for visual speech recognition

keyword: Convolutional Neural Networks.
ThaSH: การเรียนรู้เชิงลึก (การเรียนรู้ของเครื่อง)
; Recurrent Neural Network.
ThaSH: การรู้จำใบหน้ามนุษย์ (วิทยาการคอมพิวเตอร์)
; Attention Mechanisms.
ThaSH: การรู้จำภาพ
ThaSH: การประมวลผลภาพ
ThaSH: การอ่านริมฝีปาก -- การจำลองระบบ
Abstract: การอ่านริมฝีปาก (lipreading) มุ่งเน้นการพัฒนาแบบจำลองที่มีประสิทธิภาพในการถอดรหัสคำพูดจากภาพการเคลื่อนไหวของริมฝีปาก ถึงแม้จะมีความก้าวหน้าอย่างต่อเนื่อง แต่ยังคงมีความท้าทายที่สำคัญ 2 ประการ คือ 1) ความซับซ้อนของแบบจำลอง (Model Complexity) แบบจำลองที่ซับซ้อนมักถูกสร้างขึ้นโดยมีจุดมุ่งหมายเพื่อเพิ่มความแม่นยำในการอ่านริมฝีปาก แต่ก็มีข้อเสียคือต้องใช้ทรัพยากรในการประมวลผลสูง ทำให้ไม่เหมาะสำหรับการใช้งานใน อุปกรณ์พกพาหรือระบบที่มีข้อจำกัดด้านทรัพยากร 2) ความคล้ายคลึงในการขยับริมฝีปาก (Lip movement homophones) คำหลายคำมีการออกเสียงที่ใกล้เคียงกัน ทำให้ริมฝีปากขยับในลักษณะที่คล้ายคลึงกันมาก ตัวอย่างเช่น คำว่า "million" และ "millions" ซึ่งแบบจำลองต้องพยายามแยกแยะความแตกต่างจากข้อมูลภาพเพียงอย่างเดียว เพื่อแก้ไขปัญหาเหล่านี้ งานวิจัยนี้จึงมุ่งเน้นไปที่การพัฒนาแบบจำลองที่ไม่ซับซ้อนแต่ยังคงมีความแม่นยำสูงและสามารถแยกแยะความแตกต่างของการเคลื่อนไหวริมฝีปากที่มีความคล้ายคลึงกันได้โดยใช้เทคนิคการเรียนรู้เชิงลึกแบบผสมผสานประกอบ CNN, RNN และ Attention เพื่อให้การอ่านริมฝีปากมีความสามารถนำไปใช้ทำงานได้ในสถานการณ์จริงและมีประสิทธิภาพมากยิ่งขึ้น
Abstract: Lipreading focuses on developing efficient models to decode spoken words from the motion of the lips. Despite continuous advancements, there remain two significant challenges: Model Complexity and Lip Movement Homophones. Complex models are often designed with the aim of increasing lipreading accuracy; however, this complexity comes at the cost of high computational resource requirements, rendering them unsuitable for use in portable devices or resource-constrained systems. Additionally, many words exhibit similar pronunciations, leading to lip movements that closely resemble one another; for instance, the words "million" and "millions" demonstrate such similarities, necessitating that models discern differences based solely on visual data. To address these issues, this research focuses on developing a streamlined yet highly accurate model capable of distinguishing between lip movements that closely resemble one another. This is achieved through the use of a hybrid deep learning approach that integrates Convolutional Neural Networks (CNN), Recurrent Neural Networks (RNN), and Attention mechanisms, with the aim of enhancing the applicability and efficiency of lipreading in real-world scenarios.
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ. สำนักหอสมุดกลาง
Address: กรุงเทพมหานคร
Email: library@kmutnb.ac.th
Role: ที่ปรึกษาวิทยานิพนธ์
Email : luepol.p@sci.kmutnb.ac.th
Created: 2567
Modified: 2568-12-01
Issued: 2568-12-01
วิทยานิพนธ์/Thesis
application/pdf
tha
©copyrights มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
RightsAccess:
ลำดับที่.ชื่อแฟ้มข้อมูล ขนาดแฟ้มข้อมูลจำนวนเข้าถึง วัน-เวลาเข้าถึงล่าสุด
1 B17723383.pdf 3.48 MB
ใช้เวลา
0.02537 วินาที

ธีรพงศ์ งามพร้อมวงษ์
Title Contributor Type
การพัฒนาแบบจำลองเรียนรู้แบบลึกเชิงพื้นที่และเวลาสำหรับการจดจำคำพูดด้วยภาพ
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ธีรพงศ์ งามพร้อมวงษ์
ลือพล พิพานเมฆาภรณ์
วิทยานิพนธ์/Thesis
ลือพล พิพานเมฆาภรณ์
Title Creator Type and Date Create
การออกแบบชุดรหัสคำแบบกระชับสำหรับอีซีโอซี
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
มงคล เอียดอ้น
วิทยานิพนธ์/Thesis
การทำเหมืองข้อมูลของเส้นวิถีการโคจรจากข้อมูลระบบวีเอ็มเอสเพื่อระบุประเภทเครื่องมือทำการประมงโดยอัตโนมัติ
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
สาธร พรสุพิกุล
วิทยานิพนธ์/Thesis
การสร้างแบบจำลองโปรไฟล์ผู้ใช้ซึ่งมาจากหัวเรื่องสำหรับการแนะนำสถานที่เฉพาะบุคคล
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
พัสกร คันธาอาภา
วิทยานิพนธ์/Thesis
การตรวจจับพฤติกรรมความรุนแรงในวิดีโอ โดยใช้โครงข่ายประสาทเทียมเชิงลึก
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
เอกนรินทร์ ดิษฐ์สันเทียะ
วิทยานิพนธ์/Thesis
การเรียนรู้เชิงลึกสำหรับการติดต่อกันโดยตรงระหว่างสมองกับคอมพิวเตอร์
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
ปิยะวัฒน์ แสงเพชร
วิทยานิพนธ์/Thesis
การพัฒนาแบบจำลองเรียนรู้แบบลึกเชิงพื้นที่และเวลาสำหรับการจดจำคำพูดด้วยภาพ
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
ธีรพงศ์ งามพร้อมวงษ์
วิทยานิพนธ์/Thesis
การลบภาพวัตถุสำหรับระบบจัดทำแผนที่ชนิดเคลื่อนที่โดยใช้โครงข่ายเจเนอเรทีฟแอดเวอเซอเรียล
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ลือพล พิพานเมฆาภรณ์
อาซีซ่าร์ ลอดิง
วิทยานิพนธ์/Thesis
Copyright 2000 - 2026 ThaiLIS Digital Collection Working Group. All rights reserved.
ThaiLIS is Thailand Library Integrated System
สนับสนุนโดย สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม
328 ถ.ศรีอยุธยา แขวง ทุ่งพญาไท เขต ราชเทวี กรุงเทพ 10400 โทร. โทร. 02-232-4000
กำลัง ออน์ไลน์
ภายในเครือข่าย ThaiLIS จำนวน 4
ภายนอกเครือข่าย ThaiLIS จำนวน 1,609
รวม 1,613 คน

More info..
นอก ThaiLIS = 138,851 ครั้ง
มหาวิทยาลัยสังกัดทบวงเดิม = 792 ครั้ง
มหาวิทยาลัยราชภัฏ = 441 ครั้ง
มหาวิทยาลัยเอกชน = 64 ครั้ง
มหาวิทยาลัยเทคโนโลยีราชมงคล = 26 ครั้ง
หน่วยงานอื่น = 13 ครั้ง
สถาบันพระบรมราชชนก = 3 ครั้ง
มหาวิทยาลัยสงฆ์ = 1 ครั้ง
มหาวิทยาลัยการกีฬาแห่งชาติ = 1 ครั้ง
รวม 140,192 ครั้ง
Database server :
Version 2.5 Last update 1-06-2018
Power By SUSE PHP MySQL IndexData Mambo Bootstrap
มีปัญหาในการใช้งานติดต่อผ่านระบบ UniNetHelp


Server : 8.199.134
Client : Not ThaiLIS Member
From IP : 216.73.217.174