Abstract:
วิทยานิพนธ์นี้นำเสนอวิธีการจำลองการเข้ารหัสสัญญาณเสียงพูดโดยใช้ซอฟแวร์ MATLAB ในการเขียนโปรแกรมเพื่อพัฒนาการเข้ารหัสเสียงพูดโดยวิธีการ Linear Predictive Coding (LPC) จุดประสงค์ของการศึกษาเพื่อสร้างและวิเคราะห์สัญญาณเสียงพูด โดยสภาพของเสียงที่ได้จะมีความใกล้เคียงเสียงต้นกำเนิดมากที่สุด โปรแกรมที่สร้างขึ้นจะเลือกค่าพารามิเตอร์ LPC ที่ดีที่สุดและปัจจัยที่มีผลต่ออัตราบีบย่อและคุณภาพเสียงในการบีบย่อเสียงพูดโดยวิธีที่เสนอในวิทยานิพนธ์นี้ได้แก่ ออร์เดอร์ของ LPC ขนาดของ codebook และค่า threshold ที่ใช้ในการพิจารณาตัดองค์ประกอบของสัญญาณที่มีความสำคัญน้อยโดยพิจารณาเลือกออร์เดอร์ที่ดีที่สุด เทคนิคของวิธีการ LPC นี้จะนำไปสู่การประยุกต์ใช้ในงานสื่อสารต่าง ๆ อาทิ ระบบโทรศัพท์มือถือ มัลติมิเดีย ระบบฝากข้อความและการบีบอัดเสียงบนโครงข่ายอินเตอร์เน็ตจากการทดลองโปรแกรมพบว่าเสียงที่ได้จากการสังเคราะห์จำนวนออร์เดอร์เท่ากับ 3 และ 6 เสียงที่ได้มีคุณภาพไม่ดี จำนวนออร์เดอร์เท่ากับ 10 เสียงมีคุณภาพดีขึ้น และจำนวนออร์เดอร์เท่ากับ 20 เสียงมีคุณภาพดีขึ้นมาก การทดลองนี้จำนวนออร์เดอร์เท่ากับ 20 จึงมีความเหมาะสมที่สุดสำหรับค่าออร์เดอร์ที่ทำให้คุณภาพของเสียงดี This research concerns the use of MATLAB educational simulation program to explore and study standardized speech coding algorithm which is LPC-Linear Predictive Coding. The objective of this study is to construct a speech analysis and synthesis, we introduce4 LPC algorithm to perform speech coding while keeping good speech quality. The aim of the thesis is to code speech with excellent intelligibility and good quality by applying MATLAB Software Tool, we determine the optimum LPC parameters which influence the coding and speech quality in the speech coding algorithm presented in this thesis are the LPC's order, codebook size, and threshold used to cut less significant parts of signal. This technique can be used in several low bit rate speech applications including mobile communications, multimedia, voice mailing and voice over Internet Protocol (VolIP).It was found that experimental results show that synthesis order 3 and 6 would create unacceptable quality of voices. The order of 10 would improve a better voice quality. Optimum order parameter is 20 that the output result is useful to yield good quality of speech signal.