Abstract:
งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของตัวสถิติทดสอบความเท่ากันของเมทริกซ์ความแปรปรวนร่วมสองประชากรสำหรับข้อมูลที่มีการแจกแจงปรกติหลายตัวแปร (p ตัวแปร) และเป็นข้อมูลที่มิติสูง (High-dimensional data) ของตัวสถิติทดสอบ 2 ตัว ได้แก่ ตัวสถิติทดสอบ LC ของ Li and Chen (2012) และตัวสถิติทดสอบ SE ของ Srivastava et al. (2014) โดยมีเกณฑ์ในการเปรียบเทียบคือค่าความน่าจะเป็นของความผิดพลาดแบบที่ 1 และกำลังการทดสอบผ่านการจำลองข้อมูลภายใต้สถานการณ์ต่างๆ ด้วยเทคนิคมอนติคาร์โลกระทำซ้ำ 1,000 ครั้ง โดยกำหนดให้ข้อมูลมีการแจกแจงปรกติหลายตัวแปร และมีโครงสร้างของเมทริกซ์ความ แปรปรวนร่วมของประชากร 5 แบบ ได้แก่โครงสร้าง Compound symmetry, Simple, Toeplitz, Unstructured และโครงสร้าง Variance component และกำหนดให้ขนาดตัวอย่างทั้งสองกลุ่ม เท่ากัน (n1 = n2) และจำนวนตัวแปร (p) มีมากกว่าหรือเท่ากับขนาดตัวอย่างดังนี้ (n1 = n2, p)=(10,30),(20,20),(20,40),(20,60), (40,40),(40,80) และ (n n ,p (10,10),(10,20),(40,120) ผลการวิจัยพบว่า ตัวสถิติทดสอบ LC สามารถควบคุมความน่าจะเป็นของความผิดพลาด แบบที่ 1 ได้ทุกโครงสร้างของเมทริกซ์ความแปรปรวนร่วมที่พิจารณา ในขณะที่ตัวสถิติทดสอบ SE ไม่สามารถควบคุมความน่าจะเป็นของความผิดพลาดแบบที่ 1 ได้นอกจากนี้ตัวสถิติทดสอบ LC มี ค่ากำลังการทดสอบสูง และลู่เข้าสู่ 1 เมื่อเพิ่มขนาดตัวอย่างและจำนวนตัวแปรในทุกสถานการณ์
The objective of this research is to compare the efficiency between two test statistics: test statistic LC by Li and Chen (2012) and SE by Srivastava et al. (2014), for testing the equality of two covariance matrices for high-dimensional data distributed as multivariate normal (p variables). There were two criteria for comparing the tests consisting of the probability of type I error and power of the test which were measured through data simulation using Monte Carlo technique 1000 iterations. The two high-dimensional data distributed as multivariate normal data under five covariance matrix structures: compound symmetry, simple, Toeplitz, unstructured, and variance components, were simulated. The sample sizes(n1 = n2) and number of variables (p) was assigned to be greater than or equal to its sample sizes and varied in (n1 = n2, p) = (10,10), (10,20),(10,30),(20,20),(20,40),(20,60),(40,40), (40,80)and (40,120). It was shown that LC could control the probability of type I error for all covariance matrix structures considered whereas SE was unable. In addition, the LC was strongly higher power than the other one and its power converged to one when the number of variables and sample sizes were increased for all situations.