การจำแนกความน่าเชื่อถือของเว็บไซต์แหล่งข่าวภาษาไทยโดยใช้เทคนิคการทำเหมืองข้อมูล
The Classification of Credibility of Thai News Source Websites Using Data Mining Techniques
Organization :
1คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Abstract:
การเพิ่มขึ้นของแหล่งข่าวที่ไม่น่าเชื่อถือในสื่อออนไลน์ที่เข้าถึงได้ในทุกวัน เช่น สื่อสังคมออนไลน์ บล็อกข่าว และเว็บไซต์หนังสือพิมพ์ออนไลน์ สร้างความเข้าใจผิดให้กับผู้ได้รับข่าวสารนั้น ซึ่งทำให้การระบุแหล่งข่าวที่น่าเชื่อถือเป็นเรื่องที่ท้าทาย เป้าหมายของการวิจัยนี้คือการสร้างโมเดลการจำแนกความน่าเชื่อถือของเว็บไซต์แหล่งข่าวภาษาไทย มีวัตถุประสงค์เพื่อศึกษาข้อมูลปัจจัยที่เกี่ยวข้องกับความน่าเชื่อถือของเว็บไซต์ และเปรียบเทียบประสิทธิภาพของโมเดลที่ใช้ในการจำแนกประเภท โดยการรวบรวมข้อมูลปัจจัยทางเทคนิคของเว็บไซต์แหล่งข่าวและสื่อสังคมออนไลน์ของแหล่งข่าวแล้วทำการจัดกลุ่มข้อมูลเว็บไซต์แหล่งข่าวเพื่อกำหนดป้ายกำกับกลุ่มของแหล่งข่าว โดยจัดกลุ่มที่มีประสิทธิภาพดีที่สุดแบ่งออกเป็น 5 กลุ่ม จากนั้นทำการวิเคราะห์ข้อมูลด้วยเทคนิคการจำแนกประเภทประกอบด้วย 5 เทคนิค ดังนี้ Decision Tree--C4.5, Naïve Bayes, K-Nearest Neighbor--K-NN, Multilayer Perceptron และ Support Vector Machine--SVM แล้วเปรียบเทียบค่าประสิทธิภาพพบว่าเทคนิค K-Nearest Neighbor--K-NN ที่มีค่า K เท่ากับ 5 6 และ 7 มีค่าประสิทธิภาพมากที่สุดเท่ากัน (Accuracy=96.03%, Precision=0.962, Recall=0.960, F-measure=0.959) ซึ่งผู้วิจัยเลือกใช้เทคนิค K-Nearest Neighbor--K-NN เมื่อ K เท่ากับ 6 เนื่องจากทำให้มีอำนาจจำแนกได้ดีกับจำนวน 5 กลุ่ม
มหาวิทยาลัยอีสเทิร์นเอเชีย. สำนักหอสมุดกลาง
Email:
libraryservice@eau.ac.th
©copyrights มหาวิทยาลัยอีสเทิร์นเอเชีย