แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th ติดต่อเจ้าหน้าที่เจ้าของเอกสาร กรณีเอกสารไม่ครบหรือไม่ตรง

การลดมิติ และการปรับโครงสร้างของชุดข้อมูล โดยใช้เวิร์ดเอ็มเบดดิ้ง เพื่อพัฒนาตัวแบบการจำแนกประเภทข้อความการเสพยาเสพติด จากข้อความสั้น บนสื่อสังคมออนไลน์ในทวีปเอเชีย
Dimensional reduction and restructuring of dataset using word embedding for development of narcotic drugs messages classification model from short messages on online social media in Asia

ThaSH: มหาวิทยาลัยเกษตรศาสตร์ -- วิทยานิพนธ์. ปร.ด. (วิทยาการคอมพิวเตอร์) 2564.
Classification :.LCCS: QA76.9.D343
ThaSH: มหาวิทยาลัยเกษตรศาสตร์. -- สาขาวิทยาการคอมพิวเตอร์ -- วิทยานิพนธ์
ThaSH: เหมืองข้อมูล
ThaSH: ระบบคอมพิวเตอร์ฝังตัว
Abstract: งานวิจัยชิ้นนี้นำเสนอตัวแบบจำแนกประเภทข้อความการเสพยาเสพติด (NDCM: Narcotic Drugs Data Classification Model) จากข้อความสั้นบนสื่อสังคมออนไลน์ การเตรียมชุดข้อมูลใช้ขั้นตอนวิธีเตรียมข้อมูลที่ใช้กันแพร่หลายคือ Bag-of-Words (BoW) อย่างไรก็ตาม ชุดข้อมูลที่เตรียมด้วย BoW ประกอบด้วยคุณลักษณะจำนวนมากและมีขนาดใหญ่ ดังนั้น งานวิจัยชิ้นนี้จึงนำเสนอขั้นตอนวิธีเตรียมข้อมูลแบบใหม่เพื่อลดจำนวนคุณลักษณะของชุดข้อมูล จำนวน 3 ขั้นตอนวิธี ได้แก่ (1) New Document Term Matrix Data (NDTMD), (2) Sentence Vector of Word Embedding (SVWE) และ (3) Sentence Vector of Word Embedding with Feature Extension (SWEF) ชุดข้อมูลที่ใช้ในการทดลองได้รวบรวมจาก 2 แหล่งข้อมูล ได้แก่ (1) ชุดข้อมูลข้อความจำนวน 7 ชุดข้อมูล รวบรวมจาก Data Science Community Kaggle Website (DSCK) (2) ชุดข้อมูลข้อความที่เกี่ยวข้องกับการเสพยาเสพติด คัดเลือกจากทวิตเตอร์ในทวีปเอเชีย แบ่งเป็น 2 คลาส คือ Abuse และ Non-Abuse การทดสอบประสิทธิภาพของขั้นตอนวิธีเตรียมข้อมูลที่นำเสนอ ได้แก่ NDTMD, SVWE และ SWEF ซึ่งเปรียบเทียบประสิทธิภาพกับขั้นตอนวิธีแบบดั้งเดิม 5 แบบ ได้แก่ BoW, TF-IDF (Term Frequency-Inverse Document Frequency), LSA (Latent Semantic Analysis), PV-DM (Paragraph Vector-Distributed Memory Model) และ PV-DBOW (Paragraph Vector without Word Ordering-Distributed Bag of Words) ผลการทดลองพบว่า ค่า FRR (Feature Reduction Rate) ของขั้นตอนวิธี LSA, PV-DM, PV-DBOW และ SVWE สูงกว่าขั้นตอนวิธีเตรียมข้อมูลอื่น ๆ สำหรับการพัฒนาตัวแบบ NDCM ใช้ขั้นตอนวิธีจำแนกประเภท 4 ขั้นตอนวิธี คือ SVM (Support Vector Machine), LR (Logistic Regression), J48 (Decision Tree) และ CNN (Convolutional Neural Network) จากผลการทดลองพบว่า (1) ตัวแบบการจำแนกประเภทใช้ขั้นตอนวิธี SWEF กับขั้นตอนวิธีจำแนกประเภท LR ให้ค่าตัววัดประสิทธิภาพการจำแนกสูงสุด 4 ชุดข้อมูลจาก 7 ชุดข้อมูลใน DSCK (2) ตัวแบบ NDCM ที่สร้างจากชุดข้อมูลจากทวิตเตอร์เตรียมข้อมูลด้วยขั้นตอนวิธี SWEF และใช้ขั้นตอนวิธีจำแนกประเภท LR ให้ค่าตัววัดประสิทธิภาพการจำแนกสูงสุด ได้แก่ Accuracy (0.8954), F-Measure (0.8950), Kappa (0.7506) และ AUC (0.9530) นอกจากนี้ (3) ผลการทดสอบ Wilcoxon Rank Sum Test, Likelihood Ratio Test, Pseudo R^2 พบว่า ตัวแบบ NDCM ที่นำเสนอในการศึกษาครั้งนี้มีประสิทธิภาพดีและมีความเหมาะสมกับชุดข้อมูลจากทวิตเตอร์ที่ได้รวบรวมจากงานวิจัยชิ้นนี้ This study proposed a model of Narcotic Drugs Data Classification (NDCM) for short messages in social media based on text classification. The development of the NDCM included the important method of data preprocessing. The most popular method for data preprocessing is BoW (Bag of Words). However, BoW involves a large number of features. Therefore, this study proposed a new data preprocessing method for dataset feature reduction. The three proposed feature reduction algorithms were: (1) NDTMD (New Document Term Matrix Data), (2) SVWE (Sentence Vector Word Embedding) and (3) SWEF (Sentence Vector Word Embedding with Feature Reduction). Two dataset sources with large numbers of features were used in this study. The first was 7 datasets from the Data Science Community Kaggle website (DSCK) and the second was the collection of short messages from Twitter in Asia. The Twitter dataset was divided into 2 classes: Abuse and Non-Abuse. The performance levels of NDTMD, SVWE and SVWF were compared with 5 previous data preprocessing algorithms (BoW, TF-IDF (Term Frequency-Inverse Document Frequency), LSA (Latent Semantic Analysis), PV-DM (Paragraph Vector-Distributed Memory Model) and PV-DBOW (Paragraph Vector without Word Ordering-Distributed Bag of Words)) using 7 large feature DSCK datasets. The results showed that the values of the FRR (Feature Reduction Rate) of LSA, PV-DM, PV-DBOW and SVWE were better than the others. Four classifiers (SVM (Support Vector Machine), LR (Logistic Regression), J48 (Decision Tree) and CNN (Convolutional Neural Network)) were applied for developing classification models from the DSCK and Twitter datasets. The experimental results revealed: (1) the NDCM model development using SWEF preprocessing and the LR classifier provided the best performance for four out of the 7 DSCK datasets; (2) for the Twitter dataset, the NDCM model using SWEF with the LR classifier provided the best performance with a high accuracy rate (0.8954), F-measure (0.8950), AUC (0.9530), and Kappa (0.7506); and (3) the Wilcoxon Rank Sum Test, Pseudo R2 and Likelihood Ratio Test were used to evaluate the NDCM model and the results showed that the model fitted the Twitter dataset collected in this research. Implications and future research topics were discussed.
มหาวิทยาลัยเกษตรศาสตร์. สำนักหอสมุด
Address: กรุงเทพมหานคร
Email: tdckulib@ku.ac.th
Role: อาจารย์ที่ปรึกษาวิทยานิพนธ์หลัก
Created: 2564
Modified: 2568-07-29
Issued: 2568-07-29
วิทยานิพนธ์/Thesis
วิทยานิพนธ์/Thesis
application/pdf
URL: https://www.lib.ku.ac.th/KUthesis/2564/narongsak-cha-all.pdf
CallNumber: QA76.9.D343 .ณ17
tha
©copyrights มหาวิทยาลัยเกษตรศาสตร์
RightsAccess:
ลำดับที่.ชื่อแฟ้มข้อมูล ขนาดแฟ้มข้อมูลจำนวนเข้าถึง วัน-เวลาเข้าถึงล่าสุด
1 narongsak-cha-all.pdf 7.03 MB
ใช้เวลา
0.035518 วินาที

ณรงค์ศักดิ์ จายางกูร
Title Contributor Type
การสร้างและหาประสิทธิภาพชุดฝึกอบรม บนเครือข่ายอินเทอร์เน็ต เรื่อง การใช้โปรแกรม Nu Taxmap สำหรับเจ้าหน้าที่จัดเก็บรายได้ของหน่วยงานราชการ สังกัดกรมส่งเสริมการปกครองส่วนท้องถิ่น
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
ณรงค์ศักดิ์ จายางกูร
นิดาพรรณ สุรีรัตนันท์
วิทยานิพนธ์/Thesis
การพัฒนาและหาประสิทธิภาพบทเรียนคอมพิวเตอร์ช่วยสอน ด้วยสถานการณ์จำลอง วิชา สรีรวิทยา: การเปลี่ยนแปลงของความดันโลหิต
มหาวิทยาลัยเกษตรศาสตร์
ณรงค์ศักดิ์ จายางกูร;วัฒนา รัตนพรหม
มหาวิทยาลัยเกษตรศาสตร์
สำนักงานคณะกรรมการการอุดมศึกษา
กระทรวงศึกษาธิการ
กระทรวงเกษตรและสหกรณ์
กระทรวงวิทยาศาสตร์และเทคโนโลยี
กระทรวงทรัพยากรธรรมชาติและสิ่งแวดล้อม
กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร
สำนักงานคณะกรรมการวิจัยแห่งชาติ
สำนักงานกองทุนสนับสนุ
บทความ/Article
การลดมิติ และการปรับโครงสร้างของชุดข้อมูล โดยใช้เวิร์ดเอ็มเบดดิ้ง เพื่อพัฒนาตัวแบบการจำแนกประเภทข้อความการเสพยาเสพติด จากข้อความสั้น บนสื่อสังคมออนไลน์ในทวีปเอเชีย
มหาวิทยาลัยเกษตรศาสตร์
ณรงค์ศักดิ์ จายางกูร

อนงค์นาฏ ศรีวิหค
วิทยานิพนธ์/Thesis
อนงค์นาฏ ศรีวิหค
Title Creator Type and Date Create
ปัจจัยที่มีอิทธิพลต่อความสำเร็จของการใช้ระบบสารสนเทศในกรมสรรพสามิต
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
ธนพร งามเสาวรส
วิทยานิพนธ์/Thesis
ระบบวิเคราะห์คำถามและตอบปัญหาการใช้งานอินเตอร์เน็ตด้วยเทคนิคการทำเหมืองข้อมูล
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
นฤป รักงาม
วิทยานิพนธ์/Thesis
การจัดกลุ่มศูนย์บริการและถ่ายทอดเทคโนโลยีทางการเกษตรประจำตำบลในประเทศไทยโดยใช้อัลกอริทึม 2 ขั้นตอนคือ SOM และ Fuzzy C-Means
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
ศศิธร มงคลศรีพัฒนา
วิทยานิพนธ์/Thesis
อัลกอริทึมในการจำแนกบุคลากรในองค์กรสำหรับการสร้างแผนที่ความรู้ / บุษกร สุคนธวงศาโรจน์
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
บุษกร สุคนธวงศาโรจน์, 2513-
วิทยานิพนธ์/Thesis
ตัวแบบทำนายการแพร่ระบายเชื้อไวรัสไข้หวัดนก จากคนสู่คนในประเทศไทย
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
ประภาพรรณ ประวิง, 2521-
วิทยานิพนธ์/Thesis
การแนะนำข้อมูลรายการท่องเที่ยวส่วนบุคคลสำหรับการท่องเที่ยวอิเล็กทรอนิกส์โดยทฤษฎีเบย์และกฏความสัมพันธ์
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค;วรเศรษฐ สุวรรณิก;สมชาย นำประเสริฐชัย
พัชรี ศรีสุวรรณ
วิทยานิพนธ์/Thesis
การเปรียบเทียบเทคนิคการคัดเลือกคุณลักษณะที่เหมาะสมและอัลกอริทึมเพื่อจำแนก พฤติกรรมการกระทำความผิดของนักเรียนระดับอาชีวศึกษา
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
สุคนธ์ทิพย์ วงศ์พันธ์
วิทยานิพนธ์/Thesis
การออกแบบเว็บพอร์ทอลส่วนจำแนกประเภทที่ดิน สำนักพัฒนาเทคโนโลยีการสำรวจและทำแผนที่ กรมพัฒนาที่ดิน
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค ;สิริกร กาญจนสุนทร;พรเทพ พัฒธนานุรักษ์
สราวุธ อัคพิน
วิทยานิพนธ์/Thesis
แบบจำลองเพื่อใช้สำหรับการเฝ้าระวังโรคไข้หวัดนกในพื้นที่เลี้ยงสัตว์ปีกของไทย โดยเทคนิคการเหมืองข้อมูล
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
สิรพจน์ สันตติวุฒิ
วิทยานิพนธ์/Thesis
ระบบการประเมินผลการปฏิบัติงานและสมรรถนะของกรมสรรพากร
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
บญุเลิศ ศรีสุพรวิชัย
วิทยานิพนธ์/Thesis
ระบบสารสนเทศสำหรับการผลิตในโรงงานผลิตสี
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
อุกฤษฎ์ ธีระธนานนท์
วิทยานิพนธ์/Thesis
ระบบการจัดการความรู้สำหรับการบริหารทรัพยากรมนุษย์ โดยใช้ case-based reasoning
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
สุนิษา แดงมา
วิทยานิพนธ์/Thesis
ระบบเบิกจ่ายเงินสวัสดิการ สำนักงานสรรพากรภาค 1
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
นิตยา พั้วทา
วิทยานิพนธ์/Thesis
การทำเหมืองข้อมูลข่าวอาชญากรรมจากหนังสือพิมพ์ฉบับออนไลน์โดยใช้วิธีคัดเลือกคุณลักษณะ และการหากฎความสัมพันธ์
มหาวิทยาลัยเกษตรศาสตร์
อนงค์นาฏ ศรีวิหค
ธนวิชญ์ สิทธิพรหม
วิทยานิพนธ์/Thesis
การแบ่งกลุ่มนักท่องเที่ยวภายในประเทศไทย โดยการใช้การถ่างน้ำหนักของคุณลักษณะและอัลกอริทึมสำหรับการจัดกลุ่มข้ำมูล
มหาวิทยาลัยเกษตรศาสตร์
;อนงค์นาฏ ศรีวิหค
ประภัสสร หะยะมิน
วิทยานิพนธ์/Thesis
การคัดเลือกคุณลักษณะแบบผสมโดยเทคนิคการขึ้นต่อคลาสของโมเดลการจำแนกข้อมูลผู้ป่วยโรคมะเร็งของภาคกลางในประเทศไทย
มหาวิทยาลัยเกษตรศาสตร์
;อนงค์นาฏ ศรีวิหค
รัตนาวดี พานทอง
วิทยานิพนธ์/Thesis
การลดมิติ และการปรับโครงสร้างของชุดข้อมูล โดยใช้เวิร์ดเอ็มเบดดิ้ง เพื่อพัฒนาตัวแบบการจำแนกประเภทข้อความการเสพยาเสพติด จากข้อความสั้น บนสื่อสังคมออนไลน์ในทวีปเอเชีย
มหาวิทยาลัยเกษตรศาสตร์
;อนงค์นาฏ ศรีวิหค
ณรงค์ศักดิ์ จายางกูร
วิทยานิพนธ์/Thesis
Copyright 2000 - 2026 ThaiLIS Digital Collection Working Group. All rights reserved.
ThaiLIS is Thailand Library Integrated System
สนับสนุนโดย สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม
328 ถ.ศรีอยุธยา แขวง ทุ่งพญาไท เขต ราชเทวี กรุงเทพ 10400 โทร. โทร. 02-232-4000
กำลัง ออน์ไลน์
ภายในเครือข่าย ThaiLIS จำนวน 46
ภายนอกเครือข่าย ThaiLIS จำนวน 4,005
รวม 4,051 คน

More info..
นอก ThaiLIS = 247,174 ครั้ง
มหาวิทยาลัยราชภัฏ = 171 ครั้ง
มหาวิทยาลัยสังกัดทบวงเดิม = 138 ครั้ง
มหาวิทยาลัยเทคโนโลยีราชมงคล = 19 ครั้ง
หน่วยงานอื่น = 3 ครั้ง
สถาบันพระบรมราชชนก = 2 ครั้ง
รวม 247,507 ครั้ง
Database server :
Version 2.5 Last update 1-06-2018
Power By SUSE PHP MySQL IndexData Mambo Bootstrap
มีปัญหาในการใช้งานติดต่อผ่านระบบ UniNetHelp


Server : 8.199.134
Client : Not ThaiLIS Member
From IP : 216.73.216.61