แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th ติดต่อเจ้าหน้าที่เจ้าของเอกสาร กรณีเอกสารไม่ครบหรือไม่ตรง

การพัฒนาออนโทโลยีโควิด-19 จากแหล่งข้อมูลที่หลากหลายโดยใช้การวิเคราะห์ข้อความ
Development of COVID-19 ontology from multiple data sources using text analytics

ThaSH: โครงสร้างข้อมูล (วิทยาการคอมพิวเตอร์)
ThaSH: ออนโทโลยี (การค้นคืนสารสนเทศ)
ThaSH: โควิด-19 (โรค)
Abstract: การรวบรวมข้อมูลจากแหล่งข้อมูลที่หลากหลาย เป็นภาระงานที่ต้องใช้ระยะเวลาในการดำเนินการเพื่อรวบรวม วิเคราะห์ และจัดหมวดหมู่ข้อมูลอย่างมาก นอกจากนี้ แต่ละแหล่งข้อมูลที่รวบรวมต่างมีรูปแบบโครงสร้างข้อมูลที่แตกต่างกัน หากต้องการที่จะนำข้อมูลดังกล่าวมาผสาน จะต้องพิจารณารูปแบบการนำเสนอข้อมูลที่สามารถรองรับความหลากหลายดังกล่าวได้ ดังนั้น การค้นคว้าอิสระนี้จึงมีวัตถุประสงค์เพื่อนำเสนอขั้นตอนวิธีสำหรับ การบูรณาการองค์ความรู้แบบอัตโนมัติจากแหล่งข้อมูลที่หลากหลาย (Automated Knowledge Integration from Multiple Data Sources) ด้วยการวัดความละม้ายโคไซน์ (Cosine Similarity) และการประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) ซึ่งโรคโคโรนาสายพันธุ์ใหม่ 2019 (Coronavirus Disease 2019: COVID-19) จะถูกกำหนดเป็นขอบเขตขององค์ความรู้สำหรับการค้นคว้าอิสระนี้ สำหรับระเบียบวิธีวิจัยจะประยุกต์หลักการทางวิศวกรรมออนโทโลยี (Ontology Engineering) และการวิเคราะห์ข้อความ ประกอบด้วย การวจีวิภาค (Part of Speech Tagging: POS Tagging) ความขึ้นต่อกันของการกระจายศัพท์สากล (Universal Dependencies: UD) และการลดรูปคำศัพท์ (Text Stemming) นำมาสร้างออน-โทโลยีโควิด-19 และผสานข้อมูลที่รวบรวมได้จากแหล่งข้อมูลที่หลากหลายอย่างอัตโนมัติ สำหรับการประเมินผล จะดำเนินการเตรียมข้อมูลต้นฉบับที่มีความเกี่ยวข้องและไม่มีความเกี่ยวข้องกับโควิด-19 ในอัตราส่วน 70 ต่อ 30 จากนั้นจะดำเนินการสร้างออนโทโลยีโควิด-19 จำนวน 6 ออนโทโลยี ตามช่วงค่าความคล้ายคลึงโคไซน์ที่กำหนด ตั้งแต่ 0.5 ถึง 1.0 เพื่อพิจารณาค่าความคล้ายคลึงโคไซน์ที่เหมาะสมที่สุดสำหรับการพัฒนาออนโทโลยีโควิด-19 จากการดำเนินการ พบว่า ที่ค่าความคล้ายคลึงโคไซน์ เท่ากับ 0.6 เป็นช่วงค่าความคล้ายคลึงโคไซน์ที่เหมาะสมที่สุดสำหรับการสร้างพัฒนาออน-โทโลยีโควิด-19 เนื่องจากเป็นออนโทโลยีที่มีค่า ความแม่นยำ (Precision) การระลึก (Recall) และมาตรวัดเอฟ (F-Measure) ที่สูงกว่าค่าความคล้ายคลึงโคไซน์อื่น ๆ คือ 0.80, 0.70 และ 0.75 ตามลำดับ นอกจากนี้ ออนโทโลยีดังกล่าวมีปริมาณองค์ความรู้ที่เกี่ยวข้องกับข้อมูลโควิด-19 ในปริมาณสูงสุด
Abstract: Gathering information from multiple data sources takes a long time to collect, analyze and classify. Furthermore, if the data sources have different data structures, the merged data structure must be able to support such heterogeneity. In addition, semantics must also be considered. This paper proposes automated knowledge integration from heterogeneous data sources, using ontology engineering combined with text analytics. Text stemming is used to preprocess data. Part-of-speech (POS) tagging, Universal Dependencies (UD), and text similarity measurement called cosine similarity are used to analyze and integrate data. The knowledge scopes focus on five perspectives of COVID-19 information: COVID-19, Coronavirus, disease, pandemic, and vaccine. For evaluation, six ontologies were constructed using cosine similarity measurement ranged from 0.5 to 1.0. The data used in each ontology construction contain data related and unrelated to COVID-19 in a ratio of 70 to 30. The six constructed ontologies were evaluated for consistency with the original data. Using cosine similarity with 0.6, precision, recall, and F1-score are 0.80, 0.70, and 0.75, respectively, and the constructed ontology is optimal containing the highest amount of relevant COVID-19 information for this case study.
มหาวิทยาลัยเชียงใหม่. สำนักหอสมุด
Address: เชียงใหม่
Email: cmulibref@cmu.ac.th
Role: อาจารย์ที่ปรึกษา
Created: 2566
Modified: 2024-01-16
Issued: 2567-01-10
วิทยานิพนธ์/Thesis
application/pdf
tha
©copyrights มหาวิทยาลัยเชียงใหม่
RightsAccess:
ลำดับที่.ชื่อแฟ้มข้อมูล ขนาดแฟ้มข้อมูลจำนวนเข้าถึง วัน-เวลาเข้าถึงล่าสุด
1 630532005.pdf 12.63 MB5 2025-07-07 14:12:40
ใช้เวลา
0.028875 วินาที

ปฏิพน เวียงนาค
อารีรัตน์ ตรงรัศมีทอง
Title Creator Type and Date Create
การจัดตารางสอนด้วยการค้นหาแบบตาบู
มหาวิทยาลัยเชียงใหม่
อารีรัตน์ ตรงรัศมีทอง;พรรณิภา ไพบูลย์นิมิตร;เพชรรัตน์ โชติกอาภา
อุเทน ทองสาย
วิทยานิพนธ์/Thesis
การพัฒนาออนโทโลยีเพื่อค้นคืนข้อมูลเชิงความหมายอะไหล่รถยนต์
มหาวิทยาลัยเชียงใหม่
อารีรัตน์ ตรงรัศมีทอง;รัฐสิทธิ์ สุขะหุต;โอฬาร เชี่ยวชาญ
ศิวรี เรืองรัตนกุล
วิทยานิพนธ์/Thesis
การพัฒนาออนโทโลยีอัตโนมัติจากฐานข้อมูลเชิงสัมพันธ์หลักสูตรระดับปริญญาตรีของมหาวิทยาลัยราชภัฏอุตรดิตถ์
มหาวิทยาลัยเชียงใหม่
ดุษฎี ประเสริฐธิติพงษ์;ขวัญชัย เอื้อวิริยานุกุล;อารีรัตน์ ตรงรัศมีทอง
อภิชญา อินทร์หม่อม
วิทยานิพนธ์/Thesis
การสืบค้นข้อมูลในระบบสินทรัพย์ถาวรโดยใช้ข้อคำถามภาษาไทย
มหาวิทยาลัยเชียงใหม่
ดุษฎี ประเสริฐธิติพงษ์;อารีรัตน์ ตรงรัศมีทอง;ขวัญชัย เอื้อวิริยานุกุล
ภาดา วุฒิการณ์
วิทยานิพนธ์/Thesis
ระบบให้คำแนะนำเอกสารและเทคโนโลยีสำหรับการพัฒนาโครงงานคอมพิวเตอร์โดยใช้ออนโทโลยีและการกรองเชิงร่วมมือ
มหาวิทยาลัยเชียงใหม่
ดุษฏี ประเสริฐธิติพงษ์;ขวัญชัย เอื้อวิริยานุกุล;อารีรัตน์ ตรงรัศมีทอง
เอธยา ติ๊บประสอน
วิทยานิพนธ์/Thesis
การพัฒนาออนโทโลยีโควิด-19 จากแหล่งข้อมูลที่หลากหลายโดยใช้การวิเคราะห์ข้อความ
มหาวิทยาลัยเชียงใหม่
อารีรัตน์ ตรงรัศมีทอง
ปฏิพน เวียงนาค
วิทยานิพนธ์/Thesis
Copyright 2000 - 2026 ThaiLIS Digital Collection Working Group. All rights reserved.
ThaiLIS is Thailand Library Integrated System
สนับสนุนโดย สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม
328 ถ.ศรีอยุธยา แขวง ทุ่งพญาไท เขต ราชเทวี กรุงเทพ 10400 โทร. โทร. 02-232-4000
กำลัง ออน์ไลน์
ภายในเครือข่าย ThaiLIS จำนวน 52
ภายนอกเครือข่าย ThaiLIS จำนวน 2,791
รวม 2,843 คน

More info..
นอก ThaiLIS = 301,408 ครั้ง
มหาวิทยาลัยราชภัฏ = 482 ครั้ง
มหาวิทยาลัยสังกัดทบวงเดิม = 341 ครั้ง
มหาวิทยาลัยเทคโนโลยีราชมงคล = 82 ครั้ง
หน่วยงานอื่น = 15 ครั้ง
มหาวิทยาลัยเอกชน = 8 ครั้ง
สถาบันพระบรมราชชนก = 2 ครั้ง
มหาวิทยาลัยสงฆ์ = 1 ครั้ง
สถาบันเทคโนโลยีปทุมวัน = 1 ครั้ง
รวม 302,340 ครั้ง
Database server :
Version 2.5 Last update 1-06-2018
Power By SUSE PHP MySQL IndexData Mambo Bootstrap
มีปัญหาในการใช้งานติดต่อผ่านระบบ UniNetHelp


Server : 8.199.134
Client : Not ThaiLIS Member
From IP : 216.73.216.61