แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th ติดต่อเจ้าหน้าที่เจ้าของเอกสาร กรณีเอกสารไม่ครบหรือไม่ตรง

Named entity recognition for Thai historical data

Organization : Phuket Rajabhat University. Faculty of Science and Technology
Email : nasith.l@pkru.ac.th

Organization : Prince of Songkla University. College of Computing
Email : kanjana.l@phuket.psu.ac.th

Organization : Chulalongkorn University. Faculty of Science
Email : 6373005223@student.chula.ac.th
keyword: Named entity recognition
LCSH: Natural language processing (Computer science)
; Historical records
LCSH: PLNLP (Computer program language)
LCSH: Thai language -- Data processing
Abstract: Named Entity Recognition (NER) is a fundamental task in Natural Language Processing (NLP), enabling various advanced NLP applications like information extraction, question answering, and text summarization. Thai NER presents unique challenges due to the absence of capitalization, explicit word boundaries, and sentence-ending punctuation. While NER on general domain Thai datasets has been explored, its application to historical text remains an underexplored area. Historical texts contain specialized terminology, necessitating domain-specific NER solutions for optimal performance. This study investigates Thai historical NER, utilizing historical textual data collected from the Wikipedia website. Our goal is to identify suitable word segmentation and NER methods. We evaluate the performance of the Attacut word segmentation algorithm against Deepcut and Newmm. Our findings demonstrate Attacut’s superiority, achiev- ing an F1-score of 0.9557. Furthermore, our proposed SBC model (Sentence Transformer + BiLSTM + CRF) outperforms pre- trained LLMs (BERT-th1, XLM-R, WangchanBERTa) in NER, achieving an average F1-score of 0.97. The overall performance of the Attacut algorithm and the SBC model highlights their suitability for developing advanced NLP applications within the Thai historical domain.
King Mongkut's University of Technology North Bangkok. Central Library
Address: BANGKOK
Email: library@kmutnb.ac.th
Created: 2024
Modified: 2025-06-06
Issued: 2025-06-06
บทความ/Article
application/pdf
BibliograpyCitation : In IEEE Thailand Section (IEEE Computer Society Thailand Chapter) and Prince of Songkla University. College of Computing. The 21st International Joint Conference on Computer Science and Software Engineering (JCSSE 2024)) (pp.528-533). Phuket : Prince of Songkla University
eng
©copyrights King Mongkut's University of Technology North Bangkok
RightsAccess:
ลำดับที่.ชื่อแฟ้มข้อมูล ขนาดแฟ้มข้อมูลจำนวนเข้าถึง วัน-เวลาเข้าถึงล่าสุด
1 JCSSE 2024pp.528-533.pdf 2.06 MB
ใช้เวลา
0.028163 วินาที

Nasith Laosen
Title Contributor Type
Development of AI chatbot for tourism promotion : a case study in Ranong and Chumphon, Thailand
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Nasith Laosen;Kanjana Laosen;Piyawat Sriprasert

บทความ/Article
Named entity recognition for Thai historical data
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Nasith Laosen;Kanjana Laosen;Thummarat Paklao

บทความ/Article
Kanjana Laosen
Title Contributor Type
An NLP-based approach for detecting ambiguity of Thai software requirements specification
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Adisak Intana;Kanjana Laosen;Panya Nuanchan;Nattapong Pattanakit;Sathani Dermchai

บทความ/Article
Development of AI chatbot for tourism promotion : a case study in Ranong and Chumphon, Thailand
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Nasith Laosen;Kanjana Laosen;Piyawat Sriprasert

บทความ/Article
Named entity recognition for Thai historical data
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Nasith Laosen;Kanjana Laosen;Thummarat Paklao

บทความ/Article
Intent classification from online forums for Phuket medical tourism
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Nasith Laosen;Kanjana Laosen;Jaturawit Ardharn

บทความ/Article
Thummarat Paklao
Title Contributor Type
Named entity recognition for Thai historical data
มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
Nasith Laosen;Kanjana Laosen;Thummarat Paklao

บทความ/Article
Copyright 2000 - 2026 ThaiLIS Digital Collection Working Group. All rights reserved.
ThaiLIS is Thailand Library Integrated System
สนับสนุนโดย สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม
328 ถ.ศรีอยุธยา แขวง ทุ่งพญาไท เขต ราชเทวี กรุงเทพ 10400 โทร. โทร. 02-232-4000
กำลัง ออน์ไลน์
ภายในเครือข่าย ThaiLIS จำนวน 3
ภายนอกเครือข่าย ThaiLIS จำนวน 3,866
รวม 3,869 คน

More info..
นอก ThaiLIS = 247,822 ครั้ง
มหาวิทยาลัยสังกัดทบวงเดิม = 801 ครั้ง
มหาวิทยาลัยราชภัฏ = 560 ครั้ง
มหาวิทยาลัยเอกชน = 58 ครั้ง
มหาวิทยาลัยสงฆ์ = 14 ครั้ง
มหาวิทยาลัยเทคโนโลยีราชมงคล = 9 ครั้ง
สถาบันพระบรมราชชนก = 8 ครั้ง
รวม 249,272 ครั้ง
Database server :
Version 2.5 Last update 1-06-2018
Power By SUSE PHP MySQL IndexData Mambo Bootstrap
มีปัญหาในการใช้งานติดต่อผ่านระบบ UniNetHelp


Server : 8.199.134
Client : Not ThaiLIS Member
From IP : 216.73.216.60