แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th ติดต่อเจ้าหน้าที่เจ้าของเอกสาร กรณีเอกสารไม่ครบหรือไม่ตรง

Resolving Thai zero pronoun using masked language model
ไขสรรพนามไร้รูปภาษาไทยโดยใช้แบบจำลองทางภาษาแบบพรางคำ

LCSH: Thai language -- Pronoun
LCSH: Natural language processing (Computer science)
LCSH: Computational linguistics
Abstract: Zero pronoun resolution is an actively challenging NLP task in Thai. However, only a few previous studies have focused on this topic. Therefore, we explore a modern approach that could outperform existing state-of-the-art methods on various datasets and downstream tasks, the transformer-based, pre-trained language model, to apply to the Thai zero pronoun resolution task. We conduct two experiments on a small corpus, which are (1) using a pre-trained masked language model to predict zero pronominal expressions and (2) fine-tuning Wangchanberta on a token classification task to classify persons of pronouns. Based on our experiments, the results demonstrate the effectiveness of the pre-trained language model (1), which successfully encodes not only the grammatical features but also the system of Thai pronoun usage at the discourse level.
Abstract: การไขสรรพนามไร้รูปเป็นหนึ่งในงานที่ท้าทายในการประมวลผลภาษาธรรมชาติในภาษาไทย อย่างไรก็ตามงานศึกษาในหัวข้อดังกล่าวในทางภาษาศาสตร์คอมพิวเตอร์นั้นยังไม่เป็นที่แพร่หลายและยังไม่มีการนำข้อมูลภาษาไทยมาทดลองด้วยวิธีการใหม่ ๆ จากวิทยาการทางด้านนี้ ด้วยเหตุนี้ผู้วิจัยจึงสนใจประยุกต์แบบจำลองทางภาษาที่ผ่านการฝึกฝนมาแล้วจากสถาปัตยกรรมแบบทรานฟอร์เมอร์ ซึ่งเป็นวิธีใหม่ที่มีความแม่นยำสูงที่สุดในการทำงานประมวลผลภาษาธรรมชาติรูปแบบต่าง ๆ และยังสามารถใช้งานกับชุดข้อมูลที่หลากหลาย เพื่อมาใช้ในการไขสรรพนามไร้รูปภาษาไทย ผู้วิจัยทำการทดลองกับชุดข้อมูลขนาดเล็ก โดยออกแบบเป็น 2 การทดลอง คือ (1) ใช้แบบจำลองทางภาษาแบบพรางคำที่ผ่านการฝึกฝนมาแล้วเพื่อทำนายคำสรรพนามไร้รูป และ (2) ปรับแต่งการจำแนกคำในโมเดล Wangchanberta เพื่อให้จำแนกบุรุษของสรรพนามไร้รูป ผลลัพธ์จากการทดลองทั้งสองแสดงให้เห็นถึงประสิทธิภาพของแบบจำลองทางภาษาที่ผ่านการฝึกฝนมาแล้ว ที่ไม่เพียงแค่สามารถจับคุณลักษณะทางไวยากรณ์ของคำสรรพนามไร้รูปในภาษาไทยได้ แต่ยังสามารถเข้าใจระบบการเลือกใช้คำสรรพนามภาษาไทยในระดับปริจเฉทอีกด้วย
Chulalongkorn University. Office of Academic Resources
Address: BANGKOK
Email: cuir@car.chula.ac.th
Role: Advisor
Issued: 2022
Modified: 2025-01-05
Issued: 2025-01-05
วิทยานิพนธ์/Thesis
application/pdf
URL: http://doi.org/10.58837/CHULA.IS.2022.32
eng
DegreeName: Master of Arts
Descipline: Linguistics
©copyrights Chulalongkorn University
RightsAccess:
ลำดับที่.ชื่อแฟ้มข้อมูล ขนาดแฟ้มข้อมูลจำนวนเข้าถึง วัน-เวลาเข้าถึงล่าสุด
1 6380049722.pdf 869.63 KB
ใช้เวลา
-0.974091 วินาที

Sumana Sumanakul
Title Contributor Type
Resolving Thai zero pronoun using masked language model
จุฬาลงกรณ์มหาวิทยาลัย
Sumana Sumanakul
Attapol Thamrongrattanarit
วิทยานิพนธ์/Thesis
Attapol Thamrongrattanarit
Title Creator Type and Date Create
Collocation-based retokenization methods for latent dirichlet allocation topic models
จุฬาลงกรณ์มหาวิทยาลัย
Attapol Thamrongrattanarit
Jin Cheevaprawatdomrong
วิทยานิพนธ์/Thesis
Resolving Thai zero pronoun using masked language model
จุฬาลงกรณ์มหาวิทยาลัย
Attapol Thamrongrattanarit
Sumana Sumanakul
วิทยานิพนธ์/Thesis
Thai sentence segmentation using large language models
จุฬาลงกรณ์มหาวิทยาลัย
Attapol Thamrongrattanarit
Narongkorn Panitsrisit
วิทยานิพนธ์/Thesis
Analyzing two opposing opinions from social media through static and contextualized word embeddings
จุฬาลงกรณ์มหาวิทยาลัย
Attapol Thamrongrattanarit
Wassakorn Sarakul
วิทยานิพนธ์/Thesis
Copyright 2000 - 2026 ThaiLIS Digital Collection Working Group. All rights reserved.
ThaiLIS is Thailand Library Integrated System
สนับสนุนโดย สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม
328 ถ.ศรีอยุธยา แขวง ทุ่งพญาไท เขต ราชเทวี กรุงเทพ 10400 โทร. โทร. 02-232-4000
กำลัง ออน์ไลน์
ภายในเครือข่าย ThaiLIS จำนวน 44
ภายนอกเครือข่าย ThaiLIS จำนวน 11,442
รวม 11,486 คน

More info..
นอก ThaiLIS = 180,535 ครั้ง
มหาวิทยาลัยสังกัดทบวงเดิม = 653 ครั้ง
มหาวิทยาลัยราชภัฏ = 18 ครั้ง
สถาบันพระบรมราชชนก = 1 ครั้ง
รวม 181,207 ครั้ง
Database server :
Version 2.5 Last update 1-06-2018
Power By SUSE PHP MySQL IndexData Mambo Bootstrap
มีปัญหาในการใช้งานติดต่อผ่านระบบ UniNetHelp


Server : 8.199.134
Client : Not ThaiLIS Member
From IP : 216.73.216.172