Search ThaiLIS Digital Collection 2019 x

แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th

พัฒนันท์  อ้นประเสริฐ.  การจำแนกประเภทของคู่ประโยคภาษาอังกฤษ.  ปริญญาโท(วิทยาการคอมพิวเตอร์).  มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ. สำนักหอสมุดกลาง. : มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ, 2567.

Title

การจำแนกประเภทของคู่ประโยคภาษาอังกฤษ

Title Alternative

Enhanced English sentence pair classification

Creator

Name: พัฒนันท์ อ้นประเสริฐ

Subject

keyword: การเข้ารหัสข้อความ

ThaSH: การประมวลผลภาษาธรรมชาติ (วิทยาการคอมพิวเตอร์)

; KIRINLog.

ThaSH: ภาษาอังกฤษ -- ประโยค -- การจำแนก

ThaSH: การประมวลผลคำ

ThaSH: การเรียนรู้เชิงลึก (การเรียนรู้ของเครื่อง)

Description

Abstract: การประมวลผลภาษาธรรมชาติเป็นเทคโนโลยีที่พัฒนาอย่างรวดเร็วในยุคที่เทคโนโลยีเติบโต อย่างรวดเร็ว วิธีการตามกฎเกณฑ์แบบเดิมไม่เพียงพอที่จะตอบสนองความต้องการของที่ซับซ้อนในปัจจุบัน หนึ่งในงานของการประมวลผลภาษาธรรมชาติคือการู้จำการอนุมานเชิงข้อความ เนื่องจากการช่วยให้ระบบสามารถเข้าใจความสัมพันธ์ระหว่างข้อความเป็นปัจจัยสำคัญในแอปพลิเคชันต่าง ๆ เช่น การสรุปข้อความ การวิเคราะห์อารมณ์ การตรวจสอบข้อมูล การตอบคำถาม การจัดประเภทข้อความ และการแปลภาษา หนึ่งในความท้าทายคือการลดขนาดของเวกเตอร์อินพุตในขณะที่ยังคงรักษาผลการพยากรณ์และค่า F1-score ให้อยู่ในระดับที่ดี เพื่อแก้ไขความท้าทายนี้ งานวิจัยนี้ได้นำเสนอเทคนิคการเข้ารหัสแบบใหม่ที่ช่วยลดขนาดของการเข้ารหัสสำหรับประโยคที่เกี่ยวข้องกับชุดข้อมูลความรู้เชิงองค์ประกอบ ซึ่งชุดข้อมูลนี้เป็นคู่ประโยคภาษาอังกฤษที่ใช้ในการจำแนก การอนุมานเชิงข้อความออกเป็น 3 ประเภท ได้แก่ สอดคล้อง เป็นกลาง และความขัดแย้ง งานวิจัยนี้ได้นำเสนอเทคนิค KIRINLog ซึ่งประกอบด้วยด้วย 6 ขั้นตอน ได้แก่ การประมวลผลล่วงหน้า การลบคำที่ซ้ำกัน การเติมความยาวสูงสุดและการตัดคำเกินเพื่อปรับความยาวประโยคให้สอดคล้องกัน การเพิ่มค่า flag การเข้ารหัสคำด้วย Word2Vec และการลดมิติข้อมูลของเวกเตอร์อินพุต งานวิจัยนี้ใช้ Attention-based Bidirectional LSTM เป็นโมเดลสำหรับการจำแนกประเกท ด้วยความสามารถของ Bidirectional LSTM กับเลเยอร์ Attention ช่วยวิเคราะห์ลำดับข้อมูลในทั้งสองทิศทางและช่วยให้โมเดลสามารถแยกข้อมูลที่สำคัญในประโยคได้ เทคนิคนี้ให้ผลลัพธ์ที่มีความแม่นยำ 92.4% โดยมีค่าความเที่ยงตรงที่ 88.8% ค่า Recall 88.6% และค่า F1-score 88.6% บนชุดขัอมูล SICK 2014

Abstract: Natural language processing is a rapidly evolving technology. Conventionalrule-based methods are insufficient to meet today's complex challenges. One significant task in natural language processing is recognizing textual entailment, which enables systems to understand relationships between texts. It is crucial for applications like text summarization, sentiment analysis, information verification, question answering, text classification, and machine translation. One challenge is reducing input vector size while maintaining good prediction results and F1 scores. To address this, this research presents a novel encoding technique by reducing the encoding size for sentences in the com-positional knowledge dataset, which consists of English sentence pairs classified into entailment, neutral, and contradiction. This research proposes the KIRINLog technique, which consists of six methods: preprocessing, removing duplicate words, max-length padding and truncation for sentence alignment, adding a flag value, word embedding by Word2Vec, and dimensionality reduction with PCA. These steps create feature vectors for recognizing textual entailment. This study employs an attention-based bidirectional LSTM as a classification model. The model combines bidirectional LSTM with attention to analyze sequences in both directions and focus on important sentence information. The proposed technique achieves 92.496 accuracy, with 88.8% precision, 88.696 recall, and an F1-score of 88.696 on the 2014 compositional knowledge dataset.

Publisher

มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ. สำนักหอสมุดกลาง

Address: กรุงเทพมหานคร

Email: library@kmutnb.ac.th

Contributor

Name: คันธารัตน์ อเนกบุณย์

Role: ที่ปรึกษาวิทยานิพนธ์

Email : khantharat.a@sci.kmutnb.ac.th

Date

Created: 2567

Modified: 2568-07-17

Issued: 2568-07-17

Type

วิทยานิพนธ์/Thesis

Format

application/pdf

Language

tha

Thesis

DegreeName: วิทยาศาสตร์มหาบัณฑิต

Level: ปริญญาโท

Descipline: วิทยาการคอมพิวเตอร์

Grantor: มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ

Rights

RightsAccess:

ลำดับที่.	ชื่อแฟ้มข้อมูล	ขนาดแฟ้มข้อมูล	จำนวนเข้าถึง	วัน-เวลาเข้าถึงล่าสุด
1	B17702768.pdf	3.42 MB

ใช้เวลา

0.031909 วินาที

Creator : พัฒนันท์ อ้นประเสริฐ

Title	Contributor	Type
การจำแนกประเภทของคู่ประโยคภาษาอังกฤษ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ พัฒนันท์ อ้นประเสริฐ	คันธารัตน์ อเนกบุณย์	วิทยานิพนธ์/Thesis

Contributor : คันธารัตน์ อเนกบุณย์

Title	Creator	Type and Date Create
ระบบสำหรับอ่านแผ่นวัดระดับน้ำอัตโนมัติ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ คันธารัตน์ อเนกบุณย์	พรรษชนม์ กุตัน	วิทยานิพนธ์/Thesis
การจำแนกประเภทของคู่ประโยคภาษาอังกฤษ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ คันธารัตน์ อเนกบุณย์	พัฒนันท์ อ้นประเสริฐ	วิทยานิพนธ์/Thesis