แจ้งเอกสารไม่ครบถ้วน, ไม่ตรงกับชื่อเรื่อง หรือมีข้อผิดพลาดเกี่ยวกับเอกสาร ติดต่อที่นี่ ==>
หากไม่มีอีเมลผู้รับให้กรอก thailis-noc@uni.net.th ติดต่อเจ้าหน้าที่เจ้าของเอกสาร กรณีเอกสารไม่ครบหรือไม่ตรง

Spoof detection using voice contribution on LFCC features and ResNet-34

keyword: Replay attack
; Speech synthesis
; Voice conversion
; LFCC
; ResNet-34
; ASVspoof
; Spoof detection
Abstract: Recent advancements in biometric authentication, particularly within the realm of speaker verification, have been notable. However, despite these strides, the persisting vulnerability to spoofing attacks is evident, necessitating specialized measures for detection across various attack types. This study focuses specifically on the identification of replay, speech synthesis, and voice conversion attacks. Our approach to spoof detection involves the utilization of linear frequency cepstral coefficients (LFCC) for the extraction of front-end features, coupled with ResNet-34 for the discrimination between genuine and spoofed speech samples. Through the integration of LFCC with ResNet-34, we rigorously evaluated our proposed method using the ASVspoof 2019 dataset. We investigated scenarios involving Physical Access (PA), focusing on replay attacks, and Logical Access (LA), which encompassed speech synthesis and voice conversion attacks. In our investigation, we compare the efficacy of utilizing the entire utterance for feature extraction against an alternative method that extracts features from a specific segment of the voice within the utterance for classification. Additionally, we conducted a comprehensive evaluation by benchmarking our proposed method against established baseline techniques, namely linear frequency cepstral coefficients - gaussian mixture model (LFCC-GMM) and constant Q cepstral coefficients - gaussian mixture model (CQCC-GMM), as well as contemporary state-of-the-art approaches. The results of our study demonstrate promising performance outcomes. Specifically, our proposed method achieves an equal error rate (EER) of 1.85% and 2.74% for replay attacks (PA) in the development and evaluation datasets, respectively. For voice conversion and speech synthesis attacks (LA), the method attains EER of 0.01% and 5.16% in the corresponding datasets. These findings underscore the effectiveness of our method in identifying spoof attacks across both PA and LA scenarios. Furthermore, we extend our analysis by conducting cross-dataset validation and addressing gender bias to thoroughly evaluate the robustness and generalizability of our model. These additional assessments provide further insights into the performance and reliability of our proposed approach in real-world settings.
Thammasat University. Thammasat University Library
Address: BANGKOK
Email: preserv@tu.ac.th
Role: advisor
Created: 2024
Modified: 2024-11-29
Issued: 2024-11-29
วิทยานิพนธ์/Thesis
application/pdf
eng
©copyrights Thammasat University
RightsAccess:
ลำดับที่.ชื่อแฟ้มข้อมูล ขนาดแฟ้มข้อมูลจำนวนเข้าถึง วัน-เวลาเข้าถึงล่าสุด
1 15794Mon.pdf 963.46 KB
ใช้เวลา
0.027926 วินาที

Mon, Khaing Zar
Title Contributor Type
Spoof detection using voice contribution on LFCC features and ResNet-34
มหาวิทยาลัยธรรมศาสตร์
Mon, Khaing Zar
Pakinee Aimmanee
วิทยานิพนธ์/Thesis
Pakinee Aimmanee
Title Creator Type and Date Create
Iterative nick thresholding region growing for hemorrhage and exudate detection and segmentation to prescreen diabetic retinopathy
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Patsaphon Chandhakanond
วิทยานิพนธ์/Thesis
A novel approach on candidate generation for automatic English to Chinese medical term translation using data mining with web data
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Cholwich Nattee
Qu, Jian
วิทยานิพนธ์/Thesis
The automated system for glaucoma and diabetic retinopathy pre-screening in mobile phone retinal images
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Thayanee Ruennark
วิทยานิพนธ์/Thesis
Semantic object classification using a similarity-based instance checking algorithm in description logics
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Boontawee Santisrivaraporn
Suwan Tongphu
วิทยานิพนธ์/Thesis
OD localization using vessel based image orientation independent approaches
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Bodeetorn Sutcharit
วิทยานิพนธ์/Thesis
Optic disk localization and segmentation in retinal images using vessel based feature projection approaches and active contour model
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Khaing, Tin Tin
วิทยานิพนธ์/Thesis
Techniques for audio and speech information hiding based on singular-spectrum analysis and applications in service sector
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Unoki, Masashi
Jessada Karnjana
วิทยานิพนธ์/Thesis
Optic disk detection and segmentation approaches based on vessel network
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Makhanov, Stanislav S.
Nittaya Muangnak
วิทยานิพนธ์/Thesis
Optic disc localization using vessel clustering and rotational 2D vessel projection
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Makhanov, Stanislav S.
Pongsate Tangseng
วิทยานิพนธ์/Thesis
In-car speech recognition for retrieving traffic information from internet
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Chowich Nattee
Surasak Boonkla
วิทยานิพนธ์/Thesis
Landslide detection from satellite imagery using change detection and machine learning
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Asadang Tanatipuknon
วิทยานิพนธ์/Thesis
Optic disc segmentation applied to retinal images with glaucoma, diabetic retinopathy, and optic disc edema
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Haneishi, Hideaki
Khaing, Tin Tin
วิทยานิพนธ์/Thesis
Techniques for manipulation detection in speech signal using machine learning and acoustic signal processing
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Unoki, Masashi
Kasorn Galajit
วิทยานิพนธ์/Thesis
Automatic optic disc segmentation for edema classification and severity grading
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Naing, Seint Lei
วิทยานิพนธ์/Thesis
Pre-screening of healthy retinal using geometrical features extracted from OCT retinal images
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee;Somrudee Deepaisarn
Hussain, Mohamed Shahud
วิทยานิพนธ์/Thesis
Automatic localization of retinal neovascularization in optical coherence tomography angiography images using feature maps analysis
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Tun, Yar Zar
วิทยานิพนธ์/Thesis
Spoof detection using voice contribution on LFCC features and ResNet-34
มหาวิทยาลัยธรรมศาสตร์
Pakinee Aimmanee
Mon, Khaing Zar
วิทยานิพนธ์/Thesis
Copyright 2000 - 2026 ThaiLIS Digital Collection Working Group. All rights reserved.
ThaiLIS is Thailand Library Integrated System
สนับสนุนโดย สำนักงานบริหารเทคโนโลยีสารสนเทศเพื่อพัฒนาการศึกษา
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม
328 ถ.ศรีอยุธยา แขวง ทุ่งพญาไท เขต ราชเทวี กรุงเทพ 10400 โทร. โทร. 02-232-4000
กำลัง ออน์ไลน์
ภายในเครือข่าย ThaiLIS จำนวน 6
ภายนอกเครือข่าย ThaiLIS จำนวน 1,987
รวม 1,993 คน

More info..
นอก ThaiLIS = 522,559 ครั้ง
มหาวิทยาลัยสังกัดทบวงเดิม = 161 ครั้ง
มหาวิทยาลัยราชภัฏ = 25 ครั้ง
หน่วยงานอื่น = 6 ครั้ง
มหาวิทยาลัยเทคโนโลยีราชมงคล = 5 ครั้ง
รวม 522,756 ครั้ง
Database server :
Version 2.5 Last update 1-06-2018
Power By SUSE PHP MySQL IndexData Mambo Bootstrap
มีปัญหาในการใช้งานติดต่อผ่านระบบ UniNetHelp


Server : 8.199.134
Client : Not ThaiLIS Member
From IP : 216.73.216.104