Thông báo sau đại học

Thầy Cao Xuân Nam bảo vệ thành công Luận án Tiến sĩ ngành Khoa học máy tính

11-02-2026 16:12


Sáng ngày 10/02/2026, buổi bảo vệ luận án Tiến sĩ của thầy Cao Xuân Nam đã được tổ chức và diễn ra thành công. Luận án có đề tài “Phát sinh video gương mặt người nói từ thông tin tiếng nói” (Speech-driven Talking Face Video Generation), được thực hiện dưới sự hướng dẫn khoa học của PGS.TS Trần Minh Triết và PGS.TS Vũ Hải Quân.

Hướng nghiên cứu có tính mới và giá trị thực tiễn cao

Trong luận án, tác giả tiếp cận bài toán phát sinh gương mặt người nói theo hướng gián tiếp, trong đó quá trình tái tạo gương mặt được thực hiện thông qua bước trung gian là dự đoán các điểm landmark từ tín hiệu âm thanh tiếng nói.

Việc sử dụng landmark giúp đảm bảo tính nhất quán giữa các bộ phận trên khuôn mặt, duy trì sự đồng bộ giữa chuyển động môi và nội dung âm thanh trước khi tổng hợp hình ảnh hoàn chỉnh. Đồng thời, hướng tiếp cận này góp phần nâng cao khả năng tổng quát hóa và thích ứng với các biến đổi trong dữ liệu đầu vào.

Những kết quả nổi bật của luận án

Luận án đã đạt được nhiều kết quả mới trong bài toán phát sinh khuôn mặt người nói từ âm thanh. Các đóng góp nổi bật bao gồm: chứng minh việc bổ sung đặc trưng LLFs bên cạnh MFCC và Mel-spectrogram giúp tăng độ chính xác dự đoán landmark trung bình khoảng 5–7% so với mô hình không sử dụng LLFs; xác định vai trò của thông tin landmark từ các khung hình trước trong việc cải thiện độ ổn định theo thời gian; nhấn mạnh hiệu quả của KLD loss trong việc căn chỉnh đặc trưng âm thanh và landmark trong cùng không gian tiềm ẩn nhằm nâng cao hiệu suất mô hình.

Bên cạnh đó, luận án đề xuất phương pháp tổng hợp khuôn mặt theo quy trình hai giai đoạn (từ vùng miệng đến toàn bộ khuôn mặt), giúp giảm sai số và cải thiện chất lượng ảnh theo các độ đo PSNR, SSIM, FID và LPIPS. Các mô hình đề xuất cũng được kiểm chứng hiệu quả và khả năng tổng quát hóa tốt trên các bộ dữ liệu MEAD, CREMA-D và dữ liệu thực tế.

Công bố khoa học là điểm nổi bật của luận án với 06 bài báo khoa học, bao gồm 02 bài trên tạp chí quốc tế Q1, 02 bài báo hội thảo xếp hạng B và 02 bài báo hội thảo xếp hạng C, thể hiện sự nghiêm túc và đóng góp rõ nét của tác giả trong lĩnh vực nghiên cứu.

Tiềm năng ứng dụng

Kết quả của luận án mở ra nhiều hướng ứng dụng quan trọng trong các lĩnh vực như trợ lý ảo, giao tiếp từ xa, giải trí số, phục hồi dữ liệu lịch sử, hỗ trợ người khiếm thị, pháp y, y tế và giáo dục. Đồng thời, đây cũng là nền tảng cho các nghiên cứu tiếp theo về nâng cao chất lượng hình ảnh, xử lý dữ liệu nhiễu, mở rộng đa ngôn ngữ và kiểm soát cảm xúc cho khuôn mặt ảo.

Buổi bảo vệ luận án Tiến sĩ của thầy Cao Xuân Nam là dấu mốc học thuật quan trọng, khẳng định chất lượng nghiên cứu và giá trị ứng dụng của đề tài, góp phần thúc đẩy các hướng nghiên cứu hiện đại trong lĩnh vực xử lý tiếng nói và thị giác máy tính.

Khoa Công nghệ thông tin trân trọng chúc mừng thầy Cao Xuân Nam và kính chúc thầy tiếp tục gặt hái nhiều thành công trong giảng dạy, nghiên cứu, đóng góp tích cực cho sự phát triển khoa học công nghệ và truyền cảm hứng cho các thế hệ sinh viên.

Các tin liên quan