Thông tin chung

  English

  Đề tài NC khoa học
  Bài báo, báo cáo khoa học
  Hướng dẫn Sau đại học
  Sách và giáo trình
  Các học phần và môn giảng dạy
  Giải thưởng khoa học, Phát minh, sáng chế
  Khen thưởng
  Thông tin khác

  Tài liệu tham khảo

  Hiệu chỉnh

 
Số người truy cập: 107,009,864

 Một giải pháp Việt hoá cách phát âm các từ vựng tiếng Anh trong văn bản tiếng Việt
Tác giả hoặc Nhóm tác giả: Triệu Thị Ly Ly, Bùi Thanh Sơn, Lê Thị Hà Bình, Ninh Khánh Duy
Nơi đăng: Kỷ yếu Hội nghị Quốc gia lần thứ X về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Số: 2017;Từ->đến trang: 502-510;Năm: 2017
Lĩnh vực: Công nghệ thông tin; Loại: Báo cáo; Thể loại: Trong nước
TÓM TẮT
Các ứng dụng liên quan đến xử lý ngôn ngữ tự nhiên và tiếng nói cho tiếng Việt thường gặp khó khăn khi văn bản đầu vào chứa các từ ngữ của tiếng nước ngoài, trong đó phổ biến nhất là tiếng Anh. Để có thể xử lý văn bản một cách đầy đủ, các từ ngữ nước ngoài này cần được phiên âm sang một dạng có thể đánh vần được trong tiếng Việt. Bài báo này đưa ra một giải pháp Việt hóa cách phát âm các từ vựng tiếng Anh dựa trên từ điển CMU và các quy tắc ngôn ngữ học. Bằng việc nghiên cứu sự tương đồng về ngữ âm giữa tiếng Anh và tiếng Việt cùng với các quy tắc ghép âm vần, thanh điệu trong tiếng Việt, chúng tôi đã tạo bảng ánh xạ từ một âm vị tiếng Anh sang một âm vị tiếng Việt và triển khai thuật toán tách một chuỗi âm vị tiếng Anh thành các âm tiết tương ứng trong tiếng Việt. Từ đó chúng tôi xây dựng được một công cụ tự động phiên âm một từ vựng tiếng Anh bất kỳ thành chuỗi âm tiết tiếng Việt. Công cụ này đã được tích hợp vào một phần mềm chuyển văn bản thành tiếng nói và cho thấy tính hữu dụng của nó.
ABSTRACT
In regard of applications of natural language processing and speech processing, text normalization is a vital problem since the input text often consists of many non-standard words such as abbreviations, numbers and foreign words. This paper introduces a solution for English transliteration to Vietnamese. By researching the pronunciation similarity and phonetic equipvalent, we establish an algorithm that split English phonemes into syllables that is able to be pronounced in Vietnamese and create English phonemes in CMU dictionary to Vietnamese phonemes mapping. Based on that, a tool is built to spell an arbitrary English word into Vietnamese syllables. This tool has been incorporated into a text-to-speech software and therefore demonstrates its usefulness.
© Đại học Đà Nẵng
 
 
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn