Thông tin chung

  English

  Đề tài NC khoa học
  Bài báo, báo cáo khoa học
  Hướng dẫn Sau đại học
  Sách và giáo trình
  Các học phần và môn giảng dạy
  Giải thưởng khoa học, Phát minh, sáng chế
  Khen thưởng
  Thông tin khác

  Tài liệu tham khảo

  Hiệu chỉnh

 
Số người truy cập: 106,069,140

 Giải pháp chuẩn hóa các kho ngữ liệu dùng trong lĩnh vực dịch tự động
Tác giả hoặc Nhóm tác giả: Đặng Đại Thọ, Huỳnh Công Pháp
Nơi đăng: Tạp chí Khoa học Công nghệ Đại học Đà Nẵng; Số: SỐ 9(58), QUYỂN 3;Từ->đến trang: 111-117;Năm: 2012
Lĩnh vực: Công nghệ thông tin; Loại: Bài báo khoa học; Thể loại: Trong nước
TÓM TẮT
Hiện nay, nhu cấu sử dụng và khai thác dữ liệu để xây dựng các hệ thống dịch tự động là rất lớn. Tuy nhiên, chi phí cho việc thu thập và xây dựng một kho ngữ liệu mới đủ lớn và có chất lượng để có thể dùng được đối với hệ thống dịch tự động là rất cao. Trong khi đó, các kho ngữ liệu đang có trên thực tế lại có cấu trúc và định dạng khác nhau nên việc chia sẽ và khai thác chúng gặp rất nhiều khó khăn. Trong bài báo này, chúng tôi đề xuất một cấu trúc và định dạng chuẩn cho phép biểu diễn và lưu trữ các kho ngữ liệu dùng trong lĩnh vực dịch tự động, để từ đó cho phép việc khai thác, chia sẻ và sử dụng các kho ngữ liệu này một cách thuận tiện và hiệu quả.
marriage affairs blog.ivanovtech.com i want an affair
walgreens pharmacy coupon link promo codes walgreens
ABSTRACT
Currently, the demand of using and exploiting corpora for launching Machine Translation (MT) has been large. However, the cost of acquiring and constructing a new corpus usable for the MT is high. Whereas, existing corpora have different structures and formats, hence sharing and exploiting these corpora are very challenging. In this paper, we propose a common structure and format that allow us to represent the MT corpora so that the expoitation and sharing of these corpora become more convenient and efficient.
© Đại học Đà Nẵng
 
 
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn