Home
Giới thiệu
Tài khoản
Đăng nhập
Quên mật khẩu
Đổi mật khẩu
Đăng ký tạo tài khoản
Liệt kê
Công trình khoa học
Bài báo trong nước
Bài báo quốc tế
Sách và giáo trình
Thống kê
Công trình khoa học
Bài báo khoa học
Sách và giáo trình
Giáo sư
Phó giáo sư
Tiến sĩ
Thạc sĩ
Lĩnh vực nghiên cứu
Tìm kiếm
Cá nhân
Nội dung
Góp ý
Hiệu chỉnh lý lịch
Thông tin chung
English
Đề tài NC khoa học
Bài báo, báo cáo khoa học
Hướng dẫn Sau đại học
Sách và giáo trình
Các học phần và môn giảng dạy
Giải thưởng khoa học, Phát minh, sáng chế
Khen thưởng
Thông tin khác
Tài liệu tham khảo
Hiệu chỉnh
Số người truy cập: 106,069,140
Giải pháp chuẩn hóa các kho ngữ liệu dùng trong lĩnh vực dịch tự động
Tác giả hoặc Nhóm tác giả:
Đặng Đại Thọ, Huỳnh Công Pháp
Nơi đăng:
Tạp chí Khoa học Công nghệ Đại học Đà Nẵng;
S
ố:
SỐ 9(58), QUYỂN 3;
Từ->đến trang
: 111-117;
Năm:
2012
Lĩnh vực:
Công nghệ thông tin;
Loại:
Bài báo khoa học;
Thể loại:
Trong nước
TÓM TẮT
Hiện nay, nhu cấu sử dụng và khai thác dữ liệu để xây dựng các hệ thống dịch tự động là rất lớn. Tuy nhiên, chi phí cho việc thu thập và xây dựng một kho ngữ liệu mới đủ lớn và có chất lượng để có thể dùng được đối với hệ thống dịch tự động là rất cao. Trong khi đó, các kho ngữ liệu đang có trên thực tế lại có cấu trúc và định dạng khác nhau nên việc chia sẽ và khai thác chúng gặp rất nhiều khó khăn. Trong bài báo này, chúng tôi đề xuất một cấu trúc và định dạng chuẩn cho phép biểu diễn và lưu trữ các kho ngữ liệu dùng trong lĩnh vực dịch tự động, để từ đó cho phép việc khai thác, chia sẻ và sử dụng các kho ngữ liệu này một cách thuận tiện và hiệu quả.
marriage affairs
blog.ivanovtech.com
i want an affair
walgreens pharmacy coupon
link
promo codes walgreens
ABSTRACT
Currently, the demand of using and exploiting corpora for launching Machine Translation (MT) has been large. However, the cost of acquiring and constructing a new corpus usable for the MT is high. Whereas, existing corpora have different structures and formats, hence sharing and exploiting these corpora are very challenging. In this paper, we propose a common structure and format that allow us to represent the MT corpora so that the expoitation and sharing of these corpora become more convenient and efficient.
© Đại học Đà Nẵng
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn