Home
Giới thiệu
Tài khoản
Đăng nhập
Quên mật khẩu
Đổi mật khẩu
Đăng ký tạo tài khoản
Liệt kê
Công trình khoa học
Bài báo trong nước
Bài báo quốc tế
Sách và giáo trình
Thống kê
Công trình khoa học
Bài báo khoa học
Sách và giáo trình
Giáo sư
Phó giáo sư
Tiến sĩ
Thạc sĩ
Lĩnh vực nghiên cứu
Tìm kiếm
Cá nhân
Nội dung
Góp ý
Hiệu chỉnh lý lịch
Thông tin chung
English
Đề tài NC khoa học
Bài báo, báo cáo khoa học
Hướng dẫn Sau đại học
Sách và giáo trình
Các học phần và môn giảng dạy
Giải thưởng khoa học, Phát minh, sáng chế
Khen thưởng
Thông tin khác
Tài liệu tham khảo
Hiệu chỉnh
Số người truy cập: 112,298,152
A Domain indicating method for Ede terminology in building a Vietnamese-Ede bilingual corpus
abortion stories gone wrong
information about abortions
teenage abortion facts
Tác giả hoặc Nhóm tác giả:
Hoàng Thị Mỹ Lệ, Phan Huy Khánh
walgreens prints coupons
rx coupons printable
free printable coupons
Nơi đăng:
Proceedings of The Third Asian Conference on Information Systems ACIS 2014;
S
ố:
ACIS2014;
Từ->đến trang
: 419-424;
Năm:
2014
Lĩnh vực:
Công nghệ thông tin;
Loại:
Bài báo khoa học;
Thể loại:
Quốc tế
TÓM TẮT
Trong lĩnh vực xử lý ngôn ngữ tự nhiên, các kho ngữ liệu đơn ngữ hay đa ngữ luôn là một nguồn tài nguyên không thể thiếu, phục vụ cho nhiều mục đích sử dụng khác nhau. Chất lượng của kho ngữ liệu đa ngữ có vai trò quyết định đối với chất lượng đầu ra của một hệ thống ứng dụng, như dịch máy, phân tích và tổng hợp văn bản, v.v… Đã có các kho ngữ liệu cho tiếng Việt (Kinh) nhưng hiện nay vẫn chưa có các kho ngữ liệu song ngữ Việt-Êđê sử dụng Unicode để phục vụ nhu cầu xử lý tiếng Êđê, từ các hoạt động nghiên cứu lý thuyết đến ứng dụng thực tiễn. Bài báo đề xuất giải pháp xây dựng kho ngữ liệu song ngữ Việt-Êđê trên cơ sở phân loại và gắn nhãn các thuật ngữ theo miền ứng dụng. Sau khi triển khai cài đặt, nguồn tài nguyên này bao gồm các thuật ngữ về lĩnh vực giáo dục như chăn nuôi, trồng trọt, bảo vệ rừng, chăm sóc sức khỏe, v.v… hướng đến phục vụ cho các dân tộc thiểu số ở Việt Nam. Giải pháp cũng giải quyết vấn đề loại bỏ nhập nhằng ngữ nghĩa trong một hệ thống dịch máy văn bản từ tiếng Việt sang tiếng Êđê trong một bối cảnh hạn chế.
unfaithful spouse
infidelity
i dreamed my husband cheated on me
cvs weekly sale
cvs print
prescription savings cards
ABSTRACT
In the natural language processing, the monolingual and multilingual corpora for different domains and specialties are always an indispensable resource. The quality of a multilingual corpus plays a decisive role in the output quality of the translation system such as analysis and synthesis of texts, machine translation etc. Especially, the statistical machine translation systems will not produce a reasonable output, if the quality of corpus used in the training process is not good. Currently, there is no Vietnamese-Ede multilingual corpus using Unicode fonts that have been officially announced. Increasing demands on the resource is shared for research activities from theory to practice. From that, the paper proposes a solution indicating domain for Ede terminology which is applied to build a Vietnamese-Ede bilingual corpus. It contains the terminology in the domain of education about animal husbandry, cultivation, forest protection, health care, etc. for the ethnic minority in Vietnam. This solution has also partially solved ambiguity problems in a machine translation system from Vietnamese into Ede language in a restrict context.
© Đại học Đà Nẵng
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn