Home
Giới thiệu
Tài khoản
Đăng nhập
Quên mật khẩu
Đổi mật khẩu
Đăng ký tạo tài khoản
Liệt kê
Công trình khoa học
Bài báo trong nước
Bài báo quốc tế
Sách và giáo trình
Thống kê
Công trình khoa học
Bài báo khoa học
Sách và giáo trình
Giáo sư
Phó giáo sư
Tiến sĩ
Thạc sĩ
Lĩnh vực nghiên cứu
Tìm kiếm
Cá nhân
Nội dung
Góp ý
Hiệu chỉnh lý lịch
Thông tin chung
English
Đề tài NC khoa học
Bài báo, báo cáo khoa học
Hướng dẫn Sau đại học
Sách và giáo trình
Các học phần và môn giảng dạy
Giải thưởng khoa học, Phát minh, sáng chế
Khen thưởng
Thông tin khác
Tài liệu tham khảo
Hiệu chỉnh
Số người truy cập: 109,415,571
Ứng dụng CRF nhận dạng thực thể định danh trong văn bản tiếng Việt
Tác giả hoặc Nhóm tác giả:
PGS.TS. Võ Trung Hùng*; Lâm Tùng Giang; Trần Thị Liên
marriage affairs
all wife cheat
i want an affair
Nơi đăng:
Tạp chí Khoa học Công nghệ ĐHĐN
cvs weekly sale
shauneutsey.com
prescription savings cards
;
S
ố:
Số 9(82).2014;
Từ->đến trang
: 55;
Năm:
2014
Lĩnh vực:
Xã hội nhân văn;
Loại:
Bài báo khoa học;
Thể loại:
Trong nước
TÓM TẮT
Nhận dạng các thực thể định danh là một lĩnh vực đang nhận được sự quan tâm rộng rãi của các nhà nghiên cứu. Đã có nhiều kết quả trong lĩnh vực này trong một số ngôn ngữ như Anh, Pháp, Trung Quốc,… nhưng với Tiếng Việt thì còn hạn chế. Mục đích nghiên cứu để xây dựng một hệ thống nhận dạng thực thể cho phép nhận dạng các thực thể có tên trong văn bản Tiếng Việt như tên người, địa điểm, tổ chức, thời gian,… được phát triển dựa trên công cụ CRF++. Nhiệm vụ chính là xây dựng một tập dữ liệu tốt, đầy đủ, chính xác nhằm hỗ trợ cho việc nhận dạng thực thể và xây dựng một hệ thống huấn luyện, kiểm thử và ứng dụng. Hệ thống nhận dạng thực thể đã thực nghiệm trên 300 bài báo với nhiều lĩnh vực khác nhau và hoạt động có tính khả thi cao với độ đo F1 trung bình qua 10 lần thực nghiệm đạt 84,8%.
ABSTRACT
Named Entity Recognition, a subfield of Information Extration, is getting wide attention. Researches with English, French or Chinese produce good results but there are not many works with Vietnamese. The purpose of this study is building a named entity recognition system allowing identification of named entities such as person name, location, organization, time in Vietnamese texts by using CRF + + tool. The main task is creating tools and training data for building a named entity recognition model to facilitate the identification of the entities in vienamese documents. The Entity Recognition system was evaluated 10 times on over 300 papers and gives the average F1 measure of 84,8%.
© Đại học Đà Nẵng
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn