Thông tin chung

  English

  Đề tài NC khoa học
  Bài báo, báo cáo khoa học
  Hướng dẫn Sau đại học
  Sách và giáo trình
  Các học phần và môn giảng dạy
  Giải thưởng khoa học, Phát minh, sáng chế
  Khen thưởng
  Thông tin khác

  Tài liệu tham khảo

  Hiệu chỉnh

 
Số người truy cập: 109,415,571

 Ứng dụng CRF nhận dạng thực thể định danh trong văn bản tiếng Việt
Tác giả hoặc Nhóm tác giả: PGS.TS. Võ Trung Hùng*; Lâm Tùng Giang; Trần Thị Liên
marriage affairs all wife cheat i want an affair
Nơi đăng: Tạp chí Khoa học Công nghệ ĐHĐN
cvs weekly sale shauneutsey.com prescription savings cards
; Số: Số 9(82).2014;Từ->đến trang: 55;Năm: 2014
Lĩnh vực: Xã hội nhân văn; Loại: Bài báo khoa học; Thể loại: Trong nước
TÓM TẮT
Nhận dạng các thực thể định danh là một lĩnh vực đang nhận được sự quan tâm rộng rãi của các nhà nghiên cứu. Đã có nhiều kết quả trong lĩnh vực này trong một số ngôn ngữ như Anh, Pháp, Trung Quốc,… nhưng với Tiếng Việt thì còn hạn chế. Mục đích nghiên cứu để xây dựng một hệ thống nhận dạng thực thể cho phép nhận dạng các thực thể có tên trong văn bản Tiếng Việt như tên người, địa điểm, tổ chức, thời gian,… được phát triển dựa trên công cụ CRF++. Nhiệm vụ chính là xây dựng một tập dữ liệu tốt, đầy đủ, chính xác nhằm hỗ trợ cho việc nhận dạng thực thể và xây dựng một hệ thống huấn luyện, kiểm thử và ứng dụng. Hệ thống nhận dạng thực thể đã thực nghiệm trên 300 bài báo với nhiều lĩnh vực khác nhau và hoạt động có tính khả thi cao với độ đo F1 trung bình qua 10 lần thực nghiệm đạt 84,8%.
ABSTRACT
Named Entity Recognition, a subfield of Information Extration, is getting wide attention. Researches with English, French or Chinese produce good results but there are not many works with Vietnamese. The purpose of this study is building a named entity recognition system allowing identification of named entities such as person name, location, organization, time in Vietnamese texts by using CRF + + tool. The main task is creating tools and training data for building a named entity recognition model to facilitate the identification of the entities in vienamese documents. The Entity Recognition system was evaluated 10 times on over 300 papers and gives the average F1 measure of 84,8%.
© Đại học Đà Nẵng
 
 
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn