Thông tin chung

  English

  Đề tài NC khoa học
  Bài báo, báo cáo khoa học
  Hướng dẫn Sau đại học
  Sách và giáo trình
  Các học phần và môn giảng dạy
  Giải thưởng khoa học, Phát minh, sáng chế
  Khen thưởng
  Thông tin khác

  Tài liệu tham khảo

  Hiệu chỉnh

 
Số người truy cập: 107,096,128

 LSTM FOR HUMAN ACTIVITY RECOGNITION BASED ON FEATURE EXTRACTION METHOD USING CONFORMAL GEOMETRIC ALGEBRA
Tác giả hoặc Nhóm tác giả: Nguyen Nang Hung Van, Pham Minh Tuan, Do Phuc Hao, Kanta Tachibana
Nơi đăng: Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Số: 1;Từ->đến trang: 174-181;Năm: 2021
Lĩnh vực: Công nghệ thông tin; Loại: Bài báo khoa học; Thể loại: Trong nước
TÓM TẮT
Trong những năm gần đây, Học sâu là một trong những nghiên cứu có tính thời sự trong lĩnh vực xử lý ngôn ngữ tự nhiên, xử lý ảnh và nhận dạng hành động. Học sâu có hai mô hình chính là Mạng Nơ-ron tích chập được áp dụng để trích chọn đặc trưng trong xử lý hình ảnh và Mạng Nơ-ron hồi quy được áp dụng trong nhận dạng chuỗi thời gian. Tuy nhiên, kiến ​​trúc của mạng Nơ-ron hồi quy khá đơn giản và khả năng ghi nhớ những thông tin từ xa không tốt. Nên những thông tin trong chuỗi đầu vào thường không có nhiều ảnh hưởng đến kết quả dự đoán chuỗi đầu ra của các bước sau. Do đó, Mạng nhớ ngắn hạn hồi tiếp (LSTM) được thiết kế để khắc phục những hạn chế của mạng Nơ-ron hồi quy. Hơn nữa, dữ liệu đầu vào trong các mô hình huấn luyện thường có số chiều cao nên chi phí tính toán lớn và dẫn đến độ chính xác nhận dạng không cao. Để giải quyết vấn đề này, một số nghiên cứu trước đây như Phân tích thành phần chính (PCA), Hồi quy thành phần chính (PCR) và Phân tích biệt thức tuyến tính (LDA) được đề xuất để giảm số chiều của dữ liệu và độ phức tạp cho các mô hình học máy. Tuy nhiên, các phương pháp này, đã sử dụng các phép biến đổi tuyến tính và giả sử dữ liệu được phân phối trên một mặt phẳng hoặc siêu mặt phẳng đặc biệt nào đó. Nên dẫn đến những khó khăn nhất định đối với dữ liệu phân bố trên hình cầu hay siêu cầu, chẳng hạn như các đối tượng chuyển động quay trong không gian nhiều chiều. Vì vậy, nghiên cứu này đã đề xuất phương pháp trích chọn đặc trưng sử dụng Đại số hình học bảo giác (CGA) để giảm số chiều dữ liệu cho LSTM huấn luyện và nhận dạng. Đầu tiên, dữ liệu hành động được tiến hành xử lý để chuẩn hóa dữ liệu. Tiếp theo, đề xuất phương pháp trích chọn đặc trưng sử dụng CGA để giảm số chiều dữ liệu và tạo vectơ đặc trưng. Cuối cùng, sử dụng LSTM để huấn luyện và nhận dạng hành động. Thực nghiệm được tiến hành trên bộ dữ liệu CMU với 8 hành động khác nhau và kết quả cho thấy phương pháp đề xuất có kết quả cao hơn các phương pháp trước đó.
ABSTRACT
Deep Learning (DL) is a new research trend in recent years for many applications, such as image processing, object detection, and remote control. DL has two main models: Convolutional Neural Network (CNN) used to feature extraction in image processing, and Recurrent Neural Network (RNN) used to handle sequence identification (sequence/time-series). However, the architecture of RNN is quite simple and the ability to remember information from long-distance data is not good. Therefore, the first information in the input sequence usually does not have much influence on the output sequence prediction results of the following steps. So the Long Short Term Memory (LSTM) is designed to overcome this problem. Furthermore, training data with high numbers can lead to memory overflow or low classification accuracy. To solve this problem, Some commonly used machine learning models, such as Principal Components Analysis (PCA), Principal Components Regression (PCR), and Linear Discriminant Analysis (LDA), were proposed to reduce dimensions of the data and computational complexity simultaneously for training models. However, these methods, which use linear transformations, should work well only when the data is distributed on a plane or hyper-plane. Therefore, in this paper, we propose to use Conformal Geometric Algebra (CGA) to feature extraction and reduce dimensions of the data. First, the action data is preprocessed to normalize the data. Next, use CGA to reduce dimensions of data and create feature vectors. Finally, use the LSTM for training and prediction. The experiment was conducted on the CMU dataset with 8 different actions and the results showed that the proposed method has higher results than the previous methods.
© Đại học Đà Nẵng
 
 
Địa chỉ: 41 Lê Duẩn Thành phố Đà Nẵng
Điện thoại: (84) 0236 3822 041 ; Email: dhdn@ac.udn.vn