Desenvolvimento de uma abordagem para reconhecimento contínuo da Língua Brasileira de Sinais utilizando imagens dinâmicas e técnicas de aprendizagem profunda.
dc.contributor.advisor | Cámara Chávez, Guillermo | pt_BR |
dc.contributor.author | Escobedo Cárdenas, Edwin Jonathan | |
dc.contributor.referee | Cámara Chávez, Guillermo | pt_BR |
dc.contributor.referee | Ferreira, Anderson Almeida | pt_BR |
dc.contributor.referee | Gomes, David Menotti | pt_BR |
dc.contributor.referee | Luz, Eduardo José da Silva | pt_BR |
dc.contributor.referee | Schwartz, William Robson | pt_BR |
dc.date.accessioned | 2021-02-05T15:24:38Z | |
dc.date.available | 2021-02-05T15:24:38Z | |
dc.date.issued | 2020 | pt_BR |
dc.description | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. | pt_BR |
dc.description.abstract | Durante os últimos anos, têm sido desenvolvidas diversas abordagens para o reconhecimento contínuo de línguas de sinais para melhorar a qualidade de vida das pessoas surdas e diminuir a barreira de comunicação entre elas e a sociedade. Analogamente, a incorporação do dispositivo Microsoft Kinect gerou uma revolução na área de visão computacional, fornecendo novas informações multimodais (dados RGB-D e do esqueleto) que podem ser utilizadas para gerar ou aprender novos descritores robustos e melhorar as taxas de reconhecimento em diversos problemas. Assim, nessa pesquisa de doutorado, apresenta-se uma metodologia para o reconhecimento de sinais contínuos da Língua Brasileira de Sinais (LIBRAS) utilizando como dados de entrada de um sinal as informações fornecidas pelo dispositivo Kinect. Diferentemente dos outros trabalhos na literatura, que utilizam arquiteturas de redes mais complexas (como as 3DCNN e BLSTM), o método proposto utiliza janelas deslizantes para procurar segmentos candidatos de serem sinais dentro de um fluxo continuo de video. Do mesmo modo, propõe-se o uso de imagens dinâmicas para codificar as informações espaço-temporais fornecidas pelo Kinect. Assim, pode-se reduzir a complexidade da arquitetura CNN proposta para o reconhecimento dos sinais. Finalmente, baseado no conceito de pares mínimos, um novo banco de dados da Língua Brasileira de Sinais chamado LIBRAS-UFOP é proposto. A base LIBRAS-UFOP possui tanto sinais isolados (56 classes de sinais) como sinais contínuos (37 classes); nós avaliamos nosso método usando essa base e o comparamos com os métodos propostos na literatura. Os resultados experimentais nos datasets LIBRAS-UFOP e LSA64 demostraram a validade do método proposto baseado em imagens dinâmicas como uma alternativa para o reconhecimento de língua de sinais. | pt_BR |
dc.description.abstracten | In the last years, several approaches have been developed for continuous sign language recognition to improve the quality of life of hearingimpaired people and reduce the communication barrier between them and society. Similarly, the incorporation of the Microsoft Kinect device originated the computer vision revolution, providing new multimodal information (RGB-D and skeleton data) that can be used to generate or learn new robust descriptors and improve data recognition rates in several problems. Thus, in this doctoral research, we propose a methodology for the continuous recognition of Brazilian sign language (LIBRAS), using as input data from a sign the information provided by the Kinect device. Unlike other works in the literature that use more complex network architectures (such as 3DCNN and BLSTM), the proposed method uses sliding windows to search for candidate segments of being signs within a continuous flow of video. Likewise, we proposed to use dynamic images to encode the spatiotemporal information provided by the Kinect. Thus, we can reduce the complexity of the proposed CNN architecture for sign recognition. Finally, based on the concept of minimal pairs, a new dataset of Brazilian Sign Language called LIBRAS-UFOP is proposed. The LIBRAS-UFOP dataset is composed of isolated signs (56 classes) and continuous signs (37 classes); we evaluate our method on this dataset and compare it with state-of-the-art methods. The experimental results on LIBRAS-UFOP and LSA64 datasets proved the feasibility of the proposed method as an alternative to sign language recognition. | pt_BR |
dc.identifier.citation | ESCOBEDO CÁRDENAS, Edwin Jonathan. Desenvolvimento de uma abordagem para reconhecimento contínuo da Língua Brasileira de Sinais utilizando imagens dinâmicas e técnicas de aprendizagem profunda. 2020. 146 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2019. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufop.br/handle/123456789/13079 | |
dc.language.iso | pt_BR | pt_BR |
dc.rights | aberto | pt_BR |
dc.rights.license | Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 29/01/2021 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais. | pt_BR |
dc.subject | Aprendizado profundo | pt_BR |
dc.subject | Transferência de aprendizagem | pt_BR |
dc.subject | Língua de sinais | pt_BR |
dc.title | Desenvolvimento de uma abordagem para reconhecimento contínuo da Língua Brasileira de Sinais utilizando imagens dinâmicas e técnicas de aprendizagem profunda. | pt_BR |
dc.type | Tese | pt_BR |
Arquivos
Pacote original
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- TESE_DesenvolvimentoAbordagemReconhecimento.pdf
- Tamanho:
- 14.67 MB
- Formato:
- Adobe Portable Document Format
Licença do pacote
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- license.txt
- Tamanho:
- 924 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição: