Cobre o conteúdo enquanto carrega
As votações estão encerradas. Confira os projetos mais populares.
Projeto

SOC-1582: Comparativo entre técnicas de machine learning para identificar erros em palavras homófonas e parônimas na língua portuguesa

Ícone
SOC

Ciências Sociais e Aplicadas

Sub-categoria

Ciência da Informação

Play
ícone Autoria Laura Esther Correia Jeronimo
ícone Orientação Cintia Maria de Araújo Pinho, Anderson Silva Vanin
ícone Instituição Etec Profa. Maria Cristina Medeiros
ícone Etapa Finalista

Resumo

A língua portuguesa é conhecida por ser complexa, assim, os alunos de ensino fundamental e médio apresentam uma proficiência abaixo da média. Dessa forma, o uso da tecnologia pode auxiliar a suprir a defasagem desse público, em especial a Inteligência Artificial (IA). Uma IA orientada para a educação pode colaborar para o aprendizado dos estudantes e a automatização de processos, como avaliações, detecção de erros e feedbacks de atividades. Sendo assim, o objetivo deste trabalho é desenvolver uma solução capaz de facilitar a identificação de palavras que são homófonas e parônimas comparando as melhores técnicas de Aprendizado de Máquina (AM) para tal finalidade. A metodologia utilizada neste estudo é de natureza aplicada e experimental, a base de dados para a condução dos experimentos é de em média 6 mil frases fornecidas por uma startup que faz correções de redações. No total, foram classificadas em média 45 palavras homófonas e parônimas e neste estudo serão demonstrados os resultados de cinco dessas. Os algoritmos que performaram melhor foram Gradient Boosting Classifier e SGDClassifier, em média com uma acurácia de 93,5%. Como resultado, é esperado que a Startup CRIA, apoiadora do projeto, utilize a solução apresentada.

Palavras-chave: Inteligência Artificial, Parônimas e Homônimas, Processamento de Linguagem Natural

Foto do projeto