Ciências Sociais e Aplicadas
Comunicação
Resumo
No presente estudo, foi realizada uma análise estatística comparando o comportamento temporal das entidades (pessoas, organizações, lugares, datas) identificadas nas fake news do segundo semestre de 2022, e as entidades identificadas nos trending topics do Twitter para o mesmo período. O objetivo era averiguar a ideia de que as notícias falsas são relativas ao período de divulgação no mundo real e acompanham os acontecimentos da sociedade em suas temáticas. Para tal, se hipotetizou que existiria uma correlação de comportamento e similaridade entre as duas distribuições de entidades. A extração de entidades foi feita de maneira automática por um algoritmo aberto de NER (Named Entity Recognition), sendo estes dados posteriormente tratados para análise. A averiguação estatística de correlação no comportamento das duas distribuições (entidades das fake news e entidades do Twitter) foi feita através de um teste de correlação de Spearman. A semelhança entre as duas distribuições foi também averiguada usando o teste U de Mann-Whitney. Após os testes e análises, a hipótese do estudo foi parcialmente refutada. A similaridade (segunda premissa da hipótese) entre as duas distribuições foi baixa, indicando que as fontes de dados usadas para análise eram muito heterogêneas (Twitter x Desinfopedia). Porém, foi, sim, identificada uma correlação moderada entre as entidades das duas bases de dados, indicando que uma acompanha a outra (primeira premissa da hipótese). Tal resultado provém de evidência à ideia inicial de que as temáticas das fake news acompanham os movimentos da sociedade.
Palavras-chave: NER, Twitter, Fake news