Voltar

Pós em Computação promove defesa de dissertação de mestrado na próxima segunda-feira (28)

O trabalho foi desenvolvido pela pesquisadora Rafaella Ferreira do Vale

O Programa de Pós-Graduação em Ciência da Computação da UFPE promove defesa de dissertação de mestrado na próxima segunda-feira (28), a partir das 14h. A apresentação acontecerá de forma remota, através da plataforma Google Meet. É recomendado aos interessados em assistir que entrem com o microfone e câmera desligados.

Com título “Análise Comparativa de Métodos de Simplificação de Sentenças para Sumarização Extrativa de Textos”, o trabalho foi desenvolvido pela pesquisadora Rafaella Ferreira do Vale. A banca examinadora será formada pelo orientador Rafael Dueire Lins (UFPE-CIn) e pelos professores Frederico Luiz Gonçalves de Freitas (UFPE-CIn) e Rafael Ferreira Leite de Mello (UFRPE/Departamento de Computação).

Resumo

A manipulação de grandes volumes de textos digitais traz inúmeros desafios que, para serem mitigados, requerem forte dependência humana de abordagens automáticas. Com o crescimento sem precedentes de conteúdo textual na web, técnicas voltadas para o processamento automático ou com o mínimo esforço humano necessário são essenciais. A sumarização automática de textos é uma dessas técnicas, sendo aplicável na coleção de conteúdo relevante nesse contexto. A sumarização extrativa, em particular, seleciona um conjunto de sentenças de um texto com base em critérios específicos. Estratégias para sumarização extrativa podem se beneficiar de técnicas de pré-processamento que enfatizam a relevância ou informatividade das sentenças em relação a critérios de seleção. Nesta pesquisa, essa hipótese é testada com métodos de simplificação de sentenças. Quatro métodos são utilizados para simplificar um corpus de notícias em língua inglesa do CNN: um método baseado em regras, um de otimização, um modelo de rede profunda supervisionado e um modelo de rede profunda não supervisionado. Os textos simplificados são sumarizados usando 14 estratégias de seleção de sentenças. As combinações de métodos de simplificação e sumarização são comparadas com o baseline – o corpus sumarizado sem simplificação prévia – em análise quantitativa, a qual sugere que a compressão de sentenças com restrições e modelos que aprendem de grandes corpora de pares de sentenças tendem a desempenhar melhor e a trazer ganhos em relação à não aplicação de simplificação precedente.

Data da última modificação: 25/09/2020, 17:33