@MASTERSTHESIS{ 2018:777785436, title = {Avaliação de características para extração automática de aspectos}, year = {2018}, url = "http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7855", abstract = "A utilização cada vez mais crescente da Internet e demais interações online entre pessoas, tais como chats, participação em fóruns, transações em comércio eletrônico, revisões de produtos e serviços, etc., tem levado à necessidade cada vez maior de extrair, transformar e analisar uma quantidade enorme de dados, utilizando-se de uma combinação de processos de mineração de textos e demais conteúdos obtidos diretamente da Web. Dentre as principais demandas para a área de mineração de dados, sobretudo de opinião, estão as grandes empresas dos mais diversos ramos. Essas instituições estão cada vez mais interessadas em saber o que seus clientes reais, ou em potencial, comentam sobre elas. De restaurantes a hotéis, de celulares a câmeras fotográficas, os fóruns de revisões espalhados na internet são os cartões de visita mais importantes para as empresas pelo simples fato de não serem criados por elas, mas por pessoas que de alguma forma fazem ou farão uso de seus serviços. As pessoas são mais propensas a expressar suas opiniões e experiências práticas em produtos ou serviços que eles utilizaram. Essas revisões são importantes para organizações empresariais e consumidores. Contudo, analisar todas as críticas de clientes é difícil, já que tal número de comentários pode ser de centenas ou até milhares. Portanto, é necessário fornecer informações coerentes e sumários concisos para essas revisões. A Análise de Sentimento Baseada em Aspecto é uma tendência recente e uma abordagem que tem muito a ser explorada, uma vez que tem demonstrado bons resultados na literatura como uma técnica de extração de opiniões mais refinada e pontual do que as baseadas puramente em léxica e regras. Esta dissertação de Mestrado teve por objetivo pesquisar, implementar e avaliar um novo método para extração de termos de opinião em revisões de restaurantes levando em conta e escolha da algumas das melhores características descritas no estado da arte. Como modelo de classificação, foi utilizado o CRF, dada sua alta eficiência como classificador condicional. Os resultados obtidos demonstraram um bom desempenho quando comparado aos principais trabalhos da área, tendo como destaque a alta cobertura alcançada pelo método desenvolvido.", publisher = {Universidade Federal Rural de Pernambuco}, scholl = {Programa de Pós-Graduação em Informática Aplicada}, note = {Departamento de Estatística e Informática} }