Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
http://www.bdtd.uerj.br/handle/1/7674
Tipo do documento: | Dissertação |
Título: | Mineração de Texto para identificação de termos relevantes em Nutrigenômica sob a ótica fuzzy |
Título(s) alternativo(s): | Text Mining to identify of relevant terms in Nutrigenomics under for fuzzy perspective |
Autor: | Cruz, Carla Cristina Passos |
Primeiro orientador: | Lanzillotti, Regina Serrão |
Primeiro membro da banca: | Kubrusly, Jessica Quintanilha |
Segundo membro da banca: | Lauro, Adriano |
Terceiro membro da banca: | Lanzillotti, Haydée Serrão |
Resumo: | Esta dissertação apresenta a mineração de três textos sobre o tema Nutrigenômica, cujo objetivo consistiu em confrontar os resultados referentes aos agrupamentos criados pelos métodos não-hierárquicos fuzzy em Mineração de Textos. O uso de algoritmos na Mineração de Texto otimiza a busca em função das palavras-chave geradas por eles. Primeiramente, os textos foram coletados de sites sobre o tema proposto, e em seguida passaram por um processo de limpeza e tratamento, conhecido como pré-processamento. Após esta etapa, foram aplicados os algoritmos de agrupamento fuzzy C-Means e fuzzy C-Medoids onde se observou que, apesar de a quantidade de grupos ter sido previamente definida através da visualização gráfica da correlação de postos de Spearman, o fuzzy C-Means constituiu menos agrupamentos que o pré-fixado, enquanto que o fuzzy C-Medoids fez o proposto. No entanto, em ambos os métodos houve a sobreposição de agrupamentos, isto é, interseção entre dois ou mais grupos, característica em métodos fuzzy A validação dos resultados via Análise Discriminante, apesar das taxas apresentarem valores próximos, o fuzzy C-Medoids mostrou-se mais eficiente na classificação dos grupos, pois sua taxa de acurácia foi de 94% contra 90% do fuzzy C-Means, logo, conseguiu agrupar com mais eficiência termos que possuem características em comum em um mesmo grupo. A meta da criação de palavras-chaves que contribuirão para a busca da informação segundo a tipologia da Nutrigenômica e Nutrigenética foi atingida, o que retratou diferenças intuitivas e conceituais, aspectos considerados relevantes em estudos sistemáticos para definir diferentes categorias. |
Abstract: | This dissertation presents the mining of three texts under Nutrigenomics theme, whose objective was to compare the results related to the grouping created by fuzzy non-hierarchical methods in Text Mining. The use of text mining algorithms optmizes the search in accordance with keywords to conceive by them. First of all, the texts were collected from websites about the proposed theme and afterwards them passed for a process of cleaning and treatment a known as pre-processing. After this step, the fuzzy C-Means and fuzzy C-Medoids clustering algorithms, were applied where was observed that despite the number of groups have been defined previously through of the graphical visualization Sperman s Correlation Rank, the fuzzy C-Means constituted fewer clusters than the pre-fixed, while the fuzzy C-Medoids did the suggested. However, in both methods there were clustering overlapping, that is, instersection between two or more groups, fuzzy methods characteristics. In the results validation through Discriminant Analysis, despite of the rates have similar values, the fuzzy C-Medoids was more efficient in classifying groups because its accuracy rate was 94% cons 90% of fuzzy C-Means, so it was get more efficiently group terms that have common characteristics. The goal of the creating keywords that will contribute for the search of the information according the typology of Nutrigenomics and Nutrigenetics was attain what showed intuitive and conceitual differences, considered relevants aspects in systematic studies to define different categories. |
Palavras-chave: | Text Mining Nutrigenomics Clustering Fuzzy Logic Discriminant Analysis Mineração de Texto Nutrigenômica Agrupamento Lógica Fuzzy Análise Discriminante Mineração de dados (computação) Lógica difusa Algoritmos |
Área(s) do CNPq: | CNPQ::OUTROS |
Idioma: | por |
País: | BR |
Instituição: | Universidade do Estado do Rio de Janeiro |
Sigla da instituição: | UERJ |
Departamento: | Centro de Tecnologia e Ciências::Instituto de Matemática e Estatística |
Programa: | Programa de Pós-Graduação em Ciências Computacionais |
Citação: | CRUZ, Carla Cristina Passos. Mineração de Texto para identificação de termos relevantes em Nutrigenômica sob a ótica fuzzy. 2019. 116 f. Dissertação (Mestrado em Modelagem matemático-estatístico-computacional) - Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2019. |
Tipo de acesso: | Acesso Aberto |
URI: | http://www.bdtd.uerj.br/handle/1/7674 |
Data de defesa: | 10-Dez-2019 |
Aparece nas coleções: | Mestrado em Ciências Computacionais |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
Dissertacao_Carla Cruz.pdf | 2,27 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.