Mineração de Texto para identificação de termos relevantes em Nutrigenômica sob a ótica fuzzy

Exportar este item:

Use este identificador para citar ou linkar para este item: http://www.bdtd.uerj.br/handle/1/7674

Tipo do documento:	Dissertação
Título:	Mineração de Texto para identificação de termos relevantes em Nutrigenômica sob a ótica fuzzy
Título(s) alternativo(s):	Text Mining to identify of relevant terms in Nutrigenomics under for fuzzy perspective
Autor:	Cruz, Carla Cristina Passos
Primeiro orientador:	Lanzillotti, Regina Serrão
Primeiro membro da banca:	Kubrusly, Jessica Quintanilha
Segundo membro da banca:	Lauro, Adriano
Terceiro membro da banca:	Lanzillotti, Haydée Serrão
Resumo:	Esta dissertação apresenta a mineração de três textos sobre o tema Nutrigenômica, cujo objetivo consistiu em confrontar os resultados referentes aos agrupamentos criados pelos métodos não-hierárquicos fuzzy em Mineração de Textos. O uso de algoritmos na Mineração de Texto otimiza a busca em função das palavras-chave geradas por eles. Primeiramente, os textos foram coletados de sites sobre o tema proposto, e em seguida passaram por um processo de limpeza e tratamento, conhecido como pré-processamento. Após esta etapa, foram aplicados os algoritmos de agrupamento fuzzy C-Means e fuzzy C-Medoids onde se observou que, apesar de a quantidade de grupos ter sido previamente definida através da visualização gráfica da correlação de postos de Spearman, o fuzzy C-Means constituiu menos agrupamentos que o pré-fixado, enquanto que o fuzzy C-Medoids fez o proposto. No entanto, em ambos os métodos houve a sobreposição de agrupamentos, isto é, interseção entre dois ou mais grupos, característica em métodos fuzzy A validação dos resultados via Análise Discriminante, apesar das taxas apresentarem valores próximos, o fuzzy C-Medoids mostrou-se mais eficiente na classificação dos grupos, pois sua taxa de acurácia foi de 94% contra 90% do fuzzy C-Means, logo, conseguiu agrupar com mais eficiência termos que possuem características em comum em um mesmo grupo. A meta da criação de palavras-chaves que contribuirão para a busca da informação segundo a tipologia da Nutrigenômica e Nutrigenética foi atingida, o que retratou diferenças intuitivas e conceituais, aspectos considerados relevantes em estudos sistemáticos para definir diferentes categorias.
Abstract:	This dissertation presents the mining of three texts under Nutrigenomics theme, whose objective was to compare the results related to the grouping created by fuzzy non-hierarchical methods in Text Mining. The use of text mining algorithms optmizes the search in accordance with keywords to conceive by them. First of all, the texts were collected from websites about the proposed theme and afterwards them passed for a process of cleaning and treatment a known as pre-processing. After this step, the fuzzy C-Means and fuzzy C-Medoids clustering algorithms, were applied where was observed that despite the number of groups have been defined previously through of the graphical visualization Sperman s Correlation Rank, the fuzzy C-Means constituted fewer clusters than the pre-fixed, while the fuzzy C-Medoids did the suggested. However, in both methods there were clustering overlapping, that is, instersection between two or more groups, fuzzy methods characteristics. In the results validation through Discriminant Analysis, despite of the rates have similar values, the fuzzy C-Medoids was more efficient in classifying groups because its accuracy rate was 94% cons 90% of fuzzy C-Means, so it was get more efficiently group terms that have common characteristics. The goal of the creating keywords that will contribute for the search of the information according the typology of Nutrigenomics and Nutrigenetics was attain what showed intuitive and conceitual differences, considered relevants aspects in systematic studies to define different categories.
Palavras-chave:	Text Mining Nutrigenomics Clustering Fuzzy Logic Discriminant Analysis Mineração de Texto Nutrigenômica Agrupamento Lógica Fuzzy Análise Discriminante Mineração de dados (computação) Lógica difusa Algoritmos
Área(s) do CNPq:	CNPQ::OUTROS
Idioma:	por
País:	BR
Instituição:	Universidade do Estado do Rio de Janeiro
Sigla da instituição:	UERJ
Departamento:	Centro de Tecnologia e Ciências::Instituto de Matemática e Estatística
Programa:	Programa de Pós-Graduação em Ciências Computacionais
Citação:	CRUZ, Carla Cristina Passos. Mineração de Texto para identificação de termos relevantes em Nutrigenômica sob a ótica fuzzy. 2019. 116 f. Dissertação (Mestrado em Modelagem matemático-estatístico-computacional) - Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2019.
Tipo de acesso:	Acesso Aberto
URI:	http://www.bdtd.uerj.br/handle/1/7674
Data de defesa:	10-Dez-2019
Aparece nas coleções:	Mestrado em Ciências Computacionais

Arquivos associados a este item:

Arquivo	Tamanho	Formato
Dissertacao_Carla Cruz.pdf	2,27 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas