Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://www.bdtd.uerj.br/handle/1/7729
Tipo do documento: Dissertação
Título: Computação distribuída aplicada ao processamento de imagens de minérios utilizando o Hadoop
Distributed computing applied to mineral s image processing using Hadoop
Autor: Batista, Felipe Schimith 
Primeiro orientador: Mota, Guilherme Lucio Abelha
Primeiro coorientador: Costa, Gilson Alexandre Ostwald Pedro da
Primeiro membro da banca: Gomes, Otávio da Fonseca Martins
Segundo membro da banca: Ferreira, Rodrigo da Silva
Terceiro membro da banca: Marzulo, Leandro Augusto Justen
Resumo: O desenvolvimento de soluções de processamento paralelo baseado no framework Hadoop tem sido amplamente utilizado como uma alternativa eficiente para o processamento de grandes volume de dados. O uso de ferramentas de busca tornou-se ainda mais atraente e difundido na área de tecnologia com a metodologia de MapReduce. Entretanto, podemos adequar essa arquitetura para processamento de imagens, com a finalidade de obter ganhos no tempo e volume de processamento com o modelo de distribuição dos conteúdos do Hadoop Distributed File System (HDFS). Nesse contexto, o objetivo desse estudo foi desenvolver uma arquitetura capaz de distribuir o processamento de imagens de partículas de minério em uma plataforma que pode ser configurada em uma infraestrutura física ou virtualizada. Foi realizada a adaptação do algoritmo de processamento de imagens com a criação de funções de parser do tipo DataFile do Hadoop para o tipo Mat do OpenCV, para assim possibilitar o processamento das imagens utilizando a linguagem de programação C++ . Os algoritmos foram transformados em bibliotecas compartilhadas para serem distribuídos nos nós de processamento, seguindo os padrões de desenvolvimento do MapReduce for C (MR4C). Os experimentos foram feitos em um cluster composto de por dez nós de processamento, cada um com oito processadores Intel(R) Xeon(TM) CPU 2.80GHz e 8 GB de memória. Os experimentos foram feitos empregando diversas configurações, alterando a memória máxima alocada, número de cores, número de nós de processamento, número de tarefas, tamanho das imagens e também o número de imagens. Os resultados foram discutidos e analisados com o objetivo de destacar os ganhos e limitações da arquitetura apresentada
The development of parallel processing solutions based on the Hadoop framework has been widely used as an efficient alternative for large volume data processing. The use of search tools has become even more attractive and widespread in the area of technology with the methodology of MapReduce. However, we can tailor this architecture for image processing in order to obtain gains in time and processing volume with the Hadoop Distributed File System (HDFS) content distribution model. In this context, the objective of this study was to develop an architecture capable of distributing the image processing of mineral particles in a platform that can be configured in a physical or virtualized infrastructure. The image processing algorithm was adapted with the creation of parser functions of the DataFile type from Hadoop to the OpenCV Mat type, in order to allow the image processing using the C++ programming language. The algorithms were transformed into shared libraries to be distributed on the processing nodes, following the development standards of the MapReduce for C (MR4C) API. The experiments were done in a cluster consisting of ten processing nodes, each with Intel (R) Xeon (TM) CPU 2.80GHz and 8GB memory. The experiments were done using different configurations, changing the maximum allocated memory, number of cores, number of processing nodes, number of tasks, size of image and number of images. The results where discussed and analyzed with the aim of highlighting the possible gains and limitations of the proposed architecture
Palavras-chave: Hadoop
MR4C
Segmentação de fissuras
Crescimento de regiões
Hadoop
MR4C
Crack segmentation
Region growth
Processamento de imagens
Programação paralela(Computação)
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: BR
Instituição: Universidade do Estado do Rio de Janeiro
Sigla da instituição: UERJ
Departamento: Centro de Tecnologia e Ciências::Instituto de Matemática e Estatística
Programa: Programa de Pós-Graduação em Ciências Computacionais
Citação: BATISTA, Felipe Schimith. Distributed computing applied to mineral s image processing using Hadoop. 2017. 118 f. Dissertação (Mestrado em Modelagem matemático-estatístico-computacional) - Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2017.
Tipo de acesso: Acesso Aberto
URI: http://www.bdtd.uerj.br/handle/1/7729
Data de defesa: 29-Mar-2017
Aparece nas coleções:Mestrado em Ciências Computacionais

Arquivos associados a este item:
Arquivo TamanhoFormato 
IME_Mestrado_Felipe_Schimith_Batista_completa.pdf5,13 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.