Utilize este identificador para referenciar este registo: http://hdl.handle.net/123456789/794
Título: HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA
Autores: DINIZ, GABRIEL ANTONIO
Data: 30-Dez-2012
Citação: Com o crescimento da Web 2.0, pode-se observar uma quantidade cada vez maior de dados circulando pela Internet. Comparados com os sistemas presentes na Web no início da década de 2000, as redes sociais, mecanismos de busca, portais de notícias, entre outros serviços Web da atualidade, possuem um volume de tráfego e armazenamento de dados enorme. As grandes bases de dados desses sistemas são conhecidas como Big Data. Nesse contexto, os modelos de armazenamento de dados existentes não atendem a demanda desses grandes fluxos de informação. Para resolver esse problema, foram desenvolvidos soluções específicas para lidar com Big Data. O objetivo desse trabalho é analisar algumas dessas soluções. Usou-se o modelo de processamento distribuído de dados MapReduce desenvolvido pela Google, através da implementação de código fonte aberto desse modelo: o Hadoop. Foram analisados dados a respeito das olimpíadas de Londres 2012 provenientes do Twitter, que é a ferramenta de microblogs mais utilizada na atualidade. A partir desses dados pode-se obter informações do tipo: tópicos mais comentados, usuários mais influentes, períodos onde mais se comentou determinados assuntos entre outras análises. Assim esse trabalho apresenta a possibilidade do uso do Hadoop para análise de dados provenientes de redes sociais, gerando dados estatísticos sobre a repercussão de determinado assunto nesses meios de comunicação.
URI: http://hdl.handle.net/123456789/794
Aparece nas colecções:CIÊNCIAS DA COMPUTAÇÃO

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Monografia - Gabriel Antonio Diniz.pdf800.83 kBAdobe PDFVer/Abrir
apresentacao.pdf37.47 kBAdobe PDFVer/Abrir


Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.