HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA

dc.contributor.author	DINIZ, GABRIEL ANTONIO
dc.date.accessioned	2019-05-15T17:26:49Z
dc.date.available	2019-05-15T17:26:49Z
dc.date.issued	2012-12-30
dc.identifier.citation	Com o crescimento da Web 2.0, pode-se observar uma quantidade cada vez maior de dados circulando pela Internet. Comparados com os sistemas presentes na Web no início da década de 2000, as redes sociais, mecanismos de busca, portais de notícias, entre outros serviços Web da atualidade, possuem um volume de tráfego e armazenamento de dados enorme. As grandes bases de dados desses sistemas são conhecidas como Big Data. Nesse contexto, os modelos de armazenamento de dados existentes não atendem a demanda desses grandes fluxos de informação. Para resolver esse problema, foram desenvolvidos soluções específicas para lidar com Big Data. O objetivo desse trabalho é analisar algumas dessas soluções. Usou-se o modelo de processamento distribuído de dados MapReduce desenvolvido pela Google, através da implementação de código fonte aberto desse modelo: o Hadoop. Foram analisados dados a respeito das olimpíadas de Londres 2012 provenientes do Twitter, que é a ferramenta de microblogs mais utilizada na atualidade. A partir desses dados pode-se obter informações do tipo: tópicos mais comentados, usuários mais influentes, períodos onde mais se comentou determinados assuntos entre outras análises. Assim esse trabalho apresenta a possibilidade do uso do Hadoop para análise de dados provenientes de redes sociais, gerando dados estatísticos sobre a repercussão de determinado assunto nesses meios de comunicação.	pt_BR
dc.identifier.uri	http://hdl.handle.net/123456789/794
dc.language.iso	other	pt_BR
dc.title	HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA	pt_BR
dc.type	Other	pt_BR