DSpace Repository

HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA

Show simple item record

dc.contributor.author DINIZ, GABRIEL ANTONIO
dc.date.accessioned 2019-05-15T17:26:49Z
dc.date.available 2019-05-15T17:26:49Z
dc.date.issued 2012-12-30
dc.identifier.citation Com o crescimento da Web 2.0, pode-se observar uma quantidade cada vez maior de dados circulando pela Internet. Comparados com os sistemas presentes na Web no início da década de 2000, as redes sociais, mecanismos de busca, portais de notícias, entre outros serviços Web da atualidade, possuem um volume de tráfego e armazenamento de dados enorme. As grandes bases de dados desses sistemas são conhecidas como Big Data. Nesse contexto, os modelos de armazenamento de dados existentes não atendem a demanda desses grandes fluxos de informação. Para resolver esse problema, foram desenvolvidos soluções específicas para lidar com Big Data. O objetivo desse trabalho é analisar algumas dessas soluções. Usou-se o modelo de processamento distribuído de dados MapReduce desenvolvido pela Google, através da implementação de código fonte aberto desse modelo: o Hadoop. Foram analisados dados a respeito das olimpíadas de Londres 2012 provenientes do Twitter, que é a ferramenta de microblogs mais utilizada na atualidade. A partir desses dados pode-se obter informações do tipo: tópicos mais comentados, usuários mais influentes, períodos onde mais se comentou determinados assuntos entre outras análises. Assim esse trabalho apresenta a possibilidade do uso do Hadoop para análise de dados provenientes de redes sociais, gerando dados estatísticos sobre a repercussão de determinado assunto nesses meios de comunicação. pt_BR
dc.identifier.uri http://hdl.handle.net/123456789/794
dc.language.iso other pt_BR
dc.title HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA pt_BR
dc.type Other pt_BR


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account