HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA

Utilize este identificador para referenciar este registo: http://hdl.handle.net/123456789/794

Título:	HADOOP PARA PROCESSAMENTO DE DADOS EM LARGA ESCALA
Autores:	DINIZ, GABRIEL ANTONIO
Data:	30-Dez-2012
Citação:	Com o crescimento da Web 2.0, pode-se observar uma quantidade cada vez maior de dados circulando pela Internet. Comparados com os sistemas presentes na Web no início da década de 2000, as redes sociais, mecanismos de busca, portais de notícias, entre outros serviços Web da atualidade, possuem um volume de tráfego e armazenamento de dados enorme. As grandes bases de dados desses sistemas são conhecidas como Big Data. Nesse contexto, os modelos de armazenamento de dados existentes não atendem a demanda desses grandes fluxos de informação. Para resolver esse problema, foram desenvolvidos soluções específicas para lidar com Big Data. O objetivo desse trabalho é analisar algumas dessas soluções. Usou-se o modelo de processamento distribuído de dados MapReduce desenvolvido pela Google, através da implementação de código fonte aberto desse modelo: o Hadoop. Foram analisados dados a respeito das olimpíadas de Londres 2012 provenientes do Twitter, que é a ferramenta de microblogs mais utilizada na atualidade. A partir desses dados pode-se obter informações do tipo: tópicos mais comentados, usuários mais influentes, períodos onde mais se comentou determinados assuntos entre outras análises. Assim esse trabalho apresenta a possibilidade do uso do Hadoop para análise de dados provenientes de redes sociais, gerando dados estatísticos sobre a repercussão de determinado assunto nesses meios de comunicação.
URI:	http://hdl.handle.net/123456789/794
Aparece nas colecções:	CIÊNCIA DA COMPUTAÇÃO

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Monografia - Gabriel Antonio Diniz.pdf		800.83 kB	Adobe PDF	Ver/Abrir
apresentacao.pdf		37.47 kB	Adobe PDF	Ver/Abrir

Mostrar registo em formato completo Visualizar estatísticas

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets