Notícias, apontadores, pensamentos e pesquisas do Laboratório de Sistemas Distribuídos da UFCG
quinta-feira, 4 de abril de 2013
LSD no SBRC 2013
O Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC) é o principal evento brasileiro na área de Sistemas Distribuídos e Sistemas. A edição deste ano acontecerá em Brasília, em maio, e o LSD orgulhosamente participará com 6 artigos elaborados com diversos parceiros. Segue abaixo a lista. Parabéns aos autores!
Na Trilha Principal:
Estratégias de Obtenção de um Item Máximo em Computação por Humanos
Jeymisson Barreto e Oliveira, Lesandro Ponciano, Nazareno Andrade, Francisco Brasileiro
Planejamento de Capacidade a Longo Prazo Dirigido por Métricas de Negócio para Aplicações SaaS
David Candeia, Raquel Lopes, Ricardo Araújo Santos
Um Arcabouço Para Provisionamento Automático de Recursos em Provedores de IaaS Independente do Tipo de Aplicação
Fabio Morais, Francisco Brasileiro, Raquel Lopes, Ricardo Araújo Santos, Augusto Macedo (UFCG), Wade Satterfield (HP labs), Leandro Rosa (Hewlett-Packard, Brazil Lab).
Sobre o Uso de Dispositivos de Alta Granularidade, Alta Volatilidade e Alta Dispersão em Just in Time Clouds
Rostand Costa, Diénert Vieira, (UFPB) Francisco Brasileiro (UFCG) Dênio Mariz Sousa IFPB,
Guido Lemos Filho (UFPB)
No Salão de ferramentas:
Uma nuvem privada oportunista para execução de aplicações Bag-of-Tasks
Patricia Alanis, Abmar Barros, Marcos Nóbrega, Francisco Brasileiro (UFCG)
Just-in-Time Clouds: Uma abordagem para Federação de Clouds PrivadasEdigley Fraga, Jonathan Brilhante, Rostand Costa, Francisco Brasileiro, Marco Spohn, Reinaldo Gomes, Universidade Federal de Campina Grande
Pedro Bignatto, Diego Desani, Hermes Senger, Universidade Federal de São Carlos
Airton Pereira, Vinícius Garcia, Universidade Federal de Pernambuco
Fernando Trinta, Universidade Federal do Ceará
Ana Cristina Oliveira, Henryson Chagas, Aleciano Ferreira, Instituto Federal de Ensino, Ciência e Tecnologia da Paraíba
Philippe Navaux, Eduardo Roloff, Otávio Carvalho, Universidade Federal do Rio Grande do Sul
Raimundo Macêdo, Alírio Sá, Universidade Federal da Bahia
segunda-feira, 18 de março de 2013
Contributor Profiles, their Dynamics, and their Importance in Five Q&A Sites
Este artigo foi desenvolvido no mestrado de Adabriand Furtado, com a participação de Nazareno Andrade, Nigini Oliveira e Francisco Brasileiro, e foi recentemente publicado na conferência Computer Supported Cooperative Work (CSCW '13), da ACM. A seguir, um resumo do trabalho:
Sites de perguntas e respostas (Q&A) têm se mostrado um recurso valioso em ajudar pessoas a resolverem seus problemas do dia-a-dia. Atualmente, os sites Yahoo! Answers e StackOverflow têm atraído números massivos de contribuidores voluntários para trocar conhecimento através de atividades como criar perguntas, respostas, comentários e avaliar o conteúdo gerado.
Como efeito do tamanho considerável destas comunidades, é de se esperar que contribuidores nestes sites exibam comportamentos diversos na criação de conteúdo – seja dando preferência à criação de um determinado tipo de contribuição (e.g. somente respostas) ou demostrando alguma habilidade em criar conteúdo. Nosso trabalho foca em analisar a diversidade de comportamento dos contribuidores em sites de Q&A. Entender como cada tipo de contribuidor colabora para o funcionamento de sistemas de Q&A ajuda a gerenciar estes sites. Por exemplo, este conhecimento pode informar o desenvolvimento de estratégias para promover ou inibir certos comportamentos na comunidade.
![]() |
Página de uma pergunta no site de Q&A Super User |
Para examinar o comportamento típico dos contribuidores nestes sites, utilizamos dados históricos de cinco sites da plataforma de Q&A Stack Exchange – Super User, Server Fault, Programmers, Ask Ubuntu e Mathematics – e derivamos um conjunto de perfis que descrevem a motivação e habilidade dos contribuidores em perspectivas de longo e curto prazo. Na perspectiva de longo prazo, aplicamos a análise de agrupamento nos dados completos de atividade dos usuários. Esta análise revelou dez perfis comportamentais, os quais foram resumidos em quatro tipos:
- Sem habilidade marcante, usuários de baixa a média atividade e habilidade;
- Imperitos, usuários com contribuições mal avaliadas;
- Experts, contribuidores hábeis em realizar um tipo de atividade; e
- Ativistas, contribuidores de alta atividade.
Curiosamente, experts e contribuidores de alta atividade formam grupos disjuntos em nossos resultados. Mecanismos de alocação de tarefas podem se beneficiar desta evidência, direcionando experts para responder respostas difíceis, ou uma combinação de experts e ativistas para aumentar as chances de obter uma resposta rapidamente.
![]() |
Distribuição dos perfis de contribuidor nas cinco comunidades |
Ainda na análise de perfis de longo prazo, examinamos o papel de cada perfil na produção de conteúdo para os sites. Esta caracterização descreve ativistas e contribuidores sem habilidade marcante produzindo a maioria das contribuições em todos os cinco sites, enquanto que experts e imperitos coletivamente produzem uma fração pequena das contribuições. Observar que experts são de pequena importância para a criação de conteúdo pode motivar os gerentes destes sites a buscarem meios para promover a participação destes usuários.
Na perspectiva de perfis de curto prazo, nossa análise objetiva entender como o comportamento dos contribuidores e propriedades estruturais do site mudam ao longo do tempo. Para tal, selecionamos o maior dos cinco sites estudados, o Super User, e conduzimos uma versão longitudinal da nossa análise em seus dados históricos. Os perfis descobertos nesta análise de agrupamento, considerando janelas de 2 meses, são notavelmente similares aos perfis encontrados na análise usando toda a atividade do site.
Usando a categorização dos perfis em cada janela, examinamos a evolução da distribuição dos perfis no Super User e identificamos que sua composição é estável. Contudo, a análise de dinâmica dos perfis mostra que os usuários mudam de perfil com certa frequência. O resultado desta análise mostra que todos os perfis, exceto ativistas, tendem a mudar para perfis de menor atividade nas janelas seguintes. Além disso, usuários imperitos em respostas e experts tendem a abandonar a comunidade dentro de pouco tempo.
Por fim, nosso último experimento relacionado à dinâmica de comportamento compara a probabilidade de um usuário atuar de acordo com um dado perfil, caso este usuário seja novato ou experiente. Sem muita surpresa, esta análise aponta que novatos são mais propensos a atuar como imperitos em respostas, enquanto que usuários experientes tendem a atuar em perfis mais ativos. No entanto é interessante que usuários experientes não possuem uma maior chance de se comportar como experts. Isto sugere que experts agem como tal desde seu início no site, mas ativistas tendem a se desenvolver com o tempo.
Para mais detalhes, veja nosso artigo Contributor Profiles, their Dynamics, and their Importance in Five Q&A Sites.domingo, 24 de junho de 2012
Estratégias de economia de energia em grades computacionais
Um artigo científico intitulado “Assessing Green Strategies in Peer-to-Peer Opportunistic Grids”, que apresenta resultados de uma pesquisa desenvolvida no LSD por Lesandro Ponciano e prof. Francisco Brasileiro, foi aceito para publicação no Jornal of Grid Computing. Os autores foram notificados da aceitação no dia 22 de junho.
O artigo trata da economia de energia em grades computacionais entre-pares. Grades computacionais entre-pares são infraestruturas de computação que utilizam ciclos ociosos de recursos computacionais de diferentes domínios administrativos. Geralmente, a demanda por recursos nessas grades ocorre em rajadas. Durante uma rajada de demanda, muitos recursos da grade são necessários. Porém, em outros momentos, os recursos permanecem ociosos por longos períodos. Nesse contexto, um problema tratado no artigo é que manter os recursos ociosos quando eles não estão em uso nem pela grade nem pelo usuário local não é uma prática eficiente em termos de consumo de energia. O artigo mostra que uma maneira de reduzir a energia consumida pelos recursos nesses períodos é colocá-los em um modo de dormência, em que eles consomem menos energia.
O trabalho avalia duas estratégias de dormência: Sobreaviso e Hibernação. Ele mostra que, no contexto de grades computacionais, essas estratégias apresentam um compromisso entre o benefício da economia de energia dos recursos, de um lado, e de outro lado os custos associados em termos do aumento no tempo de resposta das aplicações e do impacto no tempo de vida dos recursos. O aumento no tempo de resposta advém do tempo necessário para acordar o recurso quando surge uma nova demanda da grade. O impacto na vida útil do recurso ocorre em razão das partidas e paradas das rotações do disco rígido quando as estratégias de dormência são utilizadas. O artigo utiliza um modelo simulado para tratar esse compromisso. Além das estratégias de dormência, também é avaliado após quando tempo de inatividade as estratégias de dormência devem ser utilizadas e como cada domínio administrativo da grade pode decidir qual estratégia de dormência utilizar.
Os resultados mostram que os estados de dormência avaliados permitem economizar energia com um baixo custo associado em termos de atraso no tempo de resposta das aplicações e da redução da vida útil dos discos rígidos. Além disso, a estratégia a ser utilizada em cada domínio administrativo da grade depende do tamanho das sessões de disponibilidade das máquinas domínio administrativo. No estudo realizado, a estratégia Hibernação mostrou-se mais adequada em domínios administrativos em que os recursos permanecem mais tempo disponíveis para a grade. De outro modo, a estratégia Sobreaviso mostrou-se mais adequada para ser utilizada em domínios administrativos em que os recursos permanecem pouco tempo disponíveis para a grade. Assim, cada domínio administrativo deve ser configurado para utilizar a estratégia de dormência que melhor se adapta às suas características.
O estudo mostra também que, diferentemente de outros tipos de infraestruturas de grade, nas grades entre-pares pode-se colocar uma máquina em estado de dormência tão logo ela se torna inativa, isto é, não é necessário utilizar uma política de tempo inatividade. Isso permite aumentar a economia de energia da grade sem impactar significativamente o tempo de resposta das tarefas e vida útil dos discos rígidos.
quarta-feira, 21 de março de 2012
Conversa LSD - Leveraging Trust and Distrust for Sybil-Tolerant Voting in Online Social Media
Caros,
Na Conversa LSD desta semana (quarta, 16h, no auditório do LSD) temos uma palestra de um visitante, e gostaríamos de convidar a todos. Segue abaixo uma breve apresentação do palestrante e da palestra.
[]s
Nazareno
Nitin Chiluka está no último ano de seu doutorado na TUDelft e trabalha no uso de análise de grafos para entender e projetar sistemas distribuídos, de recomendação e mídia social online. Eu participo da orientação de Nitin e ele está visitando a UFCG no contexto de um projeto CAPES/Nuffic entre TUDelft e UFCG.
O resumo da apresentação:
Leveraging Trust and Distrust for Sybil-Tolerant Voting in Online Social Media
Voting is a vital component of online social media (OSM). Votes on content items in OSM, e.g., likes in YouTube and Facebook, favorites in Flickr, and diggs in Digg) are typically incorporated into many of their central features such as recommendations, ‘most popular’-like pages and ranking search results. Voting helps in determining popularity and trustworthiness of content.
At the same time, due to their open membership access, voting on content items in OSM is susceptible to Sybil attacks. Malicious attackers can create multiple Sybil identities to outvote the real users of the system. To defend against such an attack, we leverage (i) trust which is inherent in the social network among users in OSM, and (ii) distrust between honest users, who identify some of the spam content items, and the Sybil identities who promoted them. Modeling trust and distrust in the system as a signed network, our method proceeds in two phases. First, we identify nodes and edges that constrain paths along positive edges between the endpoints of each negative edge. Second, we limit the votes from Sybil voters whose paths to honest nodes pass across these bottlenecks. Our simulation results on popular OSM datasets show both the feasibility of incorporating distrust alongside trust to defend against Sybil attacks, and that our method outperforms the state-of-the-art approach, SumUp.
Na Conversa LSD desta semana (quarta, 16h, no auditório do LSD) temos uma palestra de um visitante, e gostaríamos de convidar a todos. Segue abaixo uma breve apresentação do palestrante e da palestra.
[]s
Nazareno
Nitin Chiluka está no último ano de seu doutorado na TUDelft e trabalha no uso de análise de grafos para entender e projetar sistemas distribuídos, de recomendação e mídia social online. Eu participo da orientação de Nitin e ele está visitando a UFCG no contexto de um projeto CAPES/Nuffic entre TUDelft e UFCG.
O resumo da apresentação:
Leveraging Trust and Distrust for Sybil-Tolerant Voting in Online Social Media
Voting is a vital component of online social media (OSM). Votes on content items in OSM, e.g., likes in YouTube and Facebook, favorites in Flickr, and diggs in Digg) are typically incorporated into many of their central features such as recommendations, ‘most popular’-like pages and ranking search results. Voting helps in determining popularity and trustworthiness of content.
At the same time, due to their open membership access, voting on content items in OSM is susceptible to Sybil attacks. Malicious attackers can create multiple Sybil identities to outvote the real users of the system. To defend against such an attack, we leverage (i) trust which is inherent in the social network among users in OSM, and (ii) distrust between honest users, who identify some of the spam content items, and the Sybil identities who promoted them. Modeling trust and distrust in the system as a signed network, our method proceeds in two phases. First, we identify nodes and edges that constrain paths along positive edges between the endpoints of each negative edge. Second, we limit the votes from Sybil voters whose paths to honest nodes pass across these bottlenecks. Our simulation results on popular OSM datasets show both the feasibility of incorporating distrust alongside trust to defend against Sybil attacks, and that our method outperforms the state-of-the-art approach, SumUp.
terça-feira, 6 de março de 2012
Conversa LSD: Apresentação e Introdução ao Projeto PDJ - Highly-Virtualising Cloud Resource Broker
Oi pessoal,
Esta semana será a palestra de Josef Spillner, que está fazendo pós-doc aqui no lsd, em parceria com a TU-Dresden. Mantemos o mesmo dia e horário da última conversa: quarta-feira (07/03), 16h.
O resumo da palestra segue abaixo:
Lívia,
-
Título: Apresentação e Introdução ao Projeto PDJ - Highly-Virtualising Cloud Resource Broker
Provedores comerciais de recursos para computação em nuvem (Infrastructure-as-a-Service, IaaS) oferecem um emparelhamento limitado entre os recursos providos e as tarefas submetidos pelo consumidor desses serviços. Isso é dévido aos perfís de configuração de granularidade grossa (p.ex. o tipo de instância EC2-small da Amazon) em combinação com múltiplos inteirezos numa escalabilidade apenas horizontal e restrições implícitos adicionais como medir por hora completa. Em comparação com a utilidade alta de serviços públicos como eletricidade ou água, estas desavantagens deixam uma fenda entre of que os provedores IaaS oferecem e o que seria tecnicamente possível e economicamente vantajoso para o consumidor. A palestra primeira intruduz o Josef e o seu trabalho anterior sobre plataformas de serviçoes e infraestruturas para computação em nuvem, seguido pelo resumo de um plano de solução para esse problema. A solução demanda a operação de um highly-virtualising cloud resource broker que será avaliado durante o ano 2012 sob esquema CNPq PDJ.
Título: Apresentação e Introdução ao Projeto PDJ - Highly-Virtualising Cloud Resource Broker
Provedores comerciais de recursos para computação em nuvem (Infrastructure-as-a-Service, IaaS) oferecem um emparelhamento limitado entre os recursos providos e as tarefas submetidos pelo consumidor desses serviços. Isso é dévido aos perfís de configuração de granularidade grossa (p.ex. o tipo de instância EC2-small da Amazon) em combinação com múltiplos inteirezos numa escalabilidade apenas horizontal e restrições implícitos adicionais como medir por hora completa. Em comparação com a utilidade alta de serviços públicos como eletricidade ou água, estas desavantagens deixam uma fenda entre of que os provedores IaaS oferecem e o que seria tecnicamente possível e economicamente vantajoso para o consumidor. A palestra primeira intruduz o Josef e o seu trabalho anterior sobre plataformas de serviçoes e infraestruturas para computação em nuvem, seguido pelo resumo de um plano de solução para esse problema. A solução demanda a operação de um highly-virtualising cloud resource broker que será avaliado durante o ano 2012 sob esquema CNPq PDJ.
quarta-feira, 29 de fevereiro de 2012
Conversa LSD: Automated configuration of distributed storage systems
Olá pessoal,
estamos retomando as conversas lsd nesta semana. Nossa primeira conversa lsd será nessa quarta-feira, 29/02, às 16h, com direito à comemoração dos aniversariantes dos meses de janeiro e fevereiro e boas-vindas aos pesquisadores visitantes (Lauro, Mihai, Nitin e Josef).
O primeiro palestrante será Lauro Beltrão, aluno de doutorado da UBC. O título e resumo da sua palestra seguem abaixo.
Lívia
-------
estamos retomando as conversas lsd nesta semana. Nossa primeira conversa lsd será nessa quarta-feira, 29/02, às 16h, com direito à comemoração dos aniversariantes dos meses de janeiro e fevereiro e boas-vindas aos pesquisadores visitantes (Lauro, Mihai, Nitin e Josef).
O primeiro palestrante será Lauro Beltrão, aluno de doutorado da UBC. O título e resumo da sua palestra seguem abaixo.
Lívia
-------
AUTOMATED CONFIGURATION OF DIS TRIBUTED STORAGE SYSTEMS
Distributed storage systems have evolved to employ optimization techniques (e.g., replication, data deduplication, data striping and caching policies) that enable trade-offs over interrelated success metrics such as response time, throughput, storage space, and energy consumption. Setting the configuration parameters o f such optimization techniques to best match the success criteria involves exploring a large configuration space to tune the parameters for each of these techniques. Additionally, the values of the configuration parameters are workload-dependent, requiring exploration of the parameters for each different workload. Such exploration makes manually configuring the distributed storage system an undesirable if not unfeasible task.
My research addresses the following main question: How to configure a distributed storage system (i.e., enable/disable various optimization techniques and configure their parameters) to match the application requirements with minimal human intervention?
During my presentation, I will briefly present the motivation to automate the configuration of a distrib uted storage system and the requirements for an automated configuration solution. I will describe the architecture proposed for anautomated configuration solution and an initial use cases based on data deduplication. Finally, I will briefly present the next steps of my research focusing on the optimization techniques and success metrics that we plan to focus on.
My research addresses the following main question: How to configure a distributed storage system (i.e., enable/disable various optimization techniques and configure their parameters) to match the application requirements with minimal human intervention?
During my presentation, I will briefly present the motivation to automate the configuration of a distrib
quarta-feira, 26 de outubro de 2011
Conversa LSD: Planejamento de capacidade para aplicações de comércio de eletrônico no contexto de SaaS.
Olá pessoal,
Na Conversa LSD desta semana (27/10 16h) iremos discutir um pouco a respeito do trabalho que David Candeia desenvolve no LSD.
Resumo:
A oferta de aplicações de comércio eletrônico que buscavam atender um grande número de clientes, ou ainda, que estavam sujeitas a fortes restrições, despertou na última década um forte interesse a respeito do gerenciamento das infraestruturas de provedores considerando métricas de negócios. Com o surgimento do mercado de Computação na Nuvem, novos modelos de serviços de computação despontaram no mercado. Dentre tais modelos destaca-se o modelo de Aplicação como Serviço (Software-as-a-Service, SaaS) que abrange uma grande variedade de aplicações como gerenciadores de tarefas, editores de documento e aplicações de comércio eletrônico. O objetivo do trabalho é avaliar técnicas de planejamento de capacidade orientadas a negócio para aplicações de comércio de eletrônico no contexto de SaaS.
Na Conversa LSD desta semana (27/10 16h) iremos discutir um pouco a respeito do trabalho que David Candeia desenvolve no LSD.
Resumo:
A oferta de aplicações de comércio eletrônico que buscavam atender um grande número de clientes, ou ainda, que estavam sujeitas a fortes restrições, despertou na última década um forte interesse a respeito do gerenciamento das infraestruturas de provedores considerando métricas de negócios. Com o surgimento do mercado de Computação na Nuvem, novos modelos de serviços de computação despontaram no mercado. Dentre tais modelos destaca-se o modelo de Aplicação como Serviço (Software-as-a-Service, SaaS) que abrange uma grande variedade de aplicações como gerenciadores de tarefas, editores de documento e aplicações de comércio eletrônico. O objetivo do trabalho é avaliar técnicas de planejamento de capacidade orientadas a negócio para aplicações de comércio de eletrônico no contexto de SaaS.
Assinar:
Postagens (Atom)