Pensadouro LSD

quarta-feira, 21 de março de 2012

Conversa LSD - Leveraging Trust and Distrust for Sybil-Tolerant Voting in Online Social Media

Caros,

Na Conversa LSD desta semana (quarta, 16h, no auditório do LSD) temos uma palestra de um visitante, e gostaríamos de convidar a todos. Segue abaixo uma breve apresentação do palestrante e da palestra.

[]s
Nazareno

Nitin Chiluka está no último ano de seu doutorado na TUDelft e trabalha no uso de análise de grafos para entender e projetar sistemas distribuídos, de recomendação e mídia social online. Eu participo da orientação de Nitin e ele está visitando a UFCG no contexto de um projeto CAPES/Nuffic entre TUDelft e UFCG.

O resumo da apresentação:

Leveraging Trust and Distrust for Sybil-Tolerant Voting in Online Social Media

Voting is a vital component of online social media (OSM). Votes on content items in OSM, e.g., likes in YouTube and Facebook, favorites in Flickr, and diggs in Digg) are typically incorporated into many of their central features such as recommendations, ‘most popular’-like pages and ranking search results. Voting helps in determining popularity and trustworthiness of content.

At the same time, due to their open membership access, voting on content items in OSM is susceptible to Sybil attacks. Malicious attackers can create multiple Sybil identities to outvote the real users of the system. To defend against such an attack, we leverage (i) trust which is inherent in the social network among users in OSM, and (ii) distrust between honest users, who identify some of the spam content items, and the Sybil identities who promoted them. Modeling trust and distrust in the system as a signed network, our method proceeds in two phases. First, we identify nodes and edges that constrain paths along positive edges between the endpoints of each negative edge. Second, we limit the votes from Sybil voters whose paths to honest nodes pass across these bottlenecks. Our simulation results on popular OSM datasets show both the feasibility of incorporating distrust alongside trust to defend against Sybil attacks, and that our method outperforms the state-of-the-art approach, SumUp.

terça-feira, 6 de março de 2012

Conversa LSD: Apresentação e Introdução ao Projeto PDJ - Highly-Virtualising Cloud Resource Broker

Oi pessoal,

Esta semana será a palestra de Josef Spillner, que está fazendo pós-doc aqui no lsd, em parceria com a TU-Dresden. Mantemos o mesmo dia e horário da última conversa: quarta-feira (07/03), 16h.

O resumo da palestra segue abaixo:

Lívia,

-
Título: Apresentação e Introdução ao Projeto PDJ - Highly-Virtualising Cloud Resource Broker

Provedores comerciais de recursos para computação em nuvem (Infrastructure-as-a-Service, IaaS) oferecem um emparelhamento limitado entre os recursos providos e as tarefas submetidos pelo consumidor desses serviços. Isso é dévido aos perfís de configuração de granularidade grossa (p.ex. o tipo de instância EC2-small da Amazon) em combinação com múltiplos inteirezos numa escalabilidade apenas horizontal e restrições implícitos adicionais como medir por hora completa. Em comparação com a utilidade alta de serviços públicos como eletricidade ou água, estas desavantagens deixam uma fenda entre of que os provedores IaaS oferecem e o que seria tecnicamente possível e economicamente vantajoso para o consumidor. A palestra primeira intruduz o Josef e o seu trabalho anterior sobre plataformas de serviçoes e infraestruturas para computação em nuvem, seguido pelo resumo de um plano de solução para esse problema. A solução demanda a operação de um highly-virtualising cloud resource broker que será avaliado durante o ano 2012 sob esquema CNPq PDJ.

quarta-feira, 29 de fevereiro de 2012

Conversa LSD: Automated configuration of distributed storage systems

Olá pessoal,

estamos retomando as conversas lsd nesta semana. Nossa primeira conversa lsd será nessa quarta-feira, 29/02, às 16h, com direito à comemoração dos aniversariantes dos meses de janeiro e fevereiro e boas-vindas aos pesquisadores visitantes (Lauro, Mihai, Nitin e Josef).

O primeiro palestrante será Lauro Beltrão, aluno de doutorado da UBC. O título e resumo da sua palestra seguem abaixo.

Lívia
-------

AUTOMATED CONFIGURATION OF DISTRIBUTED STORAGE SYSTEMS

Distributed storage systems have evolved to employ optimization techniques (e.g., replication, data deduplication, data striping and caching policies) that enable trade-offs over interrelated success metrics such as response time, throughput, storage space, and energy consumption. Setting the configuration parameters of such optimization techniques to best match the success criteria involves exploring a large configuration space to tune the parameters for each of these techniques. Additionally, the values of the configuration parameters are workload-dependent, requiring exploration of the parameters for each different workload. Such exploration makes manually configuring the distributed storage system an undesirable if not unfeasible task.
My research addresses the following main question: How to configure a distributed storage system (i.e., enable/disable various optimization techniques and configure their parameters) to match the application requirements with minimal human intervention?
During my presentation, I will briefly present the motivation to automate the configuration of a distributed storage system and the requirements for an automated configuration solution. I will describe the architecture proposed for anautomated configuration solution and an initial use cases based on data deduplication. Finally, I will briefly present the next steps of my research focusing on the optimization techniques and success metrics that we plan to focus on.

quarta-feira, 26 de outubro de 2011

Conversa LSD: Planejamento de capacidade para aplicações de comércio de eletrônico no contexto de SaaS.

Olá pessoal,

Na Conversa LSD desta semana (27/10 16h) iremos discutir um pouco a respeito do trabalho que David Candeia desenvolve no LSD.

Resumo:

A oferta de aplicações de comércio eletrônico que buscavam atender um grande número de clientes, ou ainda, que estavam sujeitas a fortes restrições, despertou na última década um forte interesse a respeito do gerenciamento das infraestruturas de provedores considerando métricas de negócios. Com o surgimento do mercado de Computação na Nuvem, novos modelos de serviços de computação despontaram no mercado. Dentre tais modelos destaca-se o modelo de Aplicação como Serviço (Software-as-a-Service, SaaS) que abrange uma grande variedade de aplicações como gerenciadores de tarefas, editores de documento e aplicações de comércio eletrônico. O objetivo do trabalho é avaliar técnicas de planejamento de capacidade orientadas a negócio para aplicações de comércio de eletrônico no contexto de SaaS.

quarta-feira, 28 de setembro de 2011

Ativistas, passageiros, ocasionais e especialistas: perfis de usuário na construção de um site de Q&A

Amanhã, às 16 horas, no auditório do LSD, Adabriand apresentará sua investigação sobre como usuários de comunidades de Q&A (ex: Yahoo Answers) se comportam.

Adabriand nos diz que,

entender a estrutura e dinâmica de funcionamento de sistemas de Question and Answer (Q&A) é imprescindível no desenvolvimento de mecanismos para incentivar e melhor aproveitar a produção de conteúdo por parte dos usuários. Neste artigo, exploramos os padrões de comportamento de usuários em um site de Q&A de grande porte segundo métricas de motivação (quantidade de contribuições) e habilidade (qualidade das contribuições) dos usuários. Nossos resultados revelam quatro perfis principais: ativistas, usuários que contribuem muito por um longo período; passageiros, usuários com uma curta permanência e que fazem contribuições de qualidade mediana ou baixa; ocasionais, usuários que permanecem por um longo período, porém contribuindo esporadicamente; e especialistas: usuários semelhantes aos ocasionais, mas que são hábeis na execução de um tipo de atividade. Ao examinar a parcela de contribuição dos grupos formados por esses perfis, observamos que passageiros e ocasionais colaboram com os ativistas na construção da ampla maioria do corpo de contribuições, e que a ausência de qualquer um destes perfis possivelmente degradaria o desempenho do sistema. Com respeito aos especialistas, identificamos que a sua representatividade no total de contribuições é pequena. Esta descoberta motiva o desenvolvimento de mecanismos para incentivar a participação desses usuários.

A apresentação de Adabriand é de livre entrada. Contamos com sua presença.

quarta-feira, 6 de julho de 2011

Conversa LSD: Automatic Suggestion of Efficiency Improvements on Database Routines

Olá Pessoal,

hoje, às 16h, Dimas Cassimiro, aluno de mestrado em ciência da computação da UFCG orientado pelos professores Carlos Eduardo Pires e Tiago Massoni, gentilmente apresentará sua pesquisa sobre como automatizar a detecção de melhorias no desempenho de rotinas de banco de dados.

Assim falou Dimas sobre seu trabalho -- "An efficient and common way to allow data manipulation in databases by applications is implementing database routines. However, if such implementations present inefficient programming logic or data manipulation, excessive delays are provided to the client application layers. Such delays can cause, among other problems, expressive financial losses. To solve this problem, the database routines must undergo a tuning process. Since the tuning process involves manual analysis of source code, its implementation usually becomes too much expensive. In order to reduce the cost of the tuning process, we present an approach based on static analysis of source code to perform automatic detection of potential efficiency improvements on database routines."

Antes da palestra haverá um coredump (Linux Tracing Capabilities) que será apresentado por Thiago Emmanuel.

terça-feira, 28 de junho de 2011

Conversas LSD: Massively-Parallel Graph Processing e Assessing the Value of Tags in Social Tagging Systems

Elizeu (doutorando da University of British Columbia e ex-lsdano ) está nos visitando por algumas semanas. Programamos duas palestras sobre as pesquisas sendo desenvolvida por ele. A primeira palestra será hoje, a segunda quarta-feira, ambas às 16h.

Segue abaixo informações sobre o que será conversado

Palestra 1: Massively-Parallel Graph Processing
Terça, 16h, auditório do LSD

Abstract: The goal of this project is to understand the challenges in
porting graph algorithms to commodity, hybrid platforms; platforms
that consist of processors optimized for sequential processing and
accelerators optimized for massively-parallel processing. This study
fills the gap between current graph processing platforms that are
either expensive (e.g., supercomputers) or ine cient (e.g., commodity
clusters). Our hypothesis is that hybrid platforms (e.g.,
GPU-supported clusters) can bridge the performance-cost chasm, and
o er an attractive graph-processing solution for many graph-based
applications such as social networks and web analysis.

This work presents the first step towards designing Totem (a
graph-processing framework that leverages massively parallel hybrid
platforms. In particular, we design, implement, and evaluate core
graph algorithms (i.e., BFS, Dijkstra's algorithm, and PageRank).
Also, we discuss the future work based on the current experience
provided by these initial implementations.

(joint work with Lauro Beltrão Costa and Abdullah Gharaibeh)

Palestra 2: Assessing the Value of Tags in Social Tagging Systems
Quarta, 16h, auditório do LSD

Users create massive amounts of content in social media websites such as YouTube, Flickr, and del.icio.us. The increasingly large amount of content these systems accumulate poses a challenge to users that want to navigate the vast amount of content produced daily. To distribute the burden of organizing the collections of user-generated content, and to make navigation potentially more efficient, social systems often provide users with tagging features (i.e., users can annotate content they produce or find interesting with free-from keywords). These tags can, in turn, help users to sift through the set of items available in the system.

Similar to other commons-based peer-production systems, the efficiency of tagging rely on the individial contributions of participants. On the other hand, as opposed to systems desinged for resource sharing (e.g., BitTorrent, OurGrid), quantifying the value of contributions in tagging systems poses different challenges, as users produce information instead of physical resources.

This work investigates methods to assess the value of tags from the perspective of a user who is interested in navigating the system. The long term goal is to understand the aspect that influence the perceived value of tags and to inform the design of new mechanisms (e.g., incentive to produce more socially useful tags, or spam detection). In particular, in this talk I will provide an overview of the progress to date towards the aforementioned goal.