Nesta quinta-feira (01/07), na Conversa LSD, teremos duas palestras: "Assessing the Quality of Textual Features in Social Media" que será proferida por Flavio Vinicius (Peruca) e "Análise da Eficiência em termos de Velocidade de Download em Comunidades BitTorrent" que será proferida por Jaindson Santana. Abaixo os resumos das apresentações.
Assessing the Quality of Textual Features in Social Media
by Flavio Vinicius
Social media is increasingly becoming a significant fraction of the content retrieved daily by Web users. However, the potential lack of quality of user generated content poses a challenge to information retrieval services, which rely mostly on textual features (particularly tags) commonly associated with the multimedia objects. This paper presents what, to the best of our knowledge, is the currently most comprehensive study of the quality of textual features in social media. We analyze four different features, namely, title, tags, description and comments posted by users, in four popular applications, namely, YouTube, Yahoo! Video, Last.FM and CiteULike. Our study is based on an extensive characterization of data we crawled from the four applications with respect to usage, amount and semantics of content, descriptive and discriminative power as well as content and information diversity across features. It also includes a series of object classification and content recommendation experiments as case studies of two important information retrieval tasks. Classification and recommendation effectiveness is analyzed in light of our characterization results. Our findings provide valuable insights for future research and design of Web 2.0 applications and services.
Análise da Eficiência em termos de Velocidade de Download em Comunidades BitTorrent
Por Jaindson Santana
Pesquisas recentes tem mostrado que, embora tenha ocorrido um decréscimo no tráfego de sistemas de compartilhamento P2P na Internet em relação a outros serviços, ainda é possível observar um aumento de seu tráfego em valores absolutos. Dentre os sistemas utilizados, o BitTorrent se apresenta como o mais utilizado.
Uma das práticas utilizadas por alguns usuários BitTorrent consiste em criar ou se unir ao que chamamos de comunidades. Elas são criadas visando: amenizar problemas encontrados no sistema como poluição de conteúdo, unir usuários com interesses em comum, estabelecer uma rede social que agregue serviços além da distribuição de conteúdo, melhorar a qualidade de serviço, etc. Além disso, normalmente elas utilizam regras/políticas de conduta que seus usuários devem obedecer para fazer parte dela.
Como foi dito, a qualidade de serviço é uma das preocupações que levam os usuários a participarem de uma comunidade. No caso do BitTorrent, a qualidade de serviço pode ser vista em termos da velocidade de download experimentada por seus usuários.
O objetivo deste trabalho consiste na investigação de que fatores externos ao protocolo BitTorrent, mas presentes nestas comunidades, influenciam a qualidade de serviço experimentada pelos usuários das comunidades BitTorrent. Neste contexto, a Conversa LSD terá como objetivo realizar uma explanação em detalhes sobre este trabalho e seus resultados preliminares.
Notícias, apontadores, pensamentos e pesquisas do Laboratório de Sistemas Distribuídos da UFCG
Mostrando postagens com marcador compartilhamento. Mostrar todas as postagens
Mostrando postagens com marcador compartilhamento. Mostrar todas as postagens
quarta-feira, 30 de junho de 2010
segunda-feira, 24 de agosto de 2009
Uma história sobre cooperação: slides
Transparências da apresentação de quarta última nas Conversas LSD:
Uma história sobre cooperação @ Conversa LSD
View more presentations from guest189247.
terça-feira, 21 de abril de 2009
Individual and Social Behavior in Tagging Systems
Capitaneados por Elizeu Santos-Neto, ilustre colaborador do LSD a distância (atualmente doutorando no NetSysLab da UBC), eu, Matei, Adriana e David colaboramos em um artigo que foi aceito para a Hypertext 2009.
Em Individual and Social Behavior in Tagging Systems, nós analisamos o comportamento de usuários do CiteULike e Connotea a respeito de como eles compartilham itens a anotações sobre itens. Entre outras coisas, os resultados mostram que tipicamente dentre os itens adicionados às bibliotecas dos usuários em um dia, apenas uma pequena fração já existia no sistema. Isso implica que itens tipicamente são pouco compartilhados. Tags (ou anotações), por outro lado, são compartilhadas mais freqüentemente. A partir de observações como essas, o artigo traz uma série de recomendações para sistemas que se baseiam em explorar o comportamento de usuários em sistemas de tagging.
Em Individual and Social Behavior in Tagging Systems, nós analisamos o comportamento de usuários do CiteULike e Connotea a respeito de como eles compartilham itens a anotações sobre itens. Entre outras coisas, os resultados mostram que tipicamente dentre os itens adicionados às bibliotecas dos usuários em um dia, apenas uma pequena fração já existia no sistema. Isso implica que itens tipicamente são pouco compartilhados. Tags (ou anotações), por outro lado, são compartilhadas mais freqüentemente. A partir de observações como essas, o artigo traz uma série de recomendações para sistemas que se baseiam em explorar o comportamento de usuários em sistemas de tagging.
Seedboxes: pagando para compartilhar
A idéia básica de uma comunidade BitTorrent é que usuários compartilham recursos para distribuir conteúdo de forma eficiente. Embora geralmente o recurso compartilhado por cada usuário seja a largura de banda de seu próprio PC, esses dias tomei conhecimento de que é uma prática popular no BitTorrent alugar um servidor bem-conectado para agir como seu proxy na distribuição de conteúdo. Esses proxies são chamados nas comunidades de seedboxes (e podem ser alugados, por exemplo, aqui).
Um aspecto interessante é que uma das principais motivações dos seedboxes é a de permitir ao usuário cumprir com regras de compartilhamento impostas pelas comunidades. Como a eficiência na distribuição de conteúdo de uma comunidade depende da contribuição de seus usuários, várias comunidades impõem regras que exigem que os usuários contribuam uma determinada fração do que consomem da comunidade. Alguns usuários podem não ter largura de banda de upload ou uptime o suficiente para atingir as metas impostas pelas comunidades e aí, nesse caso, usar seedboxes é uma alternativa viável.
Outro aspecto é que se muitos usuários usam seedboxes, torna-se difícil para usuários que não os usam contribuir no mesmo 'ritmo', causando uma espécie de inflação na comunidade e potencialmente excluindo os que dispõem de menos recursos.
Um aspecto interessante é que uma das principais motivações dos seedboxes é a de permitir ao usuário cumprir com regras de compartilhamento impostas pelas comunidades. Como a eficiência na distribuição de conteúdo de uma comunidade depende da contribuição de seus usuários, várias comunidades impõem regras que exigem que os usuários contribuam uma determinada fração do que consomem da comunidade. Alguns usuários podem não ter largura de banda de upload ou uptime o suficiente para atingir as metas impostas pelas comunidades e aí, nesse caso, usar seedboxes é uma alternativa viável.
Outro aspecto é que se muitos usuários usam seedboxes, torna-se difícil para usuários que não os usam contribuir no mesmo 'ritmo', causando uma espécie de inflação na comunidade e potencialmente excluindo os que dispõem de menos recursos.
Assinar:
Postagens (Atom)