Web 2.0 e <i>Folksonomy</i>

e Folksonomy

Marcirio Silveira Chaves

Pólo XLDB da Linguateca

O que é Web 2.0?

  • Web como uma plataforma
  • Software
    • como um serviço continuamente atualizado
    • consome e integra dados de múltiplas fontes
    • inclusão de usuários individuais
    • arquitetura de participação

O que é Web 2.0?

  • Britannica Online -> Wikipedia
  • diretórios (taxonomias) -> tagging (“folksonomy")
  • Ofoto (Kodak EasyShare Gallery) -> Flicker
  • ...

  • 2ª Fase da WWW
  • Primeira conferência Web 2.0 - Outubro 2004
  • Posição do usuário: Ele tem o controle sobre seus dados

Motivação

  • Web 2.0 - Mudança de paradigma?
  • Folksonomy - Relação com taxonomias e ontologias

Estrutura da Apresentação

  1. Web 2.0 - Princípios
  2. Folksonomy
    • Fraquezas
    • Forças
    • Folksonomy e Ontologia
    • O trabalho de Peter Mika
  3. Serviços Web
  4. Considerações Finais e Reflexões

Princípios da Web 2.0

  • Serviços escaláveis
  • Controle sobre o único
  • Usuários como co-desenvolvedores e aproveitamento da “inteligência” coletiva
  • Software acima do nível de um simples dispositivo
  • Interfaces, modelos de desenvolvimento e modelos de negócio fracamente acoplados

Serviços escaláveis

  • Fim dos pacotes de software
  • Sem lançamentos agendados, apenas melhoramentos contínuos
  • Sem licenças ou venda, apenas uso

  • “O valor do software é proporcional a escala e dinamismo dos dados que ele ajuda a gerenciar”.

Controle sobre o único

  • Fontes de dados difíceis de recriar
    • Tornam-se mais ricas à medida que mais pessoas as usam

Usuários como co-desenvolvedores
e aproveitamento da
“inteligência” coletiva



  • Usuários acrescentam valor
  • Google (Page Rank), EBay e Amazon
  • Wikipedia, Flickr, del.icio.us, ...
  • Serviço melhora quanto mais pessoas o usam
  • Qualquer usuário pode ler ou escrever

Software acima do nível de um
simples dispositivo


  • Aplicações projetadas para serem acessadas por
    • Dispositivos móveis
    • PCs
    • Servidores web
    • ...
  • SW livre (MySQL, PHP, Perl, ...)
  • Ciclo de desenvolvimento rápido, barato e não acoplado

Interfaces, modelos de
desenvolvimento e modelos de
negócio fracamente acoplados



  • Capacidade de adaptação (integração) em outros ambientes
  • Ex.: interfaces APIs, Google Maps

Long Tail

  • Poucos “vistos” muitas vezes e muitos “vistos” poucas vezes
  • Ex.: Amazon.com - Aumento do canal de distribuição
  • Ex.: iTunes - mp3 por um euro
  • Fazer tudo disponível para todos
  • Ajudar o usuário encontrar o produto

Folksonomy

Folksonomy

  • folk (ou folks) = pessoas
  • nomos = gerenciamento

  • Gerenciamento da “classificação” feita pelas pessoas
  • Gerenciamento da etiquetagem feita pelas pessoas
  • Consenso popular
  • Inventor do termo: Thomas Vander Wal (vanderwal.net)

Folksonomy ou ...

  • folk classification
  • ethnoclassification
  • distributed classification
  • social classification
  • collaborative tagging, não collaborative categorization
  • social tagging
  • open tagging
  • free tagging
  • ...

Folksonomy

  • Processo de anotação
    • colaborativo
    • simples
    • livre de estrutura
    • não existe hierarquia
    • grupos de etiquetas relacionados automaticamente baseados em URLs comuns

Paradigmas

  • Metadados DC
  • Vocabulários controlados
  • Hierarquias
  • Taxonomias formais

  • X
  • Folksonomy

Taxonomias

  • Relativamente cara
  • Não exaustiva
  • Autoritativa
  • Visão limitada
  • Difícil manutenção e expansão

Folksonomy

  • Existe uma tendência natural para a convergência de etiquetas
  • Etiquetas já existentes geralmente são apresentadas ao usuário no momento da marcação
  • Pessoas tendem a dar nomes que estão em um nível básico em uma hierarquia
    • gato ao invés de animal
    • cão ao invés de mamífero

Tipos de Folksonomies

  • Folksonomy Larga
    • Muitas pessoas etiquetam o mesmo objeto
    • Cada pessoa pode etiquetar o objeto com suas próprias etiquetas
    • Ex.: del.icio.us
  • Folksonomy Estreita
    • Uma ou poucas pessoas fornecem etiquetas que a pessoa usa para recuperar o objeto
    • Cada etiqueta com um termo
    • Ex.: Flickr
  • Folksonomy Pessoal
    • Usuário etiqueta seus objetos
    • Ex.: marcadores Gmail
Gmail - possibilidade de adicionar vários marcadores para uma conversa (um mail) e pesquisar por esses marcadores. Usuário não é obrigado a escolher apenas uma pasta.

Folksonomy

  • Etiquetar objetos
    • Sítios favoritos
    • Fotos
    • Referências
    • Vídeos
    • Objetivos
    • ...
    • "Nova" fonte de dados para encontrar e organizar a informação: usuário

Fraquezas

  • Polissemia e homonímia (banco)
  • Sinonímia (TV, televisão)
    • Etiquetas recomendadas (delicious)
  • Variações de número
    • singular x plural (gato, gatos)
  • Distinção entre maiúsculas e minúsculas
    • Sapo (empresa), sapo (animal/réptil)
  • Uso de pontuação e abreviações
    • centro-lisboa, centro_lisboa, centro:lisboa, centro/lisboa, ...
    • pt, portugal_telecom, portugal:telecomunicações, ...
    • Segurança

Forças

  • serendipity
    • capacidade de encontrar algo inesperado e útil
    • capacidade de demonstrar descobertas “por acaso”
  • vocabulário dos usuários
  • capacidade de adaptação rápida às mudanças de vocabulário dos usuários
  • descoberta de sinônimos entre culturas
  • cooperação: capacidade de concordar com uma etiqueta é maior do que concordar com uma taxonomia
descoberta de sinônimos entre culturas - torna o objeto mais fácil de ser encontrado

Interfaces

Interfaces

Folksonomy e Ontologia

  • Ontologia tradicional: conceitos + ocorrências
  • Folksonomy: atores + conceitos + ocorrências
    • Considerar a informação do usuário (ator)
    • ``Ontologias somos nós'' [Peter Mika 05]

3 conjuntos disjuntos:
Usuários: U = {u1,..., uk}
Conceitos: C = {c1,...,ck}
Ocorrências: O = {o1,...,ok}
Folksonomy = F
ocorrências = objetos anotados: dar exemplos
F contém A x C x O.

Folksonomy e Ontologia

Estudo de caso: del.icio.us

Estudo de caso: del.icio.us

Estudo de caso: del.icio.us

Estudo de caso: del.icio.us

Estudo de caso: Web

Estudo de caso: Web

Construção do grafo (UC)
Suposição:
Ex.:
  • Consulta a um motor de busca o nome do usuário e do conceito
  • "Luis Sarmento" and "Terminologia"
    "Nuno Cardoso" and "Terminologia"
    "Diana Santos" and "Terminologia"

Estudo de caso: Web

Construção do grafo (UC)

Estudo de caso: Web - Grafo (UC)

Estudo de caso: Web

Resultados (100 associações mais fortes em cada grafo):
Grafo UC:

Estudo de caso: Web

Construção do grafo (CO)
Normalização: Método de análise de co-ocorrência em mineração de textos

Estudo de caso: Web - Grafo (CO)

Estudo de caso: Web

Grafo CO:

Sobreposição de comunidades (grafo UC) possui uma ligação mais forte do que conjuntos sobrepostos de páginas da web (grafo CO).
HTML, XML, databases: conceitos não diretamente relacionados com ontologia

Estudo de caso: Web

Avaliação:

Considerações sobre o trabalho de
Peter Mika

Serviços Web

  • Diretório de sítios Web 2.0
    • econsultant.com/web2/index.html
  • Lista de sítios Web 2.0
    • sacredcowdung.com/archives/2006/03/
      all_things_web.html

Considerações Finais e Reflexões

Referências bibliográficas