Categoria: Indexação
 
70 Site(s) nesta categoria           1 a 10 de 70

  Apresenta o resultado do estudo exploratório sobre a representação do sintagma nominal “História da Paraíba” na WEB, nos sites Google e AltaVista, objetivando investigar a sua forma de organização representacional, no contexto da indexação, e a cobertura de conteúdos, tomando como parâmetro os títulos da base de dados da USP, na área de “História da Paraíba”. A metodologia adotada foi a busca direta no Google e no AltaVista, observação intensiva individual e entrevista não estruturada, além das técnicas da análise de conteúdo. Os resultados mostram que a representação indexal na WEB necessita de reajustes no que diz respeito à função de representação dos documentos eletrônicos para atingir as expectativas deste novo canal de informação. No que diz respeito à cobertura de conteúdo comprovou-se que, apesar de ter alcançado um percentual pequeno de completeza em ambos os sites, tomando por referência a base de dados DEDALUS da USP, os mesmos possuem assuntos de importância na área de História da Paraíba.
  Incluído em: 07/06/2008
  A pesquisa em recuperação de informação tem seu ponto chave na representação de características intrínsecas presentes em uma imagem. Isto tem sido um grande estímulo para pesquisas e para o desenvolvimento de ferramentas que armazenam, recuperam e representam as imagens de forma correta. Levando em consideração que a recuperação é feita por uma busca de imagens semelhantes a uma imagem de referência por meio de medidas de similaridade, o trabalho investiga uma nova forma de indexação de imagens baseada em cor e textura, na qual esses atributos aparecem combinados em um espaço de representação wavelet. É desenvolvido um método que soluciona a extração de cor e textura considerando a multirresolução nas imagens, e ainda uma função de similaridade para realizar o cálculo da semelhança entre a imagem teste e as imagens de uma base de dados.
  Incluído em: 05/06/2007
  Si les méthodes d’indexation, linguistique ou structurelle, bouillonnent avec l’expansion du Web, elles ne sont pas encore parfaitement adaptées aux besoins des utilisateurs. Un retour aux sources s’impose pour penser non plus en termes de langage mais de discours documentaire, prenant en compte le contexte thématique du document.
  Incluído em: 05/06/2008
  Este trabajo describe la experimentacion llevada a cabo para probar la efectividad de la ejecucion de la recuperacion de informacion de los distintos tipos de indexacion automatica bajo el modelo vectorial utilizando el sistema de recuperacion de informacion Lemur. Realizamos diferentes experimentos de consultas sobre la indexacion con informacion lingaustica. Los xperimentos muestran que las indexaciones automaticas con stemmers y con StopWords frente a la de sin stemmers y con Stop-Words no son apaces de mejorar la ejecucion de la recuperacion perola indexacion basada en el sentido correcto de las palabras utilizando el recurso lingau³stico ordNet es capaz de mejorar la ejecucion de la recuperacion.
  Incluído em: 11/05/2008
  Neste terceiro artigo da série, explica o funcionamento da parte de um motor de busca que permite procurar poucas palavras em bilhões de páginas na Web em um tempo aceitável. Sem o processo de indexação seria impossível encontrar todas as ocorrências de uma palavra e mostrá-las na tela de resultados para o usuário. Mas como isso tudo funciona?
  Incluído em: 05/05/2008
  L’accès aux documents audiovisuels devrait être aussi facile que l’accès aux imprimés. Toutefois, une telle réalité nous échappe pour le moment. Les méthodes utiles au traitement documentaire d’imprimés ne s’appliquent pas nécessairement très bien aux documents audiovisuels et multimédias. Dans le cadre de ce projet, nous avons étudié des textes d’audiovision et des descriptions textuelles d’images afin d’évaluer ces derniers en tant que sources de mots-clés pour l’indexation d’images en mouvement.
  Incluído em: 05/06/2008
  Apresenta experimento com a criação automática tanto de diretórios de artigos como também de títulos para cada um destes conjuntos de artigos, usando técnicas automáticas para agrupamentos de documentos, em particular salientando a de extração de semântica latente do texto do documento. Para realização desse trabalho, pegamos emprestada a análise fatorial da Estatística. Esta técnica foi utilizada em uma amostra de 46 artigos da revista eletrônica DataGramaZero. Desta forma, este processo constitui-se em um modelo automático de indexação no qual a semântica latente entre os documentos é realçada. Para agrupar tais documentos utilizamos um algoritmo clássico da literatura para este fim. Para cada grupo de documentos similares foi aplicada, novamente, a análise fatorial objetivando realçar os temos mais relevantes para cada um dos grupos para servir como provável título para o grupo. A classificação automática, apesar de ainda estar longe de substituir aquela realizada por um especialista, tem a vantagem de padronizar a atividade de classificação. Além desta vantagem, esta técnica se mostra superior em lidar com grandes volumes de documentos, o que é cada vez mais uma realidade nesse nosso tempo de Internet. Nossos resultados mostram que nossa ferramenta daria ao usuário uma forma mais amigável de recuperação da informação desejada dentro de um site de uma revista on-line por permitir a pesquisa através de diretórios de assuntos.
  Incluído em: 28/03/2008
  A recuperação da informação consiste numa multiplicidade de operações consecutivas, executadas para localizar uma informação necessária ou documentos que a contenham, com a recuperação subseqüente desses documentos. A recuperação da informação afeta o bibliotecário, como profissional que pretende satisfazer a necessidade social do homem: ter acesso a diversos tipos de informação. O problema da recuperação da informação pode ser visto, por um lado, como uma acumulação constante de um volume sempre crescente da informação e, por outro lado, o crescimento e a complexidade , cada vez maior, das necessidades de informação.
  Incluído em: 07/04/2008
  Com o aparente esgotamento das estratégias atuais de representação e indexação de documentos, faz-se necessário investigar novas abordagens para sistemas de recuperação de informações. Dentre estas abordagens, há uma vertente que busca levar em conta a semântica intrínseca aos documentos textuais, e uma das formas de fazê-lo é através da utilização de sintagmas nominais como descritores, ao invés de palavras-chave. Uma metodologia para atingir tal propósito, desenvolvida no escopo de uma tese de doutorado, é apresentada neste artigo.
  Incluído em: 24/08/2008
  A quantidade de informação publicada na Internet cresce constantemente, tornando difícil aos iternautas recuperarem aquela que lhe é realmente desejada. Para resolver este problema, são criados Sistemas de Recuperação de Informação (SRI). O presente artigo pretende mostrar a indexação de documentos, que é um componente da arquitetura de um SRI.
  Incluído em: 05/05/2008
1 a 10 de 70 Mais >>

JOHUHA é um diretório sobre temas relacionados com Ciência da Informação e Biblioteconomia.

Criado pelo Prof. Dr. Angel Freddy Godoy Viera. e-mail: godoy@cin.ufsc.br

Professor do Programa de Pós-Graduação em Ciência da Informação e do Departamento de Ciência da Informação da Universidade Federal de Santa Catarina - Brasil.

Localização dos visitantes do JOHUHA
Voltar Diretorio sobre Ciência da Informação e Biblioteconomia http://www.johuha.ufsc.br/ Copyright & 2006 Pof. Dr. Angel Freddy Godoy Viera, Todos os Direitos Reservados.