Categoria: Modelo Vetorial
 
4 Site(s) nesta categoria           1 a 4 de 4

  Gerard Salton is often credited with developing the vector space model (VSM) for information retrieval (IR). Citations to Salton give the impression that the VSM must have been articulated as an IR model sometime between 1970 and 1975. However, the VSM as it is understood today evolved over a longer time period than is usually acknowledged, and an articulation of the model and its assumptions did not appear in print until several years after those assumptions had been criticized and alternative models proposed. An often cited overview paper titled “A Vector Space Model for Information Retrieval” (alleged to have been published in 1975) does not exist, and citations to it represent a confusion of two 1975 articles, neither of which were overviews of the VSM as a model of information retrieval. Until the late 1970s, Salton did not present vector spaces as models of IR generally but rather as models of specifi c computations. Citations to the phantom paper refl ect an apparently widely held misconception that the operational features and explanatory devices now associated with the VSM must have been introduced at the same time it was fi rst proposed as an IR model.
  Incluído em: 05/10/2010
  Esta dissertação de mestrado apresenta uma nova abordagem para acomparação de objetos armazenados em mecanismos de cache através da análise dasemântica da informação contida nestes objetos. A comparação semântica é utilizadacomo critério para a substituição de objetos armazenados em cache, diferentementedas abordagens clássicas que utilizam propriedades operacionais de cada objeto comoparâmetro para as tarefas de seleção e substituição. A utilização de uma estratégiabaseada em semântica tende a manter no mecanismo de cache os objetossemanticamente próximos, ou seja, os objetos que apresentam afinidade entre si e quesão de interesse para o cliente. O LSR (Least Semantically Related) foi a primeiraestratégia de substituição baseada em semântica. Esta estratégia organiza os objetosmantidos pelo mecanismo de cache em uma estrutura hierárquica, em forma de árvoresemântica, através da qual os objetos são classificados de acordo com assuntos. Porémo LSR não prevê a obtenção da semântica a partir da análise do conteúdo dos própriosobjetos, sendo necessário que estes sejam previamente classificados de acordo comuma taxonomia representada por uma árvore semântica. Além disso, o LSR pressupõeque esta semântica é fornecida juntamente com cada objeto, o que não acontece naprática. Este trabalho introduz uma nova estratégia denominada Least SemanticallyRelated ? Vector Model (LSR-VM), que propõe a substituição da árvore semântica porum mecanismo que utiliza o modelo vetorial, universalmente utilizado em problemasde recuperação de informações, como estratégia para a organização, classificação,comparação e cálculo da distância semântica entre os objetos mantidos no mecanismode cache de forma dinâmica. Ao final desta dissertação são apresentados os resultadosobtidos a partir de simulações realizadas com a estratégia LSR-VM. Os resultadosobtidos são comparados com as estratégias de substituição tradicionais SIZE, LFU(Least Frequently Used) e LRU (Least Recently Used).
  Incluído em: 01/10/2008
  Apresenta-se idéia da representação, indexação e classificação automática de documentos digitais. A representação de documentos via o modelo vetorial é simples e permite-nos lidar com classificação de uma grande quantidade de documentos os quais estão sendo carregados diariamente nas quase 35 bibliotecas digitais de tese e dissertação no Brasil. A expectativa é de termos outras 20 bibliotecas a mais na lista para o fim deste ano. Comparou-se a metodologia de classificação automática descrita nesse artigo, usando uma amostra de documentos reais, com aquela feita pelo especialista humano. Os resultados mostram que esta metodologia é promissora em se reduzir o esforço dos especialistas na realização dessa tarefa.
  Incluído em: 29/10/2012
  Apresenta sucintamente alguns aspectos a respeito da Recuperação da Informação, como seu possível surgimento com trabalhos publicados por Gerard Salton e o conceito de Modelo Vetoria de Recuperação da Informação.
  Incluído em: 27/08/2010
1 a 4 de 4

JOHUHA é um diretório sobre temas relacionados com Ciência da Informação e Biblioteconomia.

Criado pelo Prof. Dr. Angel Freddy Godoy Viera. e-mail: godoy@cin.ufsc.br

Professor do Programa de Pós-Graduação em Ciência da Informação e do Departamento de Ciência da Informação da Universidade Federal de Santa Catarina - Brasil.

Localização dos visitantes do JOHUHA
Voltar Diretorio sobre Ciência da Informação e Biblioteconomia http://www.johuha.ufsc.br/ Copyright & 2006 Pof. Dr. Angel Freddy Godoy Viera, Todos os Direitos Reservados.