Projeto Base de Dados Textuais

Autora: Sara Fichman Raskin - GPT    

Relatamos, em artigo anterior (BB nº 31), a primeira fase do projeto de base de dados textuais, que culminou nas apresentações dos produtos para tratamento e recuperação de textos identificados no mercado.

Durante as apresentações, os avaliadores pontuaram os itens para avaliação, segundo critérios previamente definidos. Depois de todas as apresentações, foi realizada uma reunião de compatibilização, onde os avaliadores puderam discutir o método de pontuação, de modo a unificar os conceitos e critérios aplicados.

Posteriormente, as avaliações foram tabuladas, multiplicando-se a nota média de cada característica pelo seu respectivo peso, para obter a pontuação de cada produto. A consolidação do resultado da pontuação obtida deu a classificação dos produtos.

Os produtos foram avaliados com base no levantamento de necessidades dos clientes da CELEPAR e segundo critérios definidos considerando a norma internacional ISO/IEC 9126 sobre características de qualidade de software, a seguir.

Funcionalidade do Produto

Conjunto de atributos do produto que caracterizam o que o software faz para satisfazer as necessidades.
  • Adequação: apropriação para as tarefas especificadas.
  • Interoperabilidade: interação com outros sistemas e/ou base de dados.
  • Segurança: controle de acesso/atualização.
  • Autoria: capacidade de construção de aplicações para distribuição.

Confiabilidade

Conjunto de atributos que evidenciam a capacidade do software de manter seu nível de desempenho sob condições estabelecidas durante um período de tempo estabelecido.

  • Maturidade: tempo no mercado (ano de lançamento).
  • Aceitação no mercado: quantidade de usuários.
  • Política de upgrading.
  • Freqüência de falhas.
  • Recuperabilidade: recuperação de dados em caso de falhas.

Usabilidade (Capacidade para uso)

Conjunto de atributos que evidenciam o esforço necessário para se poder utilizar o software.

  • Compreensibilidade: grau de dificuldade para entender a lógica do produto.
  • Operacionalidade: grau de dificuldade para a aplicação e operação do produto (facilidade de uso).
  • Comandos em português.
  • Caracteres portugueses.

Eficiência

Conjunto de atributos que evidenciam o relacionamento entre o nível de desempenho do software e a quantidade de recursos usados, sob condições estabelecidas.

  • Desempenho: tempo de processamento na execução de suas funções e resposta.

Portabilidade

Conjunto de atributos que evidenciam a capacidade do software de ser transferido de um ambiente para outro.

  • Adaptabilidade: adaptação a ambientes diferentes (REDE, UNIX, MAINFRAME), sem a necessidade de aplicação de outras ações ou meios além daqueles fornecidos para esta finalidade pelo software considerado.
  • Instalação: grau de dificuldade para instalação do produto num ambiente especificado.

Características do Fornecedor

Diz respeito ao nível de serviço e atendimento oferecidos pelo fornecedor do produto.

  • Assistência técnica
  • Treinamento
  • Documentação
  • Política de comercialização do produto

Características Técnicas do Produto

Funções desejáveis, particulares aos produtos que estão sendo analisados.

  • Facilidades de edição de texto na entrada de dados
  • Função de importação de outros formatos
  • Cadeia de sinônimos
  • Stop words
  • Restrição no tamanho do documento
  • Restrição no tamanho das bases de dados
  • Número de bases abertas simultaneamente
  • Acesso por qualquer campo do documento
  • Acesso a base de dados via micro(rede)-mainframe
  • Acesso por radical
  • Multiusuário
  • Pesquisa fonética
  • Interface gráfica
  • Compressão de dados
  • Número máximo campos chave
  • Armazenamento de imagens
  • Lógica booleana

O resultado da tabulação das notas atribuídas aos produtos apresentados de acordo com os critérios apresentados, foi o seguinte:

PRODUTOS

TOTAL DE PONTOS

Fólio Views 3.0 for Windows

93,11

Progress

85,97

Light Base

82,21

MicroIsis

78,33

Trove for Manuals

75

Natural Document

72,82

Text Retrieval

72,69

Como podemos observar, a diferença de pontuação entre os produtos não é grande, isto porque em geral todos eles apresentam as funções requeridas para tratamento de texto, diferindo em plataformas e ambientes operacionais, e até algumas vezes influenciados pela apresentação, o que é inevitável.

Em seguida, apresentaremos um breve perfil dos produtos, para darmos uma idéia melhor dos recursos do mesmos. Quem tiver maior interesse, todo o material estará disponível para consulta na Biblioteca da CELEPAR.

Fólio Views 3.0 For Windows

O software foi demonstrado em um NoteBook; foi deixada uma cópia que está instalada na rede Novell da GPT. De maneira geral, o produto está disponível para microcomputadores em rede ou "standalone", com DOS e WINDOWS; não tem versão para UNIX.

O Fólio possui interface gráfica, seguindo o padrão dos softwares "FOR WINDOWS", fácil de instalar e de utilizar; é um produto com ótimo nível de adequação, ou seja, cumpre bem as finalidades a que se destina.

Apesar de ainda ser em inglês (a versão em português já está prometida), é simples de ser entendido e utilizado. Incorpora todos os recursos do ambiente WINDOWS de menus, botões, janelas, cortar e colar, etc. Trabalha sem restrições de tamanho de infobases e número de infobases abertas simultaneamente (o hardware é o limitador). Importa textos de outros formatos e possui editor próprio. Fornece todas as facilidades de pesquisa de qualquer palavra no documento.

O Fólio não depende de nenhum outro produto para funcionar. Importa arquivos de outros editores de texto e banco de dados, mas não exige a presença de nenhum deles.

Progress

Foi apresentado em Notebook do fornecedor, com telas simulando o ambiente do produto em questão. Está disponível para redes de microcomputadores e ambientes UNIX.

Possui interface gráfica com menus, janelas e auxílio; exige equipe permanente para desenvolvimento e manutenção dos aplicativos; é uma ferramenta de desenvolvimento.

É um produto com bom desempenho, faz pesquisa por qualquer campo, faz compressão de dados, possui esquema de segurança própria e está preparado para operar em redes. Recebe textos e dados no formato ASCII e outros formatos padrão.

Mas a solução é geral para banco de dados e não específica para recuperação textual; implementa através de indexação especial esta função, mas necessita de desenvolvimento de aplicações para tal. Possui restrição quanto ao tamanho do documento e o limite máximo de 1023 índices por base. Produto e documentação ainda em inglês.

Light Base

Apresentado em microcomputador 486, está disponível para redes de microcomputadores com DOS nas estações (não tem ainda para WINDOWS) e para ambiente UNIX.

O produto é nacional, os comandos estão em português e a interface é amigável; possui bom editor de textos, pesquisa por qualquer campo, podendo-se utilizar de sufixos e prefixos e faz pesquisa fonética; possui esquema de segurança própria e está preparado para operar em redes, garantindo a integridade dos dados em acessos concorrentes.

Possui função de importação e exportação para outros produtos. Apesar de tudo, trabalha com o texto de forma muito estruturada, parece um software de banco de dados que trabalha com grandes campos do tipo memo.

MicroIsis

Foi demonstrado em microcomputador AT386; está disponível para rede de microcomputadores com possibilidade de intercâmbio de dados com ambientes distintos de computadores (grandes, minis e microcomputadores), independente do software quando observado o padrão ISO 2709. Mas, para ambiente WINDOWS, existe previsão para 1995.

É uma ferramenta de apoio para armazenamento, tratamento e recuperação de informações, projetado especificamente para criação e administração de base de dados estruturada não numérica. Por enquanto, sua interface é caractere. É um software com as funções preestabelecidas para tratamento de entrada de dados, pesquisas nas bases, impressão de relatórios e serviços de administrador de dados. É amigável para o fim a que se propõe; possui algumas funções de navegação na tela através de PFs.

Possui boa aceitação nas bibliotecas, baixo custo de aquisição e manutenção; fácil aprendizagem; permite a criação de base de dados ilimitadas; trabalha com campo de tamanho variável, subcampos e campos repetitivos; permite incorporar as funções especiais desenvolvidas pelo usuário.

O número máximo de campos por tela é de 19; o tamanho máximo de um registro é de 8000 caracteres; número máximo de registros por base de dados é de 16.000.0000 ou 500 MB de registros; número máximo de palavras proibidas (stopwords) é 799.

Trove For Manuals

O software foi demonstrado em um NoteBook; não foi deixada cópia em demonstração. Está disponível para microcomputadores em rede ou "standalone", com sistema operacional DOS/WINDOWS, para máquinas com UNIX e para IBM.

O Trove é um produto inglês que está sendo lançado agora no Brasil; seus comandos e sua documentação estão em fase de tradução, prometidos ainda para este ano.

Possui função de importação de outros formatos e não permite edição de texto no produto. Tem um bom nível de segurança: os usuários precisam ser cadastrados e existe um administrador dos documentos, com totais direitos.

Fornece facilidades de pesquisa de qualquer palavra no documento.

O Trove trabalha com o conceito de "armário" e "prateleira". Cada armário suporta 32 prateleiras e cada prateleira, 254 manuais; cada manual pode ter até 8 milhões de linhas de texto (aproximadamente 130.000 páginas).

O Trove pode acessar arquivos de banco de dados em mainframes IBM, como o ADABAS, através do produto Information Manager, comercializado pela mesma empresa.

Natural Document Management - NDM

É o produto da "Software AG" para armazenamento e recuperação de informações baseadas no mainframe. Foi apresentado em microcomputador com protótipo simulando os passos do que seria no mainframe.

Por enquanto é um produto de uso exclusivo no mainframe (com NATURAL/ADABAS) e existe previsão para UNIX. É bom, dentro das limitações da linguagem NATURAL; os comandos de busca de dados são simples e parecidos com os demais produtos da área. Sua instalação é difícil, exigindo o suporte de corpo técnico; é um produto caro.

É confiável, já possui clientes de grande porte (ITAIPU, COPEL); permite o aproveitamento de recursos de ADABAS; capacidade para processar grandes volumes de dados; comandos de buscas em português; formatação do relatório a critério do usuário; reaproveitamento de outros textos já digitados; é específico para dados que sofrem muitas alterações on-line.

Aceita a importação de documentos digitados em editores de textos diferentes, desde que se faça uma conversão nos dados.

Text Retrieval

Foi instalado no RISC 6000 para a apresentação. Está disponível para demais ambientes RISC/UNIX. Aqui, foi apresentado com interface caractere. Exige uma equipe permanente para desenvolvimento e manutenção dos aplicativos, pois é complexo e amplo.

Permite criação, customização e adição de documentos; faz pesquisa por palavras, frases, fonética, sinônimos, expressões booleanas, etc. Os documentos podem ter tamanhos ilimitados.

Roda sob a plataforma ORACLE, necessitando da instalação completa deste produto. Se destina ao tratamento e manipulação de grandes volumes de dados. Demora para criar as tabelas de índices; não é simples de utilizar.

Recebe textos e dados no formato ASCII e digitados nos principais editores de texto disponíveis no mercado, como WORD PERFECT, MICROSOFT WORD e WORDSTAR. Os documentos recebidos são mantidos no formato original.

Oracle Book

Foi apresentado em Notebook do fornecedor. O software está disponível para qualquer ambiente de microcomputadores com sistema operacional DOS/WINDOWS. É um produto multiusuário.

Permite visualização de documentos na tela do computador com interface gráfica. O modo de apresentação e pesquisa é similar a um livro. Os acessos podem ser feitos por índices ou tabelas de conteúdos (cabeçalho e subcabeçalho). Pode-se pesquisar por palavras, palavras parciais e frases. Permite criar arquivos com sons, imagens e vídeo correspondentes a ícones inseridos no texto.

É um componente da Oracle Cooperative Environment tem uma aplicação das ferramentas de desenvolvimento, exigindo um mínimo de instalação do produto ORACLE para que possa ser utilizado. Procura através de tabelas de conteúdos e índices.

Para integração com produtos não ORACLE, exige o desenvolvimento de programas específicos para cada caso.

Conclusão

De todos os produtos apresentados, foi unânime a preferência pelo Fólio Views, tendência esta confirmada através da tabulação dos resultados das avaliações. Os principais motivos que fizeram com que o Fólio aparecesse em primeiro lugar da lista são:

1. Interface gráfica : o software é totalmente compatível com todos os "FOR WINDOWS", tornando-o muito familiar e fácil de ser utilizado, apesar de ainda não ser traduzido para o português.

2. É perfeito para realizar as tarefas de tratamento de infobases de maneira simples e interativa. Muitos comandos são executados através de ícones e teclas de função, facilitando a pesquisa de palavras no texto, criação de 'links' entre trechos de texto e demais recursos.

3. Possui as características técnicas levantadas como desejáveis, entre elas; as de permitir a edição de textos na entrada de dados; a indexação total do texto; não ter restrições no número de base de dados abertas.

O Fólio Views é um produto indicado para usuários de microcomputadores (ligados em rede ou não) e notebooks, que utilizam WINDOWS como ambiente operacional. Não existe ainda versão do produto para ambiente UNIX.

Os produtos apresentados como solução para plataformas UNIX são muito poderosos em termos de recursos, mas dependem de todo um sistema gerenciador de banco de dados, tornando-os caros e complexos. É o caso do Progress e do Text Retrieval. O Text Retrieval, por exemplo, se apóia no ORACLE e não podemos justificar uma compra de todo o produto ORACLE por causa do Text Retrieval; mas, ao contrário, se a empresa for usuária do ORACLE, pode e deve, até por questões de compatibilidade, usar o Text Retrieval.

O MicroIsis é o padrão recomendado pelo Estado do Paraná para uso em Bibliotecas, seu custo é insignificante, e o software se mostrou eficiente para tratar informações bibliográficas. Existe ainda a expectativa de lançamento da versão para WINDOWS em 1995.

Para os usuários de NATURAL/ADABAS em grande porte, que queiram continuar no mesmo ambiente, há a opção do Natural Document.

Por tudo isso é aconselhável que cada aplicação seja estudada separadamente, para se recomendar o produto mais indicado em cada caso.