Soluções simples para situações complexas

Autor: Ozir Francisco de Andrade Zotto - GPT

Se você é daquele tipo cada vez mais raro de pessoa, extremamente organizado, provavelmente seu microcomputador reflete essa qualidade. Assim, seus diretórios de arquivos são estruturados por assuntos, com vários níveis de subdiretórios hierarquizados, e os arquivos têm denominações facilmente identificáveis que facilitam a sua rápida recuperação a qualquer momento.

Se, além disso, você também possui uma "memória de elefante", é capaz de lembrar o que comeu no almoço de ontem, e de quem sentou em quais lugares no restaurante – enfim, é capaz de ter mais do que uma vaga lembrança dos fatos assim que estes saem do buffer evanescente de memória para assuntos cotidianos - então você consegue saber onde guarda todos os seus dados, e este artigo, provavelmente, não vai interessar.

Agora, se você é uma pessoa normal como eu, e tudo isso aí em cima pareceu coisa de maníaco ou de maluco, então esse artigo merece ser lido.

Pessoas normais (como você e eu), mesmo que procurem organizar seus arquivos, muitas vezes podem ter dúvida na hora de salvar um quentíssimo paper que acabaram de descobrir na Internet. Tenho mais de 20 pastas de diretórios só para assuntos de interesse profissional e acadêmico – além de outras para assuntos pessoais, que também conseguem se inserir em nosso microcomputador de trabalho.

Ora, se temos dúvida até mesmo na hora de salvar um arquivo, o que dizer do problema que teremos na hora de reencontrá-lo algumas semanas depois?

Acrescente a essas preocupações as centenas de e-mails que você vai guardando no seu micro, planilhas, imagens e sons maravilhosos, apresentações em PowerPoint, Corel, bancos de dados Access, páginas imperdíveis da Internet, arquivos zipados, lhazados, targeados, etc. Afinal de contas, hoje em dia comprar gigabytes de memória é barato, e seu sentimento de ecologista engajado faz você evitar ficar imprimindo tudo de interessante que essa vida de "batedor de bytes" vai trazendo. Mesmo porque não adiantaria muito imprimir, pois você já não consegue encontrar o que precisa na tonelada de papel que hoje perigosamente armazena em casa e no trabalho, em todas as gavetas, prateleiras e armários a que tem acesso e nos quais consegue manter um precário e discutível domínio.

Pois bem, saiba que agora existe uma ferramenta muito simples que pode facilitar a vida de pessoas normais como nós. [1]

O nome da maravilha é AltaVista Personal Search 97. Bingo! Você adivinhou! É uma versão para seu micro pessoal de uma das mais poderosas e respeitadas máquinas de pesquisa da Internet, o AltaVista, da Digital Equipment Corporation (http://www.altavista.digital.com/). [2]

Se você quiser experimentar essa ferramenta, basta vir pegá-la na área de downloads da Intranet GPT (http://10.15.61.89/Software/ avsmc253c.exe), e comprovar o que estou escrevendo. Para quem não tem acesso à nossa intranet, o arquivo de apenas 7,34MB está disponível no próprio site da Digital. (Apenas 7,34MB? Acho que ouvi o querido mestre Muller e outros heróicos precursores da informática na CELEPAR tendo mais um chilique sobre os bons tempos onde se programava em Assembler e cada um dos 8 bits de um byte era aproveitado para armazenar diferentes informações.)

Aproveitando enquanto nossos amigos da velha guarda ainda estão meio nocauteados, preciso informar que também serão necessários uns 15MB para a instalação do software, e mais uma área de uns 15MB para os índices; área essa variável com a quantidade de dados que serão indexados. A configuração mínima para rodar o AltaVista é um processador 386 25MHz e 16MB RAM, e está disponível para Windows 95 e Windows NT V4.0. Um dos seguintes browsers também será necessário: Netscape V3.0 ou V4.0 ou Microsoft Internet Explorer V3 ou V4. O protocolo TCP/IP do Windows 95 também precisa estar instalado, pois outros TCP/IP não são suportados.

Depois de instalado em seu micro, o AltaVista Personal permanece ativo como dois ícones na Barra de Tarefas do Windows. O primeiro ícone é o AltaVista Personal 97 Indexer, e serve para programar as configurações desejadas para a indexação. O segundo, é o AltaVista Personal 97 Query Dispatcher, e atua como servidor para atender as consultas que serão realizadas.

Ao término da instalação do software, se autorizado o reboot do sistema, a primeira indexação inicia automaticamente após o Windows reiniciar. Se preferir mudar a configuração default, é recomendável interromper essa indexação e programar uma configuração mais adequada, clicando no ícone AltaVista Personal 97 Indexer.

O AltaVista Personal faz a indexação, pesquisa e recuperação de informações de mais de 200 formatos de arquivos. É uma ótima ferramenta de produtividade, pois todo o conteúdo que estiver armazenado no seu disco local, ou nas conexões de rede que você indicar, poderá ser rapidamente localizado. É interessante lembrar que todas as palavras dos arquivos indicados serão indexadas, mesmo vogais e letras isoladas.

A recuperação pode ser feita por palavras ou frases, nos modos de pesquisa simples ou avançado, através do interface web mundialmente conhecido, pois a ferramenta é acionada diretamente pelo browser. Durante a instalação você pode até mesmo optar que essa página passe a ser sua página inicial. De qualquer forma o aplicativo ficará disponível como mais um item de seu Bookmark (Netscape) ou Favoritos (Internet Explorer), além de se intalar no menu Iniciar do Windows, dentro das funções Programas e Localizar.

Agora que você já estava se convencendo a baixar essa maravilha a partir da Intranet GPT (http://10.15.61.89/), você conseguiu juntar dois neurônios e numa sinapse admirável resolve questionar:

- Mas o Windows 95 já não dispõe da função Localizar, que em seu modo avançado também pesquisa nos conteúdos de documentos?

Ou então quem sabe você é um dos heróicos dinossauros do PC a vapor, que ainda usa comandos do DOS tipo DIR C:\ARQ*.DOC /S para encontrar tudo o que precisa no seu Pentium 266MHz, com 2 GB de Hard Drive.

Bem, para os amantes do DOS não tenho muito o que falar, pois amor é amor, e esses valores absolutos não se questionam. Uma língua menos bondosa diria de outra forma, lembrando o dito popular: "Quem ama o feio, bonito lhe parece". [3]

Quanto à função Localizar do Windows 95, na minha opinião quase nem dá para comparar com o AltaVista. De cara, além da quantidade de tipos de arquivos indexáveis pelo AltaVista ser mais do que o dobro, no Localizar você também precisa saber antecipadamente em que tipo de arquivo está a informação que você quer achar. Também será necessário informar exatamente o string procurado, e essa procura é bastante demorada. E se por ventura você achar vários arquivos semelhantes, o máximo que saberá sobre cada um sem abri-lo é seu nome, localização, tamanho, tipo e data da última atualização.

Já o AltaVista retorna a contagem do número de documentos encontrados, e uma lista com os links ativos para recuperá-los ao click do mouse. Também aparece o conteúdo do início do próprio documento e a data da criação (ou atualização), e, no final da página, a contagem das palavras individualmente solicitadas na consulta.

Simples, não é mesmo?

Pois bem, como tudo nessa vida tem um preço, também tinha que aparecer uma certa inconveniência. Para que não aconteça aquilo que hoje ainda é uma das pragas difíceis de resolver na Internet – os links mortos que apontam para páginas e arquivos que não estão mais onde um dia estiveram – você vai ter que gerenciar a freqüência de atualização dos índices. Para isso basta clicar no ícone AltaVista Personal 97 Indexer citado anteriormente, e configurar a freqüência, os tipos de arquivos e os diretórios locais e da rede que você quer tornar disponíveis nas futuras pesquisas.

O tempo para a indexação dependerá da quantidade de dados e da variedade de tipos de arquivos a serem indexados. Por isso é aconselhável fazer um acompanhamento da performance da atualização dos índices, para saber se não será conveniente rever essa configuração.

A tabela abaixo mostra um resumo de algumas indexações que acompanhei em meu micro. [4]

 

Data

Duração

(hh:mm:ss)

Nº de Palavras

Nº de Itens

(Palavras Individuais)

Objetos no Arquivo de Índices

Tamanho do Arquivo de Índices

12/05/98

02:25:44

1.918.808

2.751

119

11,1 MB

19/05/98

02:20:01

1.880.494

2.011

119

11,8 MB

21/05/98

01:24:28

1.823.988

1.623

107

11,5 MB

26/05/98

02:16:44

1.886.601

2.109

107

12,0 MB

01/06/98

02:19:40

1.908.198

1.705

107

13,6 MB

 

Mesmo com a atualização de índices programada para executar no intervalo do almoço, não estava muito satisfeito com a performance. O fato de estar usando um micro 60MHz não estava ajudando muito. Quando retornava à tarde a atualização ainda estava executando, o que tornava meu micro muito lento para fazer outras coisas. Assim alterei a configuração eliminando algumas conexões da rede menos utilizadas, e o resultado passou a ser o seguinte:

 

Data

Duração

(hh:mm:ss)

Nº de Palavras

Nº de Itens

(Palavras Individuais)

Objetos no Arquivo de Índices

Tamanho do Arquivo de Índices

02/06/98

00:54:11

894.391

950

75

11,2 MB

03/06/98

00:55:31

947.024

1.242

75

11,2 MB

04/06/98

01:41:29

1.620.631

1.535

104

14,2 MB

05/06/98

01:59:02

1.724.611

1.602

107

16,2 MB

09/06/98

01:38:28

1.729.440

1.357

107

16,0 MB

 

Dá para ver que no dia 4 reprogramei a indexação, buscando um ajuste mais preciso nas minhas necessidades.

Fora essa parte chata da indexação, a parte boa é que a resposta às consultas é imediata, mesmo para um micro 60 MHz. ;-)

Um Caso Mais Profissional:

Agora vamos falar mais sério, relatando um caso de utilização dessa ferramenta como solução simples e adequada para uma situação realmente complicada.

A Secretaria de Comunicação Social produz textos e fotografias com notícias diárias do governo como pré-release para a imprensa. A divulgação dessas notícias é pública através da Internet (http://www.pr.gov.br/noticias/), e os próprios jornais e rádios se utilizam desse meio para um rápido acesso ao que está disponível para ser divulgado.

Esse processo estava (e está) funcionando bem, mas nos bastidores da Redação da Secretaria às vezes um grave problema aparecia. Eles eram solicitados a apresentar detalhes de notícias geradas há algum tempo, e que não estavam mais disponíveis na Internet, onde permanecem por um mês. Atender esses pedidos era sempre crítico e urgente – como montar um panorama dos investimentos numa determinada região do Estado que seria visitada no dia seguinte pelo governador. Encontrar os artigos certos era um processo árduo e desgastante, pois os textos permanecem arquivados na rede local, mas "perdidos" entre milhares de outros arquivos com nomes semelhantes e assuntos parecidos, num volume que hoje tem mais de 300 MB de arquivos Word (após uma grande "limpa" realizada em arquivos antigos no final do ano passado).

Para solucionar esse problema algumas soluções foram propostas. Algumas envolviam tecnologias sofisticadas e custos proibitivos, enquanto que outras simplesmente se mostraram incapazes de resolver a situação. Não vem ao caso comentar essas propostas, pois isso tudo já está hoje superado. [5]

O AltaVista Personal foi instalado num dos micros do Núcleo de Informática para testes preliminares. Inicialmente, foram indexados 3 subdiretórios, totalizando mais de 10 MB. O treinamento básico do cliente foi muito rápido, por tratar-se de uma plataforma e interfaces conhecidos. A reação imediata ao uso do software foi entusiasmadamente positiva. Combinamos que uma nova indexação, com todos os dados da Redação, seria executada à noite, para não sobrecarregar a rede. Esses testes passaram a ser feitos pelo próprio cliente, sem necessidade de interferência do analista. Só voltamos novamente na SECS para uma nova demonstração, agora para pessoas da Redação, que seriam os principais usuários. A avaliação foi novamente muito positiva, e a ferramenta foi aprovada para implantação definitiva nos equipamentos da própria Redação.

Atualmente essa ferramenta está instalada em 2 microcomputadores da Redação, e o retorno de sua utilização continua sendo de muita satisfação pela solução simples e eficaz para uma situação extremamente desgastante, que já durava mais de 3 anos.

 [1] Também existem tecnologias para gerenciamento eletrônico de documentos em papel, direcionadas para grandes corporações. Algumas dessas tecnologias incluem: Excalibur RetrievalWare (Excalibur Technologies), ImagePlus (IBM), WaterMark (Filenet), InfoImage Folder (Unisys) e Keyfile (Keyfile Corporation).

[2] Agora no mês de junho, a Digital foi adquirida pela Compaq por US $8.4 bilhões, e a união desses dois gigantes da computação promete revolucionar o mercado mundial.

[3] Isso não é uma crítica ingrata ao bom e velho DOS, mas a capitulação aos sinais dos tempos.

[4] Embora utilize este software desde outubro de 1997, somente agora procurei acompanhar a performance das indexações.

[5] Quem quiser conhecer um pouco do lado escrito dessa longa história pode consultar a base de Projetos CELEPAR pelo Notes.