13 de agosto de 2010

Manipulando conteúdo de arquivos PDF

O PDF - Portable Document Format - é um dos formatos de arquivo mais populares para distribuição de documentos. Uma das razões para isso é o fato de que - como o próprio nome diz - esse ser um formato criado para ser "portável". Isso quer dizer que ele poderá ser aberto e lido em praticamente qualquer sistema operacional - Windows, Linux, Mac OS, etc. Ajuda também na popularização a existência de plugins para lê-lo diretamente nos principais navegadores da Internet.

Mas o HTML também é um formato portável, com recursos para criar documentos tão ricos quando o PDF. Por que, então, criar um PDF para publicar um documento na Internet? Acontece que o PDF permitir configurar propriedades extras para, por exemplo, evitar que alguém sem permissão possa alterar o conteúdo ou mesmo copiá-lo. Esse recurso é imprescindível para proteger direitos autorais. Um PDF também pode ser assinado digitalmente, fornecendo uma dupla proteção para previnir alterações não autorizadas.

É corrente a ideia de que criar PDFs profissionais exige a compra de softwares caros, em especial o Acrobat Pro da Adobe, empresa que especificou o formato e desenvolveu as primeiras ferramentas. Mas, de acordo com o Wikipedia, a especificação do PDF foi feita como um padrão aberto e qualquer um pode criar programas para leitura e/ou criação de arquivos nesse padrão. Tal especificação está publicada no site da ISO, podendo ser adquirida neste link.

Por isso, há bons programas gratuitos para criação desses arquivos, tais como o CutePDF Writer que funciona como uma impressora. Isto é, qualquer documento que você mandar nessa impressora gerará um PDF com o conteúdo correspondente.

Já o NitroPDF Reader é mais flexível pois tem uma interface gráfica inspirada no Office 2007 que permite realizar manutenções diretamente no PDF:
NitroPDF Reader

De acordo com o fabricante, o programa é capaz de ler cerca de 300 extensões diferentes de arquivos e convertê-los em PDF, prontos para edição no próprio ambiente da ferramenta. Entre os formatos com os quais ele trabalha estão os do Microsoft Office (Word, Excel), páginas HTML e diversos tipos de imagens.

Esta ferramenta permite que se adicione comentários e anotações no arquivo, recurso útil para trabalhos colaborativos nos quais mais de uma pessoa faz sugestões e correções ao documento. Nesta mesma direção, a ferramenta também tem recursos para destacar trechos do documento e acrescentar textos em qualquer ponto.

É possível ainda a criação de "carimbos" para identificar o autor de uma manutenção ou garantir a procedência do arquivo, numa espécie de assinatura eletrônica embutida no documento final. De acordo com a sensibilidade do conteúdo, esse carimbo pode ser protegido por senha para evitar uso indevido.

Pra quem trabalha com formulários em PDF, o NitroReader permite salvar uma cópia com as informações lançadas nos campos, garantindo o registro de como o formulário foi preenchido.

Um outro recurso bastante interessante é o que permite extrair todo o texto do documento de um modo que a formatação - parágrafos e espaços - não se perca, ao contrário do que ocorre com o Copiar do Acrobat Reader. Isso levanta, no entanto, uma preocupação com seus próprios textos inseridos num PDF: se não quer que seu trabalho seja tão facilmente copiado, a sugestão é não inserí-lo como texto mas como uma imagem.

O NitroPDF Reader está em versão beta e é gratuito. Há uma outra versão chamada NitroPDF Reader Pro mais completa, com outros recursos e facilidades mas esta é paga.

2 comentários :

Unknown disse...

Existe algum leitor ou componente para delphi que nos possibilite ler esse tipo de arquivo e protege-lo contra cópia e impressão? TEntei utilizar os OCX's da acrobat e do foxit porem não me permitem bloquear estas funçoes!

Luís Gustavo Fabbro disse...

Tiago

O jeito mais fácil seria criar o próprio PDF com essas restrições e abrí-lo com o OCX da Acrobat; ele próprio se encarregará de controlar as atividades permitidas. Desse modo, seu arquivo também estará a salvo de manutenções mesmo qdo exibido por outros programas.

Você pode ainda pesquisar o SourceForge por algum componente que permita exibir o PDF do jeito que você precisa.

[]s

Postar um comentário

OBS: Os comentários enviados a este Blog são submetidos a moderação. Por isso, eles serão publicados somente após aprovação.

Observação: somente um membro deste blog pode postar um comentário.