jueves, 17 de junio de 2010

Creación y modificación de documentos PDF y análisis de metadatos desde código C# (Parte II)

itextsharp[1] Buenas a todos, en el post de hoy vamos a continuar analizando documentos PDF desde código C#, pero esta vez desde una librería diferente que la que utilizamos en el post anterior. Tras realizar una gran batería de pruebas con la librería PDFSharp me di cuenta que las funciones implementadas en estas librerías daban algunos fallos con algunos documentos PDF, eran una minoría, pero me ha parecido interesante ofreceros otra alternativa a esta librería.

Hoy utilizaremos la dll “iTextSharp” (cortesía de mi amigo y compañero Luis), la podéis descargar desde el siguiente link (sourceforge.net):

http://sourceforge.net/projects/itextsharp/

El funcionamiento de las funciones de “iTextSharp” es igual de sencillo que con “PDFSharp”, hoy como ejemplo, aprenderemos a visualizar los metadatos principales de un documento PDF como son el autor, el título, la fecha de creación, el programa utilizado para crear el documento, etc.

En primer lugar agregaremos la dll a un nuevo proyecto. Una vez agregado añadiremos la siguiente directiva using:

using iTextSharp.text.pdf;

Después, crearemos una variable tipo string, donde almacenaremos la ruta del documento PDF que queremos analizar, en este caso por ejemplo analizaremos el manual de la herramienta anubis. E instanciaremos la clase PdfReader:

string path=”http://elblogdecalles.es/descargas/manual_anubis.pdf”;
PdfReader pdfReader = new PdfReader(path);

Una vez creado podremos acceder sencillamente a las claves de los atributos (autor, titulo, fecha de creación, etc.) de la siguiente manera:

foreach (string atributo in pdfReader.Info.Keys)
            {
                mostrarPorPantalla(atributo);
            }

Y a los valores de los atributos con el siguiente fragmento de código:

foreach (string metadato in pdfReader.Info.Values)
            {
                mostrarPorPantalla(metadato);
            }

El resultado final si lo imprimiésemos por pantalla sería el siguiente :

Title

ANUBIS: Manual de Usuario

Author

Juan Antonio Calles García

Subject

Herramienta para la automatización de los Procesos de Footprinting y Fingerprinting durante las Auditorías de Seguridad Informática

Creator

Microsoft® Word 2010

CreationDate

D:20100404172440+02'00'

ModDate

D:20100404172440+02'00'

Producer

Microsoft® Word 2010

¿Sencillo verdad?. En próximos post seguiremos destripando nuestros documentos PDF desde código C# y haciendo cosas mucho mas chulas :)

saludos!

No hay comentarios: