Lun Jul 14, 2008 11:34 am
|
 |
teco000
Perlero Nuevo

|
Registrado: 29 May 2008
Mensajes: 33
Ubicación: Guatemala
|
|
| Buscar texto en imagen |
|
|
Saludos, con una molestia, necesito hacer un programa que busque texto dentro de una imagen tif, debido a que contamos con más de 2 millones de imágenes está difícil hacerlo a mano, ¿alguien sabe de alguna función o alguna manera de hacerlo en Perl?  |
|
|
|
Lun Jul 14, 2008 1:13 pm
|
 |
kidd
Creador de Perl en Español

|
Registrado: 15 Oct 2003
Mensajes: 1389
Ubicación: México
|
|
|
|
|
Hola:
Lo quieres hacer es conocido como OCR. Aunque comúnmente es relacionado con algo que ha sido procesado por un scanner, básicamente es sacar texto de un archivo de imagen.
En Perl encontré algunos módulos que podrían servirte. Para empezar intentaría con OCR::PerfectCR.
Si no, hay otros módulos que podrías intentar:
http://search.cpan.org/search?query=OCR&mode=all
Saludos |
|
Lun Jul 14, 2008 2:26 pm
|
 |
teco000
Perlero Nuevo

|
Registrado: 29 May 2008
Mensajes: 33
Ubicación: Guatemala
|
|
|
|
|
| Gracias kidd, voy a verlos. |
|
Jue Jul 17, 2008 3:41 pm
|
 |
teco000
Perlero Nuevo

|
Registrado: 29 May 2008
Mensajes: 33
Ubicación: Guatemala
|
|
|
|
|
Hola, les mando el código de un simple programa que busca texto en una imagen escaneada, por si les sirve a alguien
| Perl: | #!/usr/bin/perl -w
use Image:: OCR:: Tesseract 'get_ocr';
my $dir= $ARGV[0];
my $texto= $ARGV[1];
my $image;
opendir(FD, $dir) or die ("Can't open ./ directory");
foreach $image (readdir(FD ))
{
$_ = $image;
if (/gr7200710120253_B.tif/ ) {
print "$image \n";
$_ = get_ocr ($dir. $image);
print $_;
if ( / $texto/ ) {
print"$image $text \n";
}
}
}
close(FD ); |
|
|
Jue Jul 17, 2008 4:16 pm
|
 |
explorer
Moderador

|
Registrado: 24 Jul 2005
Mensajes: 4140
Ubicación: Valladolid, España
|
|
|
|
|
¿Es necesario hacer un bucle para decodificar un solo fichero?  |
|
Jue Jul 17, 2008 4:20 pm
|
 |
teco000
Perlero Nuevo

|
Registrado: 29 May 2008
Mensajes: 33
Ubicación: Guatemala
|
|
|
|
|
| jajajaja, perdón, estaba probando y no lo quité |
|
Jue Jul 17, 2008 6:43 pm
|
 |
kidd
Creador de Perl en Español

|
Registrado: 15 Oct 2003
Mensajes: 1389
Ubicación: México
|
|
|
|
|
| Impresionante las cosas que puedes hacer con Perl ¿no creen? |
|
Jue Jul 17, 2008 6:50 pm
|
 |
OzX
Perlero Nuevo

|
Registrado: 14 Jul 2008
Mensajes: 8
|
|
|
|
|
Pero ¿existe algún módulo u algunos parámetros para poder leer pixel a pixel una imagen? ¿Para poder crear un OCR?
Por que he buscado y no he visto ningún manual que haga referencia a aquello.
¡Saludos! |
|
Vie Jul 18, 2008 2:34 am
|
 |
explorer
Moderador

|
Registrado: 24 Jul 2005
Mensajes: 4140
Ubicación: Valladolid, España
|
|
|
|
|
| Con el paquete PerlMagick (Image::Magick) sí que se puede saber el valor de cada pixel. |
|
Lun Jul 21, 2008 5:28 pm
|
 |
creating021
Vive para Perl en Español

|
Registrado: 23 Feb 2006
Mensajes: 487
Ubicación: Frente al monitor
|
|
|
|
|
Aparte de PerlMagick, se puede usar otros módulos (pure-perl) como Image::XPM para dicho trabajo
Claro, eso depende del formato que quieras usar. |
|
Powered by phpBB © 2001, 2005 phpBB Group
|