obligada > comp.os.* > comp.os.linux.programacion

gamo (07-12-2009, 14:41)
Antes se podía acceder modo texto y en línea de comandos
al diccionario. Ahora han cambiado el submit por una flechita
gráfica y eso hace inviable el método antiguo. ¿Alguien podría
actualizar el script?

#!/usr/local/bin/perl

use warnings;

# Programa para acceder al diccionario de la RAE
# Distribuido bajo los términos de la licencia GNU GPL

if (@ARGV){
if (-e $ARGV[0] && !-d $ARGV[0]){
open IN, "<".$ARGV[0] or die "Cannot open: $!";
chomp ($w = <IN>);
close IN;
}else{
$w = $ARGV[0];
}
}else{
chomp($w = <STDIN>);
}

if (defined $w && $w ne ""){
$a=`lynx -dump -nolist http://buscon.rae.es/draeI/SrvltGUIBusUsual?TIPO_HTML=2'\&'LEMA='$w'`;
print $a;
}

__END__
Gracias y saludos
Gonzalo Pérez de Olaguer Córdoba (07-12-2009, 15:01)
Hola gamo <gamo>
el Mon, 7 Dec 2009 12:41:24 +0000 escribiste:

[..]
> }
> __END__
> Gracias y saludos


Parece que así debería funcionar:

`lynx -dump -nolist http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3'\&'LEMA='$w'`
gamo (07-12-2009, 18:00)
Parece que as=C3=AD deber=C3=ADa funcionar:

`lynx -dump -nolist
&'LEMA=3D'$w'`
----------------------------

Nope, sale lo mismo de antes. Una pantalla con dos entradas de texto y
la llamada a darle a la flechita.

Gracias por el esfuerzo.
Gonzalo Pérez de Olaguer Córdoba (08-12-2009, 05:33)
Hola gamo
el 7 Dec 2009 17:00:13 +0100 escribiste:

> Parece que as=C3=AD deber=C3=ADa funcionar:
> `lynx -dump -nolist
> &'LEMA=3D'$w'`
> ----------------------------
> Nope, sale lo mismo de antes. Una pantalla con dos entradas de texto y
> la llamada a darle a la flechita.


Pues es verdad, pero eso sólo me pasa con el lynx.

Desde el navegador epiphany me funciona bien la URL



que redirecciona a



que es una página con frames. El frame que contiene la info útil es:



y desde epiphany devuelve la info esperada, pero desde lynx devuelve lo que
tú dices.
Ignacio Arenaza (08-12-2009, 16:16)
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

gamo writes:

> Nope, sale lo mismo de antes. Una pantalla con dos entradas de texto y
> la llamada a darle a la flechita.


Creo que de alguna manera comprueba si la petición viene desde un
navegador 'interactivo', porque me pasa como a Gonzalo, desde Firefox
si funciona, pero desde lynx pidiendolo a pelo no.

Así que he hecho un script en Perl mezclando lo que tenías y un par de
recetillas del 'Perl Cookbook' de O'Reilly, y con lo siguiente me
funciona perfectamente :-)

<------> <------> <------> <------> <------> <------> <------>
#!/usr/bin/perl -w

# Programa para acceder al diccionario de la RAE
# Distribuido bajo los términos de la licencia GNU GPLv2

use strict;

use LWP::UserAgent;
use HTTP::Request;
use HTTP::Response;
use HTML::Entities;
use IO::File;
use POSIX;

# Formato de la dirección donde se pide el lema. Por si cambia en el futuro :-)
# Basta con marcar la posicion del lema a buscar con '%s' (sin las comillas)
my $RAE_URL_FORMAT = 'http://buscon.rae.es/draeI/SrvltGUIBusUsual?LEMA=%s&origen=RAE&TIPO_BUS=3';

my ($w, $url, $ua, $req, $resp, $tmpfile, $name, $fh);

if (@ARGV){
if (-e $ARGV[0] && !-d $ARGV[0]){
open IN, "<".$ARGV[0] or die "Cannot open: $!";
chomp ($w = <IN>);
close IN;
}else{
$w = $ARGV[0];
}
}else{
chomp($w = <STDIN>);
}

# Codificar las eñes, tildes y demás en formato HTML.
$w = HTML::Entities::encode ($w);
$url = sprintf $RAE_URL_FORMAT, $w;

$ua = LWP::UserAgent->new();
# Simular que somos Mozilla Firefox 3.5.5 (se puede cambiar a voluntad)
$ua->agent('Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5');

$req = HTTP::Request->new(GET => $url);
# Simular todas las cabeceras que envia Firefox, para dar el pego }:-)
$req->referer('http://www.rae.es/rae.html');
$req->header('Accept' => 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8');
$req->header('Accept-Language' => 'en-us,eu;q=0.7,en;q=0.3');
$req->header('Accept-Encoding' => 'gzip,deflate');
$req->header('Accept-Charset' => 'ISO-8859-1,utf-8;q=0.7,*;q=0.7');
$req->header('Keep-Alive' => '300');
$req->header('Connection' => 'keep-alive');

$resp = $ua->request($req);
if ($resp->is_error()) {
print "Error recuperando la pagina: %s\n", $resp->status_line;
}

do {
$tmpfile = POSIX::tmpnam();
} until $fh = IO::File->new($tmpfile, O_RDWR|O_CREAT|O_EXCL);

print $fh $resp->content();
close $fh;
print `lynx -dump -nolist -force_html $tmpfile`;
unlink($tmpfile);

exit 0;
<------> <------> <------> <------> <------> <------> <------>

Saludos. Iñaki.

- --
Mondragon University

GPG Key available at public keyservers
gamo (09-12-2009, 01:03)
Así que he hecho un script en Perl mezclando lo que tenías y un par de
recetillas del 'Perl Cookbook' de O'Reilly, y con lo siguiente me
funciona perfectamente :-)
------------------

Muchas gracias!

Tengo problemas para compilar HTML-Parser, pero algún día funcionará.

Saludos
J.A. Gutierrez (10-12-2009, 14:43)
Ignacio Arenaza <iarenaza> wrote:
: use LWP::UserAgent;

: print `lynx -dump -nolist -force_html $tmpfile`;

Este....

Y para acabar usando lynx, por que no usarlo desde el principio?

-8<------------------------------------------------------------------------
#!/bin/sh

lynx -crawl -useragent=Mozilla -dump \
"http://buscon.rae.es/draeI/SrvltGUIBusUsual?TIPO_HTML=2&LEMA=$1&FORMATO=DRAE"
-8<------------------------------------------------------------------------
gamo (11-12-2009, 10:18)
Y para acabar usando lynx, por que no usarlo desde el principio?

-8<------------------------------------------------------------------------
#!/bin/sh

lynx -crawl -useragent=Mozilla -dump \
"http://buscon.rae.es/draeI/SrvltGUIBusUsual?TIPO_HTML=2&LEMA=$1&FORMATO=DRAE"
-8<------------------------------------------------------------------------

===========================

Pues muchas gracias, también. Lo he adaptado a perl por motivos de acentos,
eñes y demás, que no me recogería $1, y funciona de maravilla.

Saludos
Temas Similares