CAPTCHA Y RECAPTCHA - Qué es y para que sirve




Recaptcha es un servicio que ayuda a digitalizar libros, periódicos y programas antiguos de radio.

Un captcha es un programa que permite distinguir si un usuario es humano o máquina.

Probablemente los has visto infinidad de veces en Internet; son esas imágenes distorsionadas que hay en muchos registros de foros, webs y hostings.

Son usados para prevenir el abuso de robots o programs creados para hacer "spam".

Ningún programa puede leer textos distorsionados como el ojo humano, así los bots no pueden navegar por sitios protegidos mediante este sistema.

Alrededor de 200 millones de captchas son solucionados cada día por humanos, en cada ocasión, alrededor de diez segundos humanos son empleados.

Individualmente, esto no es mucho tiempo, pero si sumamos todo nos da más de 150.000 horas de trabajo cada día.

¿Qué pasaría si pudiésemos usar ese esfuerzo humano?

Recaptcha hace eso canalizando el esfuerzo solucionando captchas online en libros "legibles".

Para archivar el conocimiento humano y hacer la información más asequible al mundo, multitud de proyectos están digitalizando libros físicos que fueron escritos antes de la era de los ordenadores.

Las páginas de los libros están siendo fotográficamente escaneadas, y transformadas a texto usando "Reconocimiento de Carácteres Ópticos" (OCR).

Pero digitalizar un libro en imágenes es improductivo porque consume mucho espacio, no se puede almacenar en pequeños dispositivos y no admite búsquedas.

Recaptcha mejora el proceso de digitalizar libros enviando palabras que no pueden ser leídas por los ordenadores a la Web en forma de "captchas" para ser descifradas por humanos.

Concretamente, cada palabra que no puede ser leída correctamente por el OCR se coloca en una imagen y es usada como captcha.

Esto es posible porque muchos programas de OCR te avisan cuando una palabra es ilegible.

Pero, si un ordenador no puede leer la palabra correctamente, ¿cómo sabe el sistema que hemos dado la respuesta correcta a la pregunta?

Así: cada nueva palabra que no puede ser leída por el OCR se le da al usuario junto con otra palabra de la que se sabe el resultado.

Entonces se le pregunta al usuario acerca de las dos palabras.

Si soluciona la palabra de la cual se conoce el resultado correctamente, el sistema asume que la respuesta es válida tambien para la nueva palabra.

Entonces el sistema envía la nueva imagen a otros usuarios para confirmar el significado.

Fuente: traducción propia de aquí

vamospues.blogspot.com tu pausa diaria, juegos, utilidades y diversión

0 comentarios:

Publicar un comentario

gracias por tu comentario

 
vamos pues © 2011 | Designed by Chica Blogger, in collaboration with Uncharted 3, MW3 Forum and Angry Birds Online