Ve la luz la primera computadora que puede jugar por sí misma

Un grupo de investigadores de la empresa Deep Mind que pertenece al gigante Google, han creado un algoritmo capaz de aprender a superar juegos de la videoconsola Atari 2600 tales como el Space Invaders o Pac Man, a través de una información mínima. El agente artificial creado por los investigadores es capaz de alcanzar un 75 por ciento de puntuación en más de la mitad de los juegos en los que se enfrentó a un humano.

El equipo liderado por Demis Hassabis experto en inteligencia artificial, se propuso la tarea de crear un algoritmo que permitiera a un ordenador aprender por sí mismo sin tener casi información previa.

El método empleado hasta ahora por los ingenieros informáticos era el aprendizaje por refuerzo que se basaba en estímulo y recompensa pero que para los investigadores adolece de una característica, y es que “es limitado en situaciones complejas y su aplicación se limita a los entornos controlables”.

Los desarrolladores de Deep Mind han introducido la novedad de que combinan esta forma de aprender con una red neuronal que está creada a imagen de las biológicas, lo que da como resultado un algoritmo que se llama DQN o Deep Q-Network que surge a partir de un aprendizaje por refuerzo profundo, según la publicación de la revista Nature.

En el estudio se dice que el agente artificial ha aprendido solo a jugar a 49 videojuegos clásicos de la conocida consola Atari 2600 entre otros títulos como Pacman o Space Invaders y que parte de la información sobre los píxeles y el número de acciones posibles en cada juego.
“Usamos los mismos datos iniciales para todos los juegos, lo que demuestra que el agente aprende con éxito los procedimientos de cada uno basándose únicamente en las entradas sensoriales”, explican en el artículo científico.

La computadora llegó a superar las puntuaciones de todas sus predecesoras en 43 de los 49 videojuegos pero no se quedó ahí, según los autores consideran que el rendimiento de la máquina sería comparable al de un probador profesional humano de videojuegos.

Este método mostró su eficiencia en actividades de muy distinta naturaleza como juegos de boxeo a carreras de coches en ·D “lo que demuestra que utilizando la misma arquitectura, la máquina puede aprender a optimizar estrategias en diferentes ambientes”.

Según los científicos el algoritmo podrá ayudar a los investigadores a entender el proceso de cómo aprenden las personas y esperan que permita crear productos más útiles como mejorar el motor de búsqueda de Google por ejemplo para completar tareas como la de programar un viaje entre otras.

Comentarios

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Si prega di attivare i Javascript! / Please turn on Javascript!

Javaskripta ko calu karem! / Bitte schalten Sie Javascript!

S'il vous plaît activer Javascript! / Por favor, active Javascript!

Qing dakai JavaScript! / Qing dakai JavaScript!

Пожалуйста включите JavaScript! / Silakan aktifkan Javascript!
[ Acceder al sitio ]
banner