¿Dejarías que una IA controlara tu ordenador? Cómo funciona y los retos que tendrá que superar
Claude Computer Use es el primer agente de IA capaz de realizar acciones directamente en un ordenador a partir de lenguaje natural
La clave para su funcionamiento es poder acceder a capturas de lo que ocurre en el ordenador y tener la capacidad de 'actuar'
Los agentes actuales todavía presentan muchos errores, y deberán mejorar mucho para integrarse de forma segura en nuestras tareas
El ratón se desplaza solo por la pantalla, como movido por una 'mágica' fuerza de la naturaleza. Es capaz de completar los datos de un formulario, quién sabe si para comprar un billete de avión o entradas para el cine. Tan solo se le ha proporcionado una instrucción en lenguaje natural. Esto que parece ciencia ficción es el siguiente paso en el que se centran la mayoría de empresas tecnológicas que desarrollan IA generativa: crear agentes capaces de pasar a la acción.
De momento, la primera empresa en presentar algo tangible ha sido Anthropic, con su API 'Claude Computer Use'. Aunque el sistema está en un estadio inicial, y ya causó algunos problemas mientras preparaban su presentación –como por ejemplo cuando paró la grabación de pantalla–, este avance podría cambiar la forma en que interactuamos con los ordenadores. Quizá, en un futuro, los ratones ya no sean necesarios porque la IA se encargará de intermediar entre la interfície del ordenador y nosotros a través de órdenes de voz.
MÁS
Cómo funciona
Un aspecto clave para que una IA pueda moverse en un ordenador personal es que tenga acceso a lo que ocurre en pantalla y, lo más importante, esté preparada para 'entenderlo' (procesarlo). La aplicación ChatGPT para Mac, por ejemplo, ya es capaz de ayudar a resolver problemas en algunas aplicaciones de programación. A través de capturas de pantalla, se le puede introducir una instrucción y el chatbot responde en consecuencia. Con los agentes capaces de 'controlar' el ordenador, ya no será necesario leer siquiera la respuesta, porque ejecutarán la orden directamente.
Los retos que tendrá que superar
Algunos desarrolladores que han tenido acceso a la API de Claude, ya han sido capaces de utilizarla para tareas como rellenar formularios, gestionar correos electrónicos o realizar búsquedas de forma autónoma. Pero todavía existen problemas de fluidez y, en algunos casos, comete errores.
Aquí el aspecto clave es que, para rellenar un formulario de un billete de avión, por ejemplo, no puede haber margen de error. Equivocarse en el nombre o DNI puede implicar un coste para el usuario. Por lo que las 'alucinaciones' a las que nos tienen acostumbrados estos sistemas de IA tendrán que reducirse drásticamente antes de pasar a la acción y controlar tareas directamente.
Otra clave será que los agentes tengan la capacidad, a través de un sistema de machine learning, para aprender de los errores mediante refuerzo humano. Que si se equivocan en alguna acción y los corregimos, sean capaces de integrar esa retroalimentación en su aprendizaje. Lo que está claro es que, a pesar de las limitaciones actuales, estos sistemas podrían 'liberar' a los trabajadores de tareas repetitivas sin mucho valor añadido tomando el control del ordenador.
Suscríbete a las newsletters de Informativos Telecinco y te contamos las noticias en tu mail.
Síguenos en nuestro canal de WhatsApp y conoce toda la actualidad al momento.