Moveapps

Fue el precursor, pero abrió las puertas a una revolución: hoy existen desde herramientas que crean pódcast en pocos minutos —con dos voces virtuales hablando de un texto que se le entrega— hasta la creación de avatares para videos. Y muchas veces no hace falta otro dispositivo que un celular. ChatGPT va a estar de cumpleaños. Hace dos años, el 30 de noviembre de 2022, se dio a conocer este chatbot de inteligencia artificial que hacía cosas que hasta entonces parecían imposibles: crear ensayos a partir de unas pocas instrucciones, escribir correos laborales, crear código computacional sin necesidad de que el usuario supiera programar y hasta hacer poesías. [caption id="attachment_10070" align="aligncenter" width="1320"] Interacción entre inteligencia artificial y humanidad.

Interacción entre inteligencia artificial y humanidad.

Esta evolución ha hecho posible que la IA funcione en dispositivos de uso cotidiano, permitiendo a las personas integrarla en sus actividades diarias.[/caption] Esta revolución de la inteligencia artificial generativa (IA generativa, que puede crear contenido como texto o imágenes a partir de instrucciones) comenzó a masificarse, y ahora ya forma parte de la vida de muchas personas con distintas aplicaciones.

Su crecimiento ha sido vertiginoso y lo que asombraba ayer deja paso a algo más asombroso a la semana siguiente.

A Cuky Pérez, doctora en Economía y líder en Ciencia de Datos, le ha llamado la atención la sorprendente evolución de MidJourney, herramienta para crear imágenes a partir de un prompt o comando.

'Hace un año y medio, MidJourney ya era sorprendente', dice Pérez. Pero había ciertas dificultades para que los prompts o las instrucciones que se le entregaban tuvieran el resultado deseado, añade. 'Además, ciertas imágenes, como las de figuras humanas, eran creadas con errores'.

Para ella, la actual versión (la 6.1) 'ha mejorado significativamente en la comprensión de estos prompts', es decir, entiende mejor las instrucciones del usuario para obtener el resultado deseado. Además, dice, se logran imágenes de alta calidad. Coincide con esta opinión Domingo Mery, académico de la Facultad de Ingeniería UC e investigador del Centro Nacional de Inteligencia Artificial (Cenia). 'En los últimos años ha mejorado tanto la calidad como la eficiencia de los modelos, y esto permite generar imágenes y videos con una alta fidelidad y con una muy buena resolución'.

Para Pérez, otra herramienta asombrosa es NotebookLM, 'que revoluciona la creación de pódcast. Permite transformar documentos en conversaciones de audio estilo pódcast en cosa de minutos', añade.

NotebookLM fue creado por Google y genera pódcast (por ahora solo en inglés) donde dos hablantes virtuales dialogan de forma muy natural sobre un tema en cuestión, interrumpiéndose, bromeando y desarrollando un hilo de conversación a partir de lo que el usuario le ha entregado como insumo: una novela, un ensayo, un artículo periodístico o hasta un currículum. En estos dos años, un salto fundamental de la IA generativa es que ahora ya es multimodal, explica Rolando Martínez, especialista en IA y gerente ejecutivo de Esfera IA. 'Además de texto, son capaces de describir lo que pasa en las imágenes y el video en forma automatizada', dice.

Esta característica permite funcionar en ambos sentidos: ya entiende instrucciones por voz, así como lo que aparece en una imagen o un video, y al otro extremo del proceso puede generar no solo texto, sino que videos, sonidos y hasta canciones.

'Udio tiene la habilidad de generar composiciones musicales personalizadas, permitiendo a los usuarios describir la música que desean en términos de género, instrumentos y otros parámetros', dice Jaime Caiceo, socio de Consultoría en IA y Datos de EY. Udio genera una canción con letra que rima, instrumentación y hasta con partes reconocibles como un coro o puente. Para Mery hay herramientas que tienen gran potencial. 'Sintesia, por ejemplo, es un plataforma para crear videos. En ellos, avatares, o sea, personas que son artificiales, pueden hablar y actuar según un guion. Uno escribe, por ejemplo, una presentación en PowerPoint, lo entrega como insumo y este avatar habla sobre el contenido de la presentación como si fuera un ser humano'. Más personalización Para Pérez, otro avance significativo es la capacidad que tienen los usuarios para personalizar la IA generativa para crear GPT propios. Así, instituciones y personas pueden añadir su propia información para que la IA generativa haga cosas para ellos, como, por ejemplo, que un colegio pueda subir todos sus reglamentos y un apoderado, consultar al GPT personalizado para saber qué hacer si debe retirar a su hijo antes para ir al médico.

Martínez menciona como un avance el hecho de que se hayan creado modelos de IA más pequeños, 'lo que ha permitido que las personas los puedan hacer funcionar en dispositivos como celulares, computadores personales y estaciones de trabajo, haciendo la mayoría de las tareas que necesitan', agrega.

'Al principio, se hablaba de que 'alucinaba'', dice Fernando Sánchez, gerente general de Fundación País Digital, para referirse a que la IA generativa entregaba información que no era verdadera, ya que la inventaba o cruzaba datos. 'Pero a medida que los modelos se han afinado y se han implementado resguardos, esas respuestas erróneas o inventadas son cada vez menos', añade. 'En mi opinión, el principal avance de la IA generativa ha sido el alto nivel de democratización alcanzado en su acceso. Esto ha permitido una adopción acelerada y masiva', añade Caiceo.

ChatGPT, dos años después: Evolución de la IA generativa

Su crecimiento ha sido vertiginoso y lo que asombraba ayer deja paso a algo más asombroso a la semana siguiente.

'Hace un año y medio, MidJourney ya era sorprendente', dice Pérez. Pero había ciertas dificultades para que los prompts o las instrucciones que se le entregaban tuvieran el resultado deseado, añade. 'Además, ciertas imágenes, como las de figuras humanas, eran creadas con errores'.

Para Pérez, otra herramienta asombrosa es NotebookLM, 'que revoluciona la creación de pódcast. Permite transformar documentos en conversaciones de audio estilo pódcast en cosa de minutos', añade.

Esta característica permite funcionar en ambos sentidos: ya entiende instrucciones por voz, así como lo que aparece en una imagen o un video, y al otro extremo del proceso puede generar no solo texto, sino que videos, sonidos y hasta canciones.

Martínez menciona como un avance el hecho de que se hayan creado modelos de IA más pequeños, 'lo que ha permitido que las personas los puedan hacer funcionar en dispositivos como celulares, computadores personales y estaciones de trabajo, haciendo la mayoría de las tareas que necesitan', agrega.

OTROS ARTÍCULOS

Cuéntanos sobre tu proyecto