Digitalización

¿Cuál es el próximo paso en el avance de la Inteligencia Artificial?

David Fernández02/04/2024
¿Cuál es el próximo  paso en el avance de  la Inteligencia Artificial?

Los vaticinios sobre tecnología abundan, pero el seguimiento de dichas predicciones es raro. Las predicciones en sí no son ninguna sorpresa, ya que en ello les va literalmente la vida a muchas empresas. Lo que no es tan abundante es ver a los gurús recapacitar a posteriori qué es lo que se cumplió y lo que no.

El MIT, con su informe "What's Next 2023", ha hecho justo eso, revisando sus pronósticos pasados. Claro que acertaron en buena parte: 1) Acierto: los chatbots (LLM) ya son multimodales y trabajan con texto, imágenes y audio; 2) Nuevas regulaciones sobre tecnología. Cierto: Biden lo hizo en octubre y la AI Act de la UE se acordó en diciembre; 3) Las grandes tecnológicas se iban a ver  presionadas por startups ‘open source’; cierto en parte: OpenAI y Google DeepMind siguen acaparando los focos, y 4) la IA cambiará la gran Farma para mejor; demasiado pronto para decir si se ha cumplido pero el movimiento es palpable.

Probemos nuevas predicciones

Tras el repaso, el MIT ha actuado con decisión y ha decidido publicar un nuevo “What’s next”. Pero… como hacen saber ya de entrada en su estudio, han decidido ignorar lo obvio;

Sabemos que los modelos de lenguaje a gran escala seguirán predominando. Los reguladores se volverán más audaces. Los problemas de la IA, desde el sesgo hasta los derechos de autor o el pesimismo apocalíptico, darán mucho trabajo a investigadores, reguladores y el público, no solo en 2024, sino en los años venideros.

En cambio, el MIT ha seleccionado algunas tendencias más específicas. Esto es lo que hay que observar en 2024. (volveremos el próximo año a comprobar cómo fue con estas nuevas predicciones).

Chatbots personalizados

En 2024, las empresas tecnológicas que han invertido en IA generativa estarán bajo presión para demostrar que pueden obtener beneficios de sus productos. Para lograr esto, los gigantes de la IA como Google y OpenAI están apostando fuerte por personalizar. Ambos están desarrollando plataformas fáciles de usar que permiten a las personas personalizar modelos de lenguaje poderosos y crear sus propios mini chatbots para sus necesidades específicas—sin conocimientos de programación. Ambos han lanzado herramientas basadas en la web que permiten a cualquier persona convertirse en un desarrollador de aplicaciones de IA generativa.
COSMO CONSULT, por ejemplo, distribuye la plataforma de bajo códigode Microsoft Power Platform, con la que empleados sin conocimientos técnicos pueden extraer Insights e informes personalizados, desarrollar aplicaciones, chatbots o portales y automatizar procesos y tareas. En este post podemos ver algunos casos de uso.

La segunda ola de la IA generativa será el vídeo

Es asombroso lo rápido que la gran novedad se vuelve familiar. Los primeros modelos generativos que producían imágenes fotorrealistas explotaron en 2022 y pronto se convirtieron en algo común. Herramientas como DALL-E de OpenAI, Stable Diffusion de Stability AI y Firefly de Adobe inundaron Internet con imágenes impresionantes de todo, desde el Papa con atuendos de Balenciaga hasta arte premiado. Pero no todo es diversión: por cada aplauso de admiración, hay otra pieza de arte fantástico imitado o estereotipos sexuales sexistas.

La nueva frontera es el texto a vídeo. Hace un año obtuvimos el primer vistazo de lo que los modelos generativos podían hacer cuando se entrenaban para unir múltiples imágenes fijas en clips de unos pocos segundos de duración. Los resultados eran distorsionados y bruscos. Pero la tecnología ha mejorado rápidamente.

¿Tienes un proyecto en mente?
Contáctanos aquí 

La Revolución del Video Generativo

La siguiente frontera para la IA generativa es el texto a video. Ejemplo de ello es Runway, lanzando constantemente herramientas como su modelo Gen-2, capaz de crear videos cortos de calidad impresionante. Paralelamente, el uso de tecnología deepfake para marketing y formación cobra importancia, con empresas como Synthesia liderando el camino y siendo adoptadas por un gran porcentaje de las compañías Fortune 100.

La desinformación electoral generada por IA estará por todas partes

La desinformación electoralgenerada por IA ya está siendo utilizada políticamente, y su proliferación plantea desafíos significativos. Distinguir la realidad en línea se volverá aún más difícil, exacerbando las tensiones en un clima político ya cargado. La lucha contra la propagación de contenido falso está en sus etapas iniciales, con herramientas como las marcas de agua aún no completamente efectivas.

En Argentina, dos candidatos presidenciales crearon imágenes y videos generados por IA de sus oponentes para atacarlos. En Eslovaquia, los deepfakes de un líder de partido liberal proeuropeo amenazando con subir el precio de la cerveza y haciendo chistes sobre pornografía infantil se difundieron rápidamente durante las elecciones del país. Y en EE. UU., Donald Trump ha aplaudido a un grupo que utiliza IA para generar memes con tropos racistas y sexistas.

Las técnicas para rastrearlo y mitigarlo todavía están en los primeros días de desarrollo. Las marcas de agua, como SynthID de Google DeepMind, todavía son en su mayoría voluntarias y no infalibles. Y las plataformas de redes sociales son notoriamente lentas en eliminar la desinformación. Prepárate para un experimento masivo en tiempo real para desacreditar las noticias falsas generadas por IA.

Robots generalistas

Los últimos años en IA han visto un cambio de usar múltiples modelos pequeños, cada uno entrenado para realizar tareas diferentes—identificar imágenes, dibujarlas, subtitularlas—hacia modelos únicos entrenados para hacer todas estas cosas y más. Al mostrar a GPT-3 de OpenAI algunos ejemplos adicionales (conocidos como ajuste fino), los investigadores pueden entrenarlo para resolver problemas de codificación, escribir guiones de películas, pasar exámenes de biología de secundaria, y así sucesivamente. Modelos multimodales, como GPT-4 y Gemini de Google DeepMind, pueden resolver tareas visuales, así como lingüísticas.

El mismo enfoque puede funcionar para los robots, de manera que no sería necesario entrenar uno para voltear panqueques y otro para abrir puertas: un modelo universal podría dar a los robots la capacidad de realizar múltiples tareas. Varios ejemplos de trabajo en esta área surgieron en 2023.

El problema es la falta de datos. La IA generativa se basa en un conjunto de datos del tamaño de Internet de textos e imágenes. En comparación, los robots tienen muy pocas fuentes buenas de datos para ayudarles a aprender cómo realizar muchas de las tareas industriales o domésticas que queremos que hagan.

La Universidad de Nueva York investiga eso, desarrollando técnicas que permiten a los robots aprender mediante el ensayo y error, generando sus propios datos de entrenamiento a medida que avanzan. Grandes empresas también han comenzado a liberar grandes conjuntos de datos para entrenar robots en los últimos años, como Ego4D de Meta.

Compartir Post

Contáctenos:
Autor:
David Fernández
IT Account Manager & Sales Consultant | COSMO CONSULT