domingo, 3 de noviembre de 2024

Minicurso sobre la IA

En cualquier orden de la vida, queridos amigos, ignorar la realidad conlleva el riesgo de ser sorprendido por ella con consecuencias negativas. Por ejemplo, si nuestros antepasados del Paleolítico no hubieran aprendido las costumbres, el habitat y las preferencias alimenticias del tigre diente de sable, muy bien habrían podido salir un día a cosechar dátiles justo en el área donde estos se encontraban. 


¡Ignorar no es una buena política!
Con ello en mente y, considerando que la IA es un tigre diente de sable del siglo XXI es que nace esta nota. Si no queremos ser superados por la realidad, hay que informarse.
Así pues, encaramos este minicurso sobre la IA, que no es obra mía sino del afamado MIT, el Massachusetts Institute of Technology, que me he tomado el atrevimiento de traducir para ustedes.
¡Vamos con él!

Semana 1: ¿Qué es la IA?

Bienvenido a Introducción a la IA, un minicurso de MIT Technology Review sobre cómo comenzar a trabajar con la inteligencia artificial. Durante las próximas seis semanas, lo llevaremos a un viaje que le permitirá comprender mejor qué es la IA y cómo usarla.

Hemos hablado con expertos y hemos seleccionado nuestra mejor cobertura en seis ediciones para ayudarte a navegar por el extraño mundo de la IA. El boletín de esta semana comienza con los conceptos básicos. Comenzaremos presentándote términos y conceptos clave para que conozcas las teorías y los avances técnicos que sustentan la IA moderna.

La semana que viene, exploraremos formas de usar la IA y compartiremos consejos sobre cómo ponerla a prueba. Y en las próximas semanas, cubriremos cómo hablar sobre la IA, formas de perfeccionar sus habilidades de alfabetización mediática y el impacto de la IA en la fuerza laboral. Por último, terminaremos con una introducción a las regulaciones de la IA.

¡Bien, vamos a sumergirnos en el tema!

Una historia (muy) breve

Empecemos por el principio: ¿qué es la IA? La inteligencia artificial es un término general que se utiliza para designar un conjunto de tecnologías que permiten a las computadoras hacer cosas que se cree que requieren inteligencia cuando las realizan las personas. Pensemos en reconocer rostros, comprender el habla, conducir automóviles, escribir oraciones, responder preguntas o crear imágenes.

La IA no es algo nuevo. Se ha trabajado en inteligencia artificial durante más de 70 años, desde que se celebró una conferencia en el Dartmouth College en los años 50. Allí, científicos informáticos y matemáticos se fijaron un objetivo muy ambicioso: desarrollar ordenadores que pudieran entender el lenguaje, traducirlo, ver patrones y mucho más.

Ninguno de los proyectos que surgieron después de esa conferencia logró esas grandes ambiciones, pero la visión perduró. Y aunque las tecnologías que impulsan la IA han cambiado con el tiempo, muchos de los objetivos finales del campo siguen siendo los mismos.

En la década de 2010, ya existían suficientes datos y capacidad computacional para entrenar los sistemas de inteligencia artificial para que reconocieran imágenes con mayor precisión que cualquier otro programa informático. La técnica que sustenta estos sistemas, conocida como aprendizaje profundo (más sobre esto a continuación), dio lugar a un gran auge de inversiones y grandes empresas tecnológicas entraron en el sector.

A partir de ahí, el aprendizaje profundo se amplió y adaptó a muchas aplicaciones, incluidos algoritmos de recomendación y asistentes de voz. Luego, en los últimos años, vimos los primeros modelos de IA generativa realmente potentes: GPT-3 y DALL-E 2 .


La gran ambición que impulsa muchas investigaciones sobre IA en la actualidad es desarrollar algo parecido a la inteligencia humana, a lo que a menudo se denomina inteligencia artificial general o AGI. Si esto es posible o no es un tema de debate.

En ese sentido, la IA también es una aspiración y su definición está en constante evolución. Incluso a personas prominentes en el ámbito tecnológico les resulta difícil ponerse de acuerdo sobre una definición . Lo que se hubiera considerado IA en el pasado puede no considerarse IA hoy en día. Los límites de la IA pueden volverse muy confusos y el término a menudo se amplía para incluir cualquier tipo de algoritmo o programa informático. Y Silicon Valley infla constantemente las capacidades de la IA, así que tome las afirmaciones de las empresas tecnológicas con pinzas.

Diccionario de IA

Aunque existen muchos tipos diferentes de IA, aprender algunos términos básicos te ayudará a seguir adelante. Comencemos con estos:

Redes neuronales

Las redes neuronales son los programas informáticos sobre los que se construye el aprendizaje profundo. Basadas muy vagamente en el cerebro, las redes neuronales consisten en muchas neuronas artificiales conectadas entre sí a través de ecuaciones matemáticas complejas llamadas algoritmos. Cuando se carga un nuevo dato (una imagen de un gato, por ejemplo) en un sistema, pasa en cascada por esos algoritmos hasta que salen datos diferentes (como la palabra "gato") por el otro extremo. Una red neuronal no entrenada escupirá basura. Una red neuronal entrenada, conocida como modelo, es una que ha aprendido a reproducir patrones vistos en sus datos de entrenamiento para producir respuestas correctas (la mayoría de las veces).

Aprendizaje automático

El aprendizaje automático utiliza estadísticas para encontrar patrones en cantidades masivas de datos. Y los datos, en este caso, pueden significar muchas cosas: números, palabras, imágenes, clics, etc. Si se pueden almacenar digitalmente, se pueden incorporar a un algoritmo de aprendizaje automático. El aprendizaje automático impulsa algunas de las IA que probablemente hayas utilizado. Los algoritmos de recomendación como los de Netflix, YouTube y Spotify utilizan el aprendizaje automático, al igual que los motores de búsqueda, los feeds de redes sociales y los asistentes de voz como Siri y Alexa.

Aprendizaje profundo

El aprendizaje profundo es aprendizaje automático con esteroides. Utiliza conjuntos de datos masivos, grandes redes neuronales y una gran potencia de procesamiento para brindarles a las máquinas una capacidad mejorada para encontrar (y amplificar) incluso los patrones más pequeños. Y algunos de estos sistemas pueden detectar patrones sin siquiera que se les diga qué buscar.

IA generativa

La IA generativa es un tipo de IA popular y poderoso que ha surgido en los últimos años. La IA generadora de imágenes desarrollada por Google, OpenAI y otros ahora puede crear obras de arte impresionantes con solo unas pocas indicaciones. Escribe una breve descripción de casi cualquier cosa y obtendrás una imagen de ella en segundos. ChatGPT hace lo mismo, pero con texto. Hay motores para generar música, videos y más. Estas herramientas tienen el poder de revolucionar la economía y transformar industrias enteras. Por ejemplo, los científicos están entrenando modelos con datos especializados sobre compuestos químicos para intentar descubrir nuevos medicamentos. (Alerta de spoiler: nadie sabe realmente a dónde nos llevará el auge de la IA generativa).

Modelos de lenguaje de gran tamaño

Los modelos de lenguaje de gran tamaño son un tipo de IA generativa. Están construidos sobre algoritmos de aprendizaje profundo que se entrenan con enormes cantidades de texto. Eso significa que pueden determinar qué palabras tienen más probabilidades de aparecer juntas en una oración o párrafo y generar pasajes que suenen como lo que una persona podría escribir. ChatGPT es un chatbot basado en un modelo de lenguaje de gran tamaño (GPT-3 y GPT-4).

(Una nota rápida: es posible que haya escuchado que los modelos de lenguaje grandes han aprobado pruebas como el examen de abogacía o el examen de licencia médica de los EE. UU. Los modelos tienden a obtener buenos resultados en los exámenes, probablemente porque hay muchas preguntas y respuestas de muestra en sus datos de entrenamiento. Pero sabemos muy poco sobre cómo funcionan estos modelos. Al darles estas pruebas, estamos tratando de medir su "inteligencia" en función de sus resultados, sin comprender completamente cómo funcionan).

IA multimodal

La IA multimodal se refiere a la IA generativa que procesa múltiples tipos de datos, como audio, video, texto e imágenes, para devolver resultados en cualquiera de estos formatos. En este momento, tenemos algunos modelos multimodales, como Gemini y GPT-4.

Tenga en cuenta que la IA no es perfecta y se equivocará. En realidad, no "sabe" nada (hasta donde sabemos) y los motores de búsqueda basados ​​en IA tienen fallas graves . ChatGPT incluso le recuerda que debe verificar cualquier información importante que genere con otra fuente.

Alineación

La alineación es el trabajo que se realiza para garantizar que los sistemas de IA hagan lo que los usuarios quieren que hagan y nada más.

Dónde aprender más

Si quieres profundizar más en estos temas, aquí tienes una pequeña lectura recomendada:

Los modelos de lenguaje de gran tamaño pueden hacer cosas asombrosas, pero nadie sabe exactamente por qué

El entusiasmo por la IA se basa en puntuaciones altas en los exámenes. Esos exámenes tienen fallas

¿Por qué la IA alucina?

Ahora que conoce algunos términos clave de la IA y su historia, exploraremos las herramientas de IA más populares en nuestra próxima edición. Cubriremos lo que pueden hacer y, quizás más importante, lo que aún no pueden hacer.


Bien, hasta aquí esta primera entrega del minicurso que espero que les haya sido útil.
Seguiremos en notas futuras.

Bien, me despedido, pero, no sin antes recordarles que: Si tienen un hijo, sobrino, nieto, o ustedes mismos a quien tienen que agasajar, qué mejor que regalarle mi libro de El Ajedrez de la B a la Q, Tomo I (no se demoren que ya viene el Tomo II), que podrán encontrar en Mi Librería:

Avenida España 1927 – Mendoza – Argentina.
Celular: +54 9 261 6321054
E-mail: consultas@milibreria.net
Web: www.milibreria.net


No hay comentarios:

Publicar un comentario

Los falsos profetas

  ¡Qué duda cabe, queridos amigos, que el hombre tiene una “necesidad de creer”! Los miles de dioses que ha inventado a lo largo de la histo...