Primum Memento: La IA conversacional es mi Traductor Universal

Las IAs conversacionales facilitan la comunicación entre culturas al traducir idiomas, y también actúan como traductores en la interacción con lenguajes de programación y sistemas tecnológicos. La capacidad de estas herramientas para "traducir" es un "primum memento", un principio esencial a recordar cuando evaluamos cómo pueden asistirnos en la vida cotidiana y en el trabajo.

El verdadero alcance de la "traducción"

Las IAs conversacionales modernas interpretan y convierten nuestras palabras en instrucciones comprensibles para las máquinas, y viceversa. Pueden traducir lenguaje humano a lenguajes de programación como Python o JavaScript, permitiendo a usuarios no expertos en programación entender código de programación y escribirlo.

Esta capacidad se extiende a lenguajes específicos como Mermaid y Gherkin, utilizados respectivamente en el desarrollo de software para diagramas de flujo y pruebas de comportamiento de software. Además, trabaja de un modo similar con formatos gráficos como SVG. Esto significa que las IA pueden convertir descripciones en representaciones gráficas vectoriales, lo que abre una vía para la creatividad y la eficiencia en campos como el diseño gráfico o la visualización de datos.

¿Vamos un poco más allá? Las actuales IA conversacionales pueden generar notación ABC (notación musical simple que utiliza caracteres ASCII estándar). Un usuario puede dar una descripción de su estado de ánimo a la IA y esta lo puede "traducir" a una melodía, con lo que estamos "traduciendo" emociones a música. Pero si le pasamos a la IA la fotografía de un cuadro y le pedimos que lo describa, y después le decimos que a partir de esa descripción genere una melodía con notación ABD... voilá, ya tenemos un acercamiento a la "traducción" entre expresiones artísticas (ver Oir un cuadro y ver una melodía). Por cierto, de la misma manera que el código Mermaid lo puede interpretar Mermaid.live, la notación ABD la puede interpretar Abcjs.net (para más información ir al artículo Generadores de código especializado).

Otro salto cualitativo. Una alianza de investigadores está desarrollando una herramienta de IA, Polymathic AI, que procesa datos numéricos y simulaciones físicas de diversos campos científicos, como la física, la astrofísica, la química y la genómica. Modela una amplia gama de fenómenos científicos, superando las fronteras tradicionales entre disciplinas, lo que apunta a facilitar una comprensión más profunda de los fenómenos científicos (enlace a la noticia).

"La IA conversacional es mi Traductor Universal"

Ahora pensemos en el problema que queremos resolver y enfoquémoslo como un escenario en el que tenemos dos ámbitos diferentes, o más, y hemos de realizar un "traducción" entre ellos.

Pongamos un ejemplo (que saco de mi profesión): es habitual que el jefe de proyecto tenga que presentar cronogramas que muestren gráficamente la información relacionada con su proyecto. Esta información puede encontrarse ya recogida en alguna herramienta que puede generar este tipo de diagramas (por ejemplo, Microsoft Project). Sin embargo, hay ocasiones en las que la información está recogida pero no está asociada a una herramienta que la muestre gráficamente. De modo que tenemos a un jefe de proyecto que tiene los datos, pero tiene que "dibujar" de manera manual el diagrama que los represente para poder mostrarlos en un informe o en una presentación.

Ya tenemos el problema, y ahora vamos a analizar el escenario a la luz de nuestro "primum memento", "La IA conversacional es mi Traductor Universal". Tendremos que enfocar el problema como si se tratara de una "traducción" y ver si este enfoque nos permite identificar un camino para resolverlo.

¿Nuestra IA conversacional favorita puede ayudarnos a resolver nuestro problema? A continuación el jefe de proyecto le tiene que pasar a la IA los datos de su proyecto y le pide que los traduzca a... Estamos hablando de "traducir", y con el enfoque de este símil tenemos que tener claro cual es el "texto fuente" y cual es el "texto objetivo" (los dos elementos de una traducción, el idioma de entrada y el idioma de salida). Tenemos muy claro cual es nuestro "texto fuente", los datos del proyecto, pero todavía no hemos identificado con precisión cual será nuestro "texto objetivo". Además de las preguntas más evidentes como qué tipo de diagrama queremos (uno de Gantt, un cronograma lineal), también tenemos que preguntarnos qué puede hacer exactamente nuestra IA por nosotros: ¿puede darnos una imagen con nuestro diagrama, o quizá no, pero puede darnos código que pasado por un intérprete nos proporcione lo que necesitamos?

En internet tenemos un universo de información sobre lo que nuestra IA puede hacer, pero también podemos investigar por nuestra cuenta. Podemos investigar ChatGPT-3.5 y comprobar si podemos pedirle que dibuje un diagrama de Gantt, pero a fecha de hoy no puede. Entoces vemos si nos puede ayudar de algún otro modo, y comprobamos que sí podemos pedirle que genere el código Python: después vamos a un editor de código fuente (por ejemplo Visual Studio Code) y ejecutar el código para que dibuje nuestro diagrama. Si seguimos probando a ver a qué nos puede traducir nuestros datos del proyecto, vemos que también nos puede generar el código Mermaid, con el que después podremos ir a Mermaid.live para que nos lo interprete. En el caso de que seamos suscriptores de ChatGPT PLUS o Enterprise, podremos usar ChatGPT-4 y pedirle directamente que nos genere la imagen, y él generará e interpretará el código Python para dibujar nuestro diagrama. Aquí hay que tener cuidado de que la herramienta de OpenAI no intente usar DALL·E 3, porque es muy probable que el resultado no sea el esperado.

Si bien los ejemplos que hemos propuesto en el párrafo anterior tienen una obsolescencia muy cercana debido a la velocidad con la que las tecnologías relacionadas con la IA evolucionan, permiten ilustrar algo que sí tiene una vigencia más amplia: no todos los tipos de respuesta son posibles de generar por cualquier IA conversacional.

En conclusión: si intentamos abstraer un método que nos pueda servir en cualquier situación a la hora de hacer una petición a una IA conversacional, lo primero será recurrir a nuestro "primum memento" y decirnos a nosotros mismos que "la IA conversacional es mi Traductor Universal". Esto hará que nos acerquemos al problema con este enfoque: lo que necesitamos es hacer una conversión entre elementos de diferente naturaleza o ámbito. Lo bueno de esta perspectiva es que no nos limita, muy al contrario, abre ante nosotros un multiverso de posibilidades que quizá antes nos estaba vetado: otra cosa muy diferente es hasta dónde puede llegar nuestra IA en el proceso de traducción.

Buscar este blog

IAnigma