El coste por usar la IA en inglés es hasta 15 veces más barato que otros idiomas

El coste por usar la IA en inglés es hasta 15 veces más barato que otros idiomas


El inglés por norma general es el idioma más habitual que nos encontramos en todo tipo de medios. No es el más hablado del mundo si hablamos de personas que sean nativas (en este caso el chino no tiene rival), pero si sería el más útil. Hasta las IA se aprovechan del inglés, desde el punto de vista de que es mucho más barato usar la IA en este idioma que en otros, debido a su menor complejidad.

Hay decenas de idiomas en todo el mundo y estos se clasifican comúnmente en términos de dificultad. Dependiendo de nuestro idioma nativo, aprender otro puede ser más o menos difícil. Aquí tenemos algunos factores a tener en cuenta, como lo mucho o poco que se parezca nuestro lenguaje al otro. Además de esto, se puede ver lo difícil que es un idioma con otras cosas como la cantidad de letras y complejidad en sus palabras o expresiones. No es lo mismo decir algo con cuatro palabras que acabar expresándolo con ocho.

Usar la IA GPT-4 en inglés es mucho más barato que en español y otros idiomas

The cost of LLM inference varies hugely based on the language for GPT-4 and most other common LLMs.
English is the cheapest.
Chinese is 2x English.
Languages like Shan + Burmese are 15x more expensive.
This is mostly because of how tokenizers work so need to output more tokens pic.twitter.com/Y7De09pb4w

— Dylan Patel (@dylan522p) July 28, 2023

Todo esto de los idiomas se aplica directamente a la IA, pues recordemos que estas se basan en aprender usando grandes modelos de lenguaje LLM. Compañías como OpenAI, creadora de ChatGPT, ofrece sus servicios a un precio que varía dependiendo de las entradas y salidas de información. Puede resultar una tontería, pero algo como cambiar el idioma base genera grandes diferencias de precio. Por ejemplo, usar inglés cuesta mucho más barato que idiomas como el español, el cual vale 1,5 veces más.

En el caso de otros idiomas, como el chino simplificado, la diferencia de precio se va a casi el doble. El peor de todos sería el idioma shan, que se habla en Birmania y aquí hablamos de que tiene un precio 15 veces superior. En el tuit de Dylan Patel, se muestra una imagen que muestra precisamente estas diferencias de precio. El inglés domina la lista como el idioma más barato, pues pedir al modelo de IA GPT-4 que procese una frase costaba únicamente 17 tokens. Mientras tanto, en idioma birmano conllevaba un precio de 198 tokens, alrededor de 11 veces más.

A nivel de rentabilidad, el inglés no tiene rival

Sabiendo que el inglés es mucho más barato, es obvio que las empresas dedicadas a la IA van a estar entrenando sus modelos en este idioma. No siempre la relación se debe a lo largas que son las palabras escritas, pues como un ejemplo, decir “tu afecto” en chino simplificado sería 你的爱意, lo que implica 4 caracteres, mientras que en inglés sería your affection, 14 caracteres con el espacio.

A pesar de esto, el precio es de tan solo 2 tokens para la versión en inglés y de 8 tokens para la versión en chino. Para ver estas diferencias, OpenAI tiene una página donde muestra como calcula el precio de los tokens. Aproximadamente un token en inglés nos permite procesar 4 caracteres y 100 tokens nos permitirían escribir 75 palabras. Esto es una base, pues dependerá del tipo de texto que queramos procesar con la IA, pero está claro que el inglés no tiene rival en cuanto a rentabilidad.

La entrada El coste por usar la IA en inglés es hasta 15 veces más barato que otros idiomas aparece primero en El Chapuzas Informático.