Por mucho que probablemente hayas escuchado este estribillo, estoy aquí para decir que, realmente, sí lo escuchas, o al menos deberías hacerlo. Si vas a meterte una salchicha en la boca, ¿no quieres saber si alguien estaba echando aserrín en tu salchicha? Lo mismo ocurre con la tecnología. Ahora que los grandes modelos de lenguajes de IA están arrasando en el mundo de la tecnología, estás seguro de que queremos saber qué tipo de datos se utilizan para crear ChatGPT o cualquier otro LLM.
El martes, OpenAI lanzó su modelo GPT-4 , citándolo como el modelo de lenguaje de IA más avanzado jamás creado con "mayor precisión" y "conocimiento más amplio". Aunque tendrás que confiar en la palabra de la empresa. A pesar de su nombre, OpenAI no permite que cualquiera se asome bajo el capó de su nuevo modelo de lenguaje clase Ferrari. En el documento publicado con GPT-4, la compañía escribió: