Concepto principal

Mediante ciertos parámetros podemos influenciar la respuesta de un modelo de lenguaje para que sea menos creativo y más certero (menos estocástico). A esto se le llama parámetros de inferencia.

Contexto

Esto es importante sobre todo cuando necesitamos respuestas menos variables, como por ejemplo para responder temas técnicos. Sin embargo, quizá no tanto para generar texto en temas creativos.

Parámetros de Inferencia

Temperature

  • Parámetro entre 0 y 1 que le dice al modelo quĂ© tan creativo queremos que se comporte al generar la respuesta.
  • Valor bajo (ej. 0.2): respuestas más conservadoras, repetitivas, enfocadas en la respuesta más probable.
  • Valor alto (ej. 1.0): respuestas más diversas, creativas e impredecibles, quizá menos coherentes.

Top P

  • Parámetro entre 0 y 1 que le indica al modelo quĂ© porcentaje de tokens probables considerará para predecir el siguiente token.
  • Bajo (ej. 0.25): considera solo el 25% de los tokens más probables, creando una respuesta más coherente.
  • Alto (ej. 0.99): considera un rango más amplio de posibles tokens, obteniendo respuestas más creativas y diversas.

Top K

  • Indica el nĂşmero de candidatos probables que el modelo considerará para el siguiente token.
  • Valor bajo (ej. 10): reduce el pool y limita las opciones a los resultados más probables.
  • Valor alto (ej. 500): amplĂ­a el pool y permite que el modelo considere resultados menos probables.

Length

  • Indica el tamaño máximo de la respuesta en tokens.

Stop Sequences

  • Tokens o cadenas de texto que le indican al modelo que debe detenerse de generar la respuesta al encontrarlos.

Exam Domain

  • Domain 3, Task Statement 3.1: “Understand the effect of inference parameters on model responses (for example, temperature, input/output length).”

Conceptos relacionados