BLOG

Domando al monstruo del dinero GenAI: Cómo el análisis en la nube de DoiT y los perfiles de inferencia de aplicaciones aclaran los costes de base de AWS

Table of contents

En el salvaje oeste de la IA generativa, tu presupuesto puede convertirse rápidamente en el pistolero más rápido de la ciudad, agujereando tus finanzas cuidadosamente planificadas antes de que te des cuenta de lo que ha ocurrido. A medida que las organizaciones se apresuran a adoptar modelos de fundación como Amazon Nova y otros a través de Amazon Bedrock, muchas están descubriendo una verdad incómoda: hacer un seguimiento de quién gasta qué en IA puede parecer como intentar contar gotas de lluvia en una tormenta.

Introduce los perfiles de inferencia de aplicaciones de Amazon Bedrock: los héroes anónimos de la gestión financiera de GenAI que podrían salvar tu presupuesto (y quizá tu trabajo). Cuando se combinan con DoiT Cloud Analytics, obtienes una potente solución que transforma el turbio gasto de la IA en perspectivas cristalinas.

Read for free: https://medium.com/@edu7mota/07dc441e3a3a?source=friends_link&sk=67ef0d4c71aa421702b8f7272fe036a5

El doloroso problema: el gasto invisible en IA

Si has desplegado modelos de cimientos en producción, es probable que hayas experimentado ese momento de pavor cuando llega la factura de AWS. "¿Quién gastó TANTO en consultas de Amazon Nova el mes pasado?" Sin un seguimiento adecuado, tu gasto en GenAI es esencialmente una caja negra: sabes que sale dinero, pero ¿a dónde exactamente? ¿Con qué fin? ¿Y por quién?

Los perfiles de inferencia de aplicaciones ofrecen a las organizaciones una forma potente de rastrear, asignar y administrar los costes asociados a la invocación de modelos de cimentación en Amazon Bedrock. Lanzados por AWS como parte de su pila de servicios de IA generativa, estos perfiles proporcionan un control granular sobre la atribución de costes y la monitorización de la utilización de recursos entre departamentos, equipos y aplicaciones.

¿Qué son los Perfiles de Inferencia de Aplicaciones?

Piensa en los perfiles de inferencia de aplicaciones como identificadores especiales que adjuntas a las llamadas a la API de tu modelo base. Al crear un perfil de inferencia de aplicación, especifica un único modelo de fundación en una región o un perfil de inferencia entre regiones (definido por el sistema). Una vez configurado, cualquier solicitud de invocación al modelo realizada a través del perfil se registrará y etiquetará en consecuencia, permitiendo un seguimiento detallado y la atribución de costes.

Estos perfiles actúan como un mecanismo de enrutamiento que mantiene la conexión entre cada solicitud de IA y su fuente de origen, ya sea un equipo, una aplicación o un cliente concretos.

Tres casos de uso que cambiarán el juego (y salvarán tu cordura)

1. Imputación de costes a varios inquilinos: ¿Quién utiliza qué?

Si estás construyendo un producto SaaS con funciones GenAI, probablemente te habrás preguntado: "¿Cuánto nos cuesta cada cliente en uso de IA?"

Con los perfiles de inferencia de aplicaciones, puedes crear un perfil único para cada cliente o inquilino. Cada vez que interactúan con tu IA, su uso se rastrea bajo su perfil específico. Esto significa que puedes

  • Ver exactamente cuánto cuesta cada cliente en el uso del modelo base
  • Identifica a los usuarios avanzados que podrían necesitar un nivel de precios diferente
  • Detecta anomalías que puedan indicar un uso indebido o errores
  • Construye modelos de precios más precisos basados en patrones de uso reales

2. Seguimiento de costes en equipo: Rendición de cuentas sin dramas

La principal ventaja es la posibilidad de asignar los costes de invocación de modelos a diferentes unidades de negocio, equipos o proyectos mediante etiquetas de asignación de costes de AWS. Esto permite mecanismos precisos de devolución de cargos y responsabilidad departamental por el uso de la IA.

Imagina que tu equipo de marketing, tu equipo de producto y tu equipo de atención al cliente utilizan todos el mismo modelo Amazon Nova. Sin un seguimiento adecuado, nunca sabrás qué grupo es responsable de qué parte de la factura. Los perfiles de inferencia de aplicaciones te permiten:

  • Crea perfiles separados para cada equipo o departamento
  • Controla los patrones de uso para identificar los periodos de alto consumo
  • Implantar controles de costes o cuotas específicos para cada equipo
  • Permitir la imputación justa a los centros de costes adecuados

3. Seguimiento basado en el entorno: Del desarrollo al producto

Uno de los aspectos más complicados de la gestión de las cargas de trabajo GenAI es comprender cómo difieren los costes entre tus entornos de desarrollo. ¿Tus desarrolladores están acumulando enormes facturas en las pruebas? ¿Está optimizado tu entorno de producción? Los perfiles de inferencia de aplicaciones ayudan:

  • Segregar los costes entre desarrollo, puesta en escena y producción
  • Identificar los picos de costes inesperados durante las fases de prueba
  • Garantizar que los experimentos de desarrollo no arruinen tu presupuesto
  • Creación de previsiones precisas para el escalado a producción

Crear un perfil de inferencia de aplicación

Para crear un perfil de inferencia de aplicación, sólo podemos utilizar una api o AWS SDK. Hay que proporcionar 3 cosas principales:

  • El nombre del perfil de inferencia
  • El modelo a utilizar para el perfil
  • Cualquier etiqueta para asociar a este perfil

A continuación se muestra un ejemplo de cómo crear un perfil de inferencia:

importar boto3

cliente = boto3.cliente("bedrock")

response = cliente.crear_perfil_de_inferencia(
  inferenceProfileName='Cliente A Inference Nova Lite',
  description='Perfil de inferencia para todas las cargas de trabajo del cliente A',
  modelSource={
  'copyFrom': 'arn:aws:bedrock:us-west-2:058264544288:inference-profile/us.amazon.nova-lite-v1:0'
  },
  tags=[
  {
  'clave': 'cliente',
  'valor': 'cliente a'
  },
  {
  'clave': 'entorno',
  'valor': 'dev'
  },
  ]
)

Cómo DoiT Cloud Analytics transforma tus FinOps GenAI

Aquí es donde realmente brilla la plataforma Analítica en la Nube de DoiT, que transforma los datos brutos de seguimiento en inteligencia procesable.

DoiT incorpora varias categorías de etiquetas de AWS en su plataforma de análisis, incluidas las Etiquetas de Asignación de Costes de AWS. Cuando se aplican correctamente a los perfiles de inferencia de tu aplicación, estas etiquetas se convierten en potentes herramientas para la gestión de costes de GenAI.

Con DoiT Cloud Analytics, puedes:

  • Crea sofisticados desgloses de costes: Visualiza tus gastos de GenAI en múltiples dimensiones simultáneamente: por equipo, por cliente, por entorno, etc.
  • Detecta tendencias y anomalías: El uso de etiquetas de AWS en DoiT Cloud Analytics proporciona varias ventajas significativas, como el desglose granular de los costes, que puedes visualizar por proyecto, equipo, entorno o cualquier otra dimensión relevante para el negocio. Esto te permite identificar patrones de uso y detectar actividades inusuales que podrían indicar ineficiencias o problemas.
  • Proyecta los costes futuros con precisión: Las organizaciones que implementen un seguimiento adecuado de los costes basado en etiquetas AWS a través de DoiT pueden esperar una mejora de la precisión de la proyección de costes de hasta un 20% y un aumento de la eficiencia presupuestaria general de aproximadamente un 15%.
  • Visibilidad entre cuentas: Una de las características destacadas de DoiT es su capacidad para incorporar etiquetas de organización de AWS a los datos de facturación sin problemas y sin configuración adicional. Esta capacidad aborda un importante punto problemático cuando se siguen las mejores prácticas de AWS de implementar aplicaciones en varias cuentas.

La diferencia DoiT para la gestión de costes GenAI

La plataforma de DoiT ofrece ventajas únicas a las organizaciones que utilizan Amazon Bedrock:

Interfaz analítica simplificada

Dentro de la consola de DoiT, las etiquetas AWS son accesibles en varias secciones al crear o modificar informes:

  • Sección Etiquetas: Contiene etiquetas de asignación de costes de AWS junto con etiquetas de Google Cloud y etiquetas de Azure
  • Sección Etiquetas del sistema: Incluye las etiquetas generadas sistemáticamente por DoiT y AWS
  • Sección de etiquetas de organización de AWS: Dedicada a las etiquetas de organización para el seguimiento entre cuentas

Más allá de lo básico: Casos de uso avanzados

Al combinar los perfiles de inferencia de aplicaciones con DoiT Cloud Analytics, desbloqueas casos de uso aún más sofisticados:

Análisis de costes por características

Al crear perfiles alineados con características específicas del producto, puedes determinar exactamente cuánto cuesta el funcionamiento de cada capacidad de IA. Esto tiene un valor incalculable para la priorización de características y las estrategias de precios.

Rentabilidad de las pruebas A/B

¿Estás realizando una prueba A/B entre distintos modelos de base o estrategias de incitación? Crea perfiles de inferencia distintos para cada variante de la prueba, para comparar no sólo el rendimiento, sino también la rentabilidad.

Presupuestación por proyectos

Para las organizaciones que trabajan por proyectos, los perfiles de inferencia pueden asignarse a iniciativas concretas, lo que permite un seguimiento preciso de los gastos en IA por proyecto.

Cómo empezar: Una ruta de implementación sencilla

Poner en práctica esta potente combinación es sorprendentemente sencillo:

  1. Crea perfiles a través de la API de Amazon Bedrock: Utiliza la solicitud CreateInferenceProfile con un punto final del plano de control de Amazon Bedrock.
  2. Los campos obligatorios son mínimos: Sólo tienes que especificar un nombre de perfil y la fuente del modelo (ya sea un modelo base o un perfil de inferencia entre regiones).
  3. Añade etiquetas de imputación de costes de AWS: Etiqueta tus perfiles con las dimensiones adecuadas para el seguimiento de costes y asegúrate de que están activas en tus ajustes de etiquetas de imputación de costes.
  4. Dirige tus llamadas a los modelos a través de los perfiles: Actualiza el código de tu aplicación para que utilice el ARN del perfil en lugar de llamar directamente a los modelos.
  5. Conecta con DoiT Cloud Analytics: Utiliza la plataforma de DoiT para transformar los datos brutos de costes en información procesable a través de su intuitiva interfaz.

Lo esencial: Claridad de costes en un mundo complejo de IA

A medida que las cargas de trabajo de IA siguen creciendo tanto en escala como en importancia, la combinación de perfiles de inferencia de aplicaciones y DoiT Cloud Analytics se convierte en esencial para mantener el control financiero. En lugar de volar a ciegas con tus inversiones en GenAI, este potente dúo te proporciona la visibilidad y el control necesarios para tomar decisiones informadas, optimizar el gasto y garantizar que tus iniciativas de IA sigan siendo financieramente sostenibles.

¿Y lo mejor? Esta solución funciona hoy con los modelos de base existentes de Amazon Bedrock, sin necesidad de esperar a futuras mejoras ni de revisar tu arquitectura actual. Es un paso práctico e inmediato para domar al monstruo del dinero GenAI que acecha en tu factura de AWS.

Así que, antes de tu próxima invocación al modelo de fundación, pregúntate: ¿Sabes exactamente quién lo está pagando? Con los perfiles de inferencia de aplicaciones y DoiT Cloud Analytics, por fin puedes saberlo.

Para saber más sobre las etiquetas de imputación de costes con DoiT sigue este enlace: https://help.doit.com/docs/amazon-web-services/supported-aws-cost-allocation-tags

Visítanos en https://www-staging.doit-intl.com para saber cómo podemos ayudarte a gestionar el coste de tu Gen AI.

Schedule a call with our team

You will receive a calendar invite to the email address provided below for a 15-minute call with one of our team members to discuss your needs.

You will be presented with date and time options on the next step

Schedule a call with our team

You will receive a calendar invite to the email address provided below for a 15-minute call with one of our team members to discuss your needs.

You will be presented with date and time options on the next step