En AWS re:Invent, Amazon Web Services, anunció ocho nuevas capacidades para Amazon SageMaker, su solución integral de aprendizaje automático (ML).
Los desarrolladores, científicos de datos y analistas de negocios utilizan Amazon SageMaker para crear, entrenar e implementar modelos de aprendizaje automático de forma rápida y sencilla mediante su infraestructura, herramientas y flujos de trabajo completamente administrados.
Y es que a medida que los clientes continúan innovando con Machine Learning, están creando más modelos que nunca y necesitan capacidades avanzadas para administrar de manera eficiente el desarrollo, el uso y el rendimiento del modelo. El anuncio de AWS incluye nuevas capacidades de gobierno de Amazon SageMaker que brindan visibilidad del rendimiento del modelo a lo largo del ciclo de vida de ML.
Nuevos anuncios para Amazon SageMaker
- Amazon SageMaker Role Manager facilita el control del acceso y los permisos: Los controles de acceso de usuario adecuados son la piedra angular de la gobernanza y respaldan la privacidad de los datos, evitan fugas de información y garantizan que los profesionales puedan acceder a las herramientas que necesitan para hacer su trabajo. La implementación de estos controles se vuelve cada vez más compleja a medida que los equipos de ciencia de datos aumentan a decenas o incluso cientos de personas. Los administradores de ML, personas que crean y monitorean los sistemas de ML de una organización, deben equilibrar el impulso para optimizar el desarrollo mientras controlan el acceso a tareas, recursos y datos dentro de los flujos de trabajo de ML.
- Las tarjetas modelo de Amazon SageMaker simplifican la recopilación de información del modelo: Hoy en día, la mayoría de los profesionales confían en herramientas dispares (por ejemplo, correo electrónico, hojas de cálculo y archivos de texto) para documentar los requisitos comerciales, las decisiones clave y las observaciones durante el desarrollo y la evaluación del modelo. Los profesionales necesitan esta información para respaldar los flujos de trabajo de aprobación, el registro, las auditorías, las consultas de los clientes y el seguimiento, pero puede llevar meses recopilar estos detalles para cada modelo.
- Amazon SageMaker Model Dashboard proporciona una interfaz central para realizar un seguimiento de los modelos de aprendizaje automático: Una vez que un modelo se ha implementado en producción, los profesionales desean realizar un seguimiento de su modelo a lo largo del tiempo para comprender cómo funciona e identificar posibles problemas. Esta tarea normalmente se realiza de forma individual para cada modelo, pero a medida que una organización comienza a implementar miles de modelos, esto se vuelve cada vez más complejo y requiere más tiempo y recursos.
Amazon SageMaker Studio Notebook brinda a los profesionales una experiencia de notebook totalmente administrada, desde la exploración de datos hasta la implementación. A medida que los equipos crecen en tamaño y complejidad, es posible que docenas de profesionales necesiten desarrollar modelos en colaboración utilizando cuadernos. AWS continúa ofreciendo la mejor experiencia de notebook para los usuarios con el lanzamiento de tres nuevas funciones que ayudan a los clientes a coordinar y automatizar el código de su notebook.
- Preparación de datos simplificada: Los profesionales desean explorar conjuntos de datos directamente en cuadernos para detectar y corregir posibles problemas de calidad de los datos (p. ej., información faltante, valores extremos, conjuntos de datos sesgados y sesgos) mientras preparan los datos para la capacitación. Los profesionales pueden pasar meses escribiendo código repetitivo para visualizar y examinar diferentes partes de su conjunto de datos para identificar y solucionar problemas. Amazon SageMaker Studio Notebook ahora ofrece una capacidad de preparación de datos integrada que permite a los profesionales revisar visualmente las características de los datos y solucionar los problemas de calidad de los datos con solo unos pocos clics, todo directamente en el entorno de su notebook. Cuando los usuarios muestran un marco de datos (es decir, una representación tabular de datos) en su cuaderno, Amazon SageMaker Studio Notebook genera automáticamente gráficos para ayudar a los usuarios a identificar problemas de calidad de datos y sugiere transformaciones de datos para ayudar a solucionar problemas comunes.
- Acelere la colaboración entre los equipos de ciencia de datos: Una vez que se han preparado los datos, los profesionales están listos para comenzar a desarrollar un modelo, un proceso iterativo que puede requerir que los compañeros de equipo colaboren en un solo cuaderno. Hoy en día, los equipos deben intercambiar cuadernos y otros activos (p. ej., modelos y conjuntos de datos) por correo electrónico o aplicaciones de chat para trabajar juntos en un cuaderno en tiempo real, lo que genera fatiga en la comunicación, ciclos de retroalimentación retrasados y problemas de control de versiones.
- Conversión automática de código de notebook a trabajos listos para producción: Cuando los profesionales quieren mover un modelo de ML terminado a producción, generalmente copian fragmentos de código del cuaderno en un script, empaquetan el script con todas sus dependencias en un contenedor y programan el contenedor para que se ejecute. Para ejecutar este trabajo repetidamente según un cronograma, deben instalar, configurar y administrar una canalización de integración continua y entrega continua (CI/CD) para automatizar sus implementaciones. Puede llevar semanas configurar toda la infraestructura necesaria, lo que le quita tiempo a las actividades principales de desarrollo de ML.