Actualización a los nodos Redshift DC2 para duplicar el rendimiento de las consultas al mismo costosteemCreated with Sketch.

in #redshift8 years ago

Buenas noticias para los usuarios de Stitch / AWS Redshift

AWS acaba de anunciar el lanzamiento de nodos Dense Compute de segunda generación para su uso con los almacenes AWS Redshift. Estos nodos DC2 cuentan con una impresionante duplicación del rendimiento del almacén al mismo precio y, para los usuarios de Stitch, el proceso de actualización es simple y de bajo riesgo.

https://cdn-images-1.medium.com/max/1600/0*xdLCzjbCZEz89iBD.

Si su clúster Redshift está alojado en una de las regiones que admiten los nuevos nodos DC2 , esta publicación lo guiará a través del proceso de actualización.

Consideraciones

Antes de comenzar, debe saber que este proceso requiere cambiar el tamaño del clúster Redshift, por lo que el clúster se reiniciará en modo de solo lectura durante todo el tiempo de la operación. Esto significa que todas las conexiones o consultas activas que se ejecuten se terminarán una vez que inicie, y luego otra vez cuando finalice el cambio de tamaño.

Sugerimos esperar hasta las horas no laborables para realizar esta actualización, ya que habrá un tiempo de inactividad durante el cual Stitch no podrá cargar datos en su grupo de correcciones de Redshift. Específicamente, verá las apariciones de los dos errores siguientes durante el proceso de cambio de tamaño:

ERROR: No se puede ejecutar la consulta porque el sistema está en modo de cambio de tamaño. Detalle: El sistema está en modo de cambio de tamaño, y SOLO se pueden ejecutar consultas de solo lectura.

Conexión denegada. Verifique que el nombre de host y el puerto sean correctos y que el administrador de correo esté aceptando conexiones TCP / IP.

Estos indican que Stitch se bloqueó de cargar datos en su almacén debido a la funcionalidad de solo lectura temporal o al reinicio del clúster. Stitch volverá a cargar automáticamente una vez que se haya completado el cambio de tamaño, por lo que no se perderán datos y la resolución no requerirá ninguna acción de su parte .

La duración del cambio de tamaño variará según la cantidad de datos que contiene su clúster, así como la cantidad de nodos. Para nosotros, todo el proceso tomó exactamente 2 horas para actualizar nuestro cluster de 5 dc1.nodos amplios a 5 dc2.nodos nodos grandes con el 50% de la capacidad de disco utilizada en ese momento.

El proceso de actualización

  1. Para iniciar el proceso de actualización, inicie sesión en AWS Management Console y haga clic en la pestaña Servicios .
  2. Seleccione Amazon Redshift desde la lista de la base de datos .
  3. Ahora que la consola Redshift está abierta, haga clic en el panel Cluster .
  4. En la columna Cluster , haga clic en el nombre del clúster que desea actualizar. Esto abrirá la página Detalles del clúster .
  5. Desde aquí, busque y haga clic en el menú desplegable Cluster , donde verá una opción para "Cambiar el tamaño":
    Esto abrirá una ventana del grupo de cambio de tamaño con 3 campos diferentes: tipo de nodo , tipo de clúster y número de nodos .
  6. Haga clic en el campo Tipo de nodo y seleccione dc2.large o dc2.8xlarge ( según el tipo de nodo actual de su equipo), luego deje sin modificar el Tipo de clúster y el Número de nodos .
  7. Para almacenar los cambios y comenzar el proceso de cambio de tamaño, presione el botón Cambiar el tamaño en la parte inferior de esta ventana. Y eso es. De Verdad.

Puede verificar el progreso del cambio de tamaño haciendo clic en la pestaña Estado , que mostrará el porcentaje de finalización y la tasa promedio de transferencia, así como el tiempo transcurrido y el tiempo restante esperado.

Una vez que se haya completado el cambio de tamaño, Stitch reanudará la carga en su instancia de Redshift desde el punto en que la dejó.

Beneficios

Estamos comenzando a probar estos nuevos tipos de nodos y algunos de los miembros de nuestro equipo ya han notado un menor tiempo de ejecución en sus informes. AWS menciona que los nuevos nodos DC2 admitirán velocidades de E / S de hasta .60GB / s, en comparación con solo .20GB / s con los nodos DC1 de primera generación, por lo que estamos emocionados de ver cómo el rendimiento del almacén continúa mejorando nuestro ¡analítica!
¿No es ya un usuario de Stitch? Regístrese hoy para obtener una prueba gratuita y consulte las 60 fuentes de datos compatibles que se pueden integrar con Redshift usando Stitch.

Fuente: https://blog.stitchdata.com/upgrade-to-redshift-dc2-nodes-to-double-query-performance-at-the-same-cost-2489dd063495