{"id":707,"date":"2019-03-05T12:49:17","date_gmt":"2019-03-05T15:49:17","guid":{"rendered":"http:\/\/blog.hostdime.com.ar\/?p=707"},"modified":"2026-04-27T10:12:31","modified_gmt":"2026-04-27T13:12:31","slug":"buscando-una-gpu-para-deep-learning-aprendizaje-profundo","status":"publish","type":"post","link":"https:\/\/www.hostdime.com.ar\/blog\/buscando-una-gpu-para-deep-learning-aprendizaje-profundo\/","title":{"rendered":"Buscando una GPU para Deep Learning, aprendizaje profundo"},"content":{"rendered":"<p style=\"text-align: justify;\">Buscando una GPU para Deep Learning, aprendizaje profundo. El aprendizaje profundo es un campo con <strong>requisitos inform\u00e1ticos intensos<\/strong> y la elecci\u00f3n de su GPU determinar\u00e1 fundamentalmente su experiencia de aprendizaje profundo. Sin GPU, esto podr\u00eda parecer meses de espera para que termine un experimento, o ejecutar un experimento durante un d\u00eda o m\u00e1s solo para ver que los par\u00e1metros elegidos estaban desactivados y el modelo divergi\u00f3.<!--more--><\/p>\n<p style=\"text-align: justify;\">Con una GPU buena y s\u00f3lida, se puede iterar r\u00e1pidamente sobre dise\u00f1os y par\u00e1metros de redes profundas y <strong>realizar experimentos en d\u00edas en lugar de meses<\/strong>, horas en lugar de d\u00edas, minutos en lugar de horas. Por lo tanto, tomar la decisi\u00f3n correcta cuando se trata de comprar una GPU es fundamental. Entonces, <strong>\u00bfc\u00f3mo selecciona la GPU que sea adecuada para usted?<\/strong><br \/>\nTener una GPU r\u00e1pida es un aspecto muy importante cuando uno comienza a aprender el aprendizaje profundo, ya que le permite obtener una experiencia pr\u00e1ctica r\u00e1pida, lo cual es clave para desarrollar la experiencia con la que podr\u00e1 aplicar el aprendizaje profundo a nuevos problemas. Sin esta retroalimentaci\u00f3n r\u00e1pida, solo toma mucho tiempo aprender de los errores de uno y puede ser desalentador y frustrante continuar con el aprendizaje profundo.<\/p>\n<h2 style=\"text-align: justify;\"><span style=\"color: #ff6600;\">\u00bfVale la pena tener m\u00faltiples GPUs?<\/span><\/h2>\n<p style=\"text-align: justify;\"><a href=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/\u00bfVale-la-pena-tener-mu\u0301ltiples-GPUs.jpg\"><img decoding=\"async\" class=\"alignleft wp-image-750\" src=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/\u00bfVale-la-pena-tener-mu\u0301ltiples-GPUs.jpg\" alt=\"\u00bfVale-la-pena-tener-mu\u0301ltiples-GPUs?\" width=\"500\" height=\"345\"><\/a>Es muy dif\u00edcil <strong>paralelizar<\/strong> eficientemente las redes neuronales en varias GPU, tambi\u00e9n que la aceleraci\u00f3n es solo mediocre para las redes neuronales densas. Las redes neuronales peque\u00f1as se pueden paralelizar de manera bastante eficiente utilizando el paralelismo de datos, pero las redes neuronales m\u00e1s grandes no reciben casi ninguna aceleraci\u00f3n.<br \/>\nLas redes totalmente conectadas generalmente tienen un rendimiento deficiente para el paralelismo de datos y se necesitan algoritmos m\u00e1s avanzados para acelerar estas partes de la red.<\/p>\n<p style=\"text-align: justify;\">Por lo tanto, hoy en d\u00eda, el uso de m\u00faltiples GPU puede hacer que el entrenamiento sea mucho m\u00e1s conveniente debido al aumento de la velocidad y, si tiene el dinero necesario, las m\u00faltiples GPU tienen mucho sentido.<\/p>\n<h2 style=\"text-align: justify;\"><span style=\"color: #ff6600;\">Usando m\u00faltiples GPUs sin paralelismo<\/span><\/h2>\n<p style=\"text-align: justify;\">Otra ventaja de usar m\u00faltiples GPU, incluso si no paraleliza los algoritmos, es que puede ejecutar m\u00faltiples algoritmos o experimentos por separado en cada GPU. No obtienes aceleraciones, pero obtienes m\u00e1s informaci\u00f3n sobre tu rendimiento al utilizar diferentes algoritmos o par\u00e1metros a la vez. Esto es muy \u00fatil si tu objetivo principal es obtener una experiencia de aprendizaje profunda lo m\u00e1s r\u00e1pido posible y tambi\u00e9n es muy \u00fatil para los investigadores, que desean probar varias versiones de un nuevo <a href=\"https:\/\/pcweb.info\/algoritmo\/\" target=\"_blank\" rel=\"noopener noreferrer\">algoritmo<\/a> al mismo tiempo.<\/p>\n<p style=\"text-align: justify;\"><a href=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/Usando-mu\u0301ltiples-GPUs-sin-paralelismo.jpg\"><img decoding=\"async\" class=\"alignright wp-image-751\" src=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/Usando-mu\u0301ltiples-GPUs-sin-paralelismo.jpg\" alt=\"Usando-mu\u0301ltiples-GPUs-sin-paralelismo\" width=\"600\" height=\"414\"><\/a>Esto es psicol\u00f3gicamente importante si quieres aprender el aprendizaje profundo. Cuanto <strong>m\u00e1s cortos sean los intervalos para realizar una tarea y recibir retroalimentaci\u00f3n para esa tarea<\/strong>, mejor ser\u00e1 la capacidad del cerebro para integrar las piezas de memoria relevantes para esa tarea en una imagen coherente. Si entrena dos redes convolucionales en GPU separadas en conjuntos de datos peque\u00f1os, obtendr\u00e1 m\u00e1s r\u00e1pidamente una idea de lo que es importante para un buen desempe\u00f1o; Con mayor facilidad podr\u00e1 detectar patrones en el error de validaci\u00f3n cruzada e interpretarlos correctamente. Podr\u00e1 detectar patrones que le dar\u00e1n pistas sobre qu\u00e9 par\u00e1metro o capa debe agregarse, eliminarse o ajustarse.<br \/>\nSu primera pregunta podr\u00eda ser cu\u00e1l es la caracter\u00edstica m\u00e1s importante para el rendimiento r\u00e1pido de la GPU para un aprendizaje profundo: <strong>\u00bfson los n\u00facleos CUDA? \u00bfVelocidad de reloj? \u00bfTama\u00f1o de la memoria RAM?<\/strong><\/p>\n<p style=\"text-align: justify;\">Si bien un buen consejo simplificado hubiera sido \u00abprestar atenci\u00f3n al ancho de banda de la memoria\u00bb, ya no recomendar\u00eda hacerlo. Esto se debe a que el hardware y el software de la GPU se desarrollaron a lo largo de los a\u00f1os de manera que el ancho de banda en una GPU ya no es un buen proxy para su rendimiento. La introducci\u00f3n de Tensor Cores en GPU de grado de consumo complica a\u00fan m\u00e1s el problema. Ahora, una combinaci\u00f3n de ancho de banda, FLOPS y Tensor Cores es el mejor indicador para el rendimiento de una GPU.<br \/>\nUna cosa que para profundizar su comprensi\u00f3n para tomar una decisi\u00f3n informada es aprender un poco sobre <strong>qu\u00e9 partes del hardware hacen que las GPU sean m\u00e1s r\u00e1pidas<\/strong> para las dos operaciones de tensor m\u00e1s importantes: la multiplicaci\u00f3n de matrices y la convoluci\u00f3n.<\/p>\n<p style=\"text-align: justify;\">Una forma simple y efectiva de pensar acerca de la multiplicaci\u00f3n de matrices es que est\u00e1 enlazado a ancho de banda. El ancho de banda de la memoria es la caracter\u00edstica m\u00e1s importante de una GPU si desea usar LSTM y otras redes recurrentes que hacen muchas multiplicaciones de matrices.<br \/>\nDel mismo modo, la convoluci\u00f3n est\u00e1 limitada por la velocidad de c\u00e1lculo. Por lo tanto, los TFLOP en una GPU son el mejor indicador para el rendimiento de ResNets y otras arquitecturas convolucionales.<\/p>\n<p>Entonces, en general, la mejor regla general ser\u00eda: observe el ancho de banda si usa RNN; mira FLOPS si usas convoluci\u00f3n; obtenga Tensor Cores si puede pagarlos (no compre tarjetas Tesla a menos que tenga que hacerlo).<\/p>\n<p>Leer tambi\u00e9n: <a href=\"http:\/\/blog.hostdime.com.co\/computacion-con-gpu-para-el-aprendizaje-automatico-el-rendimiento-de-big-data\/\" target=\"_blank\" rel=\"noopener noreferrer\">computaci\u00f3n con GPU para el aprendizaje autom\u00e1tico y el rendimiento de Big Data<\/a>;<a href=\"https:\/\/www.hostdime.com.ar\/blog\/gpgpu-el-trabajo-de-la-cpu-y-de-la-unidad-de-procesamiento-grafico\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPGPU el trabajo de la CPU y de la Unidad de procesamiento gr\u00e1fico<\/a>; <a href=\"https:\/\/www.hostdime.com.ar\/blog\/las-supercomputadoras-mas-poderosas-del-mundo\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las supercomputadoras m\u00e1s poderosas del mundo<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Buscando una GPU para Deep Learning, aprendizaje profundo. El aprendizaje profundo es un campo con requisitos inform\u00e1ticos intensos y la elecci\u00f3n de su GPU determinar\u00e1 fundamentalmente su experiencia de aprendizaje profundo. Sin GPU, esto podr\u00eda parecer meses de espera para [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":752,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2,3],"tags":[],"class_list":["post-707","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hosting","category-tecnologia"],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/Buscando-una-GPU-para-Deep-Learning-aprendizaje-profundo.png","_links":{"self":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts\/707","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/comments?post=707"}],"version-history":[{"count":1,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts\/707\/revisions"}],"predecessor-version":[{"id":1601,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts\/707\/revisions\/1601"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/media\/752"}],"wp:attachment":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/media?parent=707"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/categories?post=707"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/tags?post=707"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}