{"id":704,"date":"2019-03-05T12:37:41","date_gmt":"2019-03-05T15:37:41","guid":{"rendered":"http:\/\/blog.hostdime.com.ar\/?p=704"},"modified":"2026-04-27T10:12:31","modified_gmt":"2026-04-27T13:12:31","slug":"por-que-son-necesarias-las-gpu-para-entrenar-modelos-de-aprendizaje-profundo","status":"publish","type":"post","link":"https:\/\/www.hostdime.com.ar\/blog\/por-que-son-necesarias-las-gpu-para-entrenar-modelos-de-aprendizaje-profundo\/","title":{"rendered":"\u00bfPor qu\u00e9 son necesarias las GPU para entrenar modelos de Aprendizaje Profundo?"},"content":{"rendered":"<p style=\"text-align: justify;\">\u00bfPor qu\u00e9 son necesarias las GPU para entrenar modelos de Aprendizaje Profundo? La mayor\u00eda de ustedes habr\u00edan escuchado cosas emocionantes al usar el <strong>aprendizaje profundo<\/strong>. Tambi\u00e9n habr\u00edas o\u00eddo que <strong>Deep Learning<\/strong> requiere una gran cantidad de hardware. He visto a gente entrenar un modelo de aprendizaje profundo simple durante d\u00edas en sus computadoras port\u00e1tiles (generalmente sin <a href=\"https:\/\/pcweb.info\/gpu-unidad-de-procesamiento-de-graficos-que-es-definicion-uso\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPU<\/a>), lo que da la impresi\u00f3n de que <strong>el aprendizaje profundo requiere grandes sistemas para ejecutarse.<\/strong><!--more--><\/p>\n<p style=\"text-align: justify;\">Sin embargo, esto es solo en parte cierto y crea un mito sobre el aprendizaje profundo que crea un obst\u00e1culo para los principiantes. Numerosas personas me han preguntado qu\u00e9 tipo de hardware ser\u00eda mejor para hacer un aprendizaje profundo. Con este art\u00edculo, espero responderles.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_79_2 counter-hierarchy ez-toc-counter ez-toc-light-blue ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Table of Contents<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69fa9b9059a66\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69fa9b9059a66\"  aria-label=\"Alternar\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/www.hostdime.com.ar\/blog\/por-que-son-necesarias-las-gpu-para-entrenar-modelos-de-aprendizaje-profundo\/#El_aprendizaje_profundo_requiere_un_monton_de_hardware\" >El aprendizaje profundo requiere un mont\u00f3n de hardware<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/www.hostdime.com.ar\/blog\/por-que-son-necesarias-las-gpu-para-entrenar-modelos-de-aprendizaje-profundo\/#Entrenando_un_modelo_de_aprendizaje_profundo\" >Entrenando un modelo de aprendizaje profundo.<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/www.hostdime.com.ar\/blog\/por-que-son-necesarias-las-gpu-para-entrenar-modelos-de-aprendizaje-profundo\/#Ambas_operaciones_son_esencialmente_multiplicaciones_de_matrices\" >Ambas operaciones son esencialmente multiplicaciones de matrices<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/www.hostdime.com.ar\/blog\/por-que-son-necesarias-las-gpu-para-entrenar-modelos-de-aprendizaje-profundo\/#%C2%BFComo_entrenar_tu_red_neuronal_mas_rapido\" >\u00bfC\u00f3mo entrenar tu red neuronal m\u00e1s r\u00e1pido?<\/a><\/li><\/ul><\/nav><\/div>\n<h2 style=\"text-align: justify;\"><span class=\"ez-toc-section\" id=\"El_aprendizaje_profundo_requiere_un_monton_de_hardware\"><\/span><span style=\"color: #ff6600;\">El aprendizaje profundo requiere un mont\u00f3n de hardware<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\"><a href=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/Modelos-de-aprendizaje-en-tu-porta\u0301til.png\"><img decoding=\"async\" class=\"alignleft wp-image-742\" src=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/Modelos-de-aprendizaje-en-tu-porta\u0301til-300x300.png\" alt=\"Modelos-de-aprendizaje-en-tu-porta\u0301til\" width=\"400\" height=\"400\"><\/a>La primera vez que me introduje con el aprendizaje profundo, pens\u00e9 que el aprendizaje profundo necesariamente necesita un centro de datos grande para ejecutarse, y que los \u00abexpertos en aprendizaje profundo\u00bb se sentar\u00edan en sus salas de control para operar estos sistemas.<br \/>\nEsto se debe a que en todos los libros a los que me refer\u00ed o en todas las charlas que escuch\u00e9, el autor o el orador siempre dicen que el aprendizaje profundo requiere una gran cantidad de capacidad computacional para ejecutarse. \u00a1Pero cuando constru\u00ed mi primer modelo de aprendizaje profundo en mi m\u00e1quina magra, me sent\u00ed aliviado! No tengo que asumir ser Google para convertirme en un experto en aprendizaje profundo.<\/p>\n<p style=\"text-align: justify;\">Este es un error com\u00fan que enfrentan todos los principiantes cuando se sumergen en el aprendizaje profundo. Si bien es cierto que el aprendizaje profundo necesita un hardware considerable para ejecutarse de manera eficiente, no es necesario que sea infinito para realizar su tarea. <strong>\u00a1Incluso puedes ejecutar modelos de aprendizaje profundo en tu computadora port\u00e1til!<\/strong><\/p>\n<p style=\"text-align: justify;\">S\u00f3lo un peque\u00f1o descargo de responsabilidad; cuanto m\u00e1s peque\u00f1o sea su sistema, mayor ser\u00e1 el tiempo que necesitar\u00e1 para obtener un modelo capacitado con un rendimiento suficientemente bueno.<br \/>\nSimplemente hag\u00e1monos una pregunta simple;<strong> \u00bfPor qu\u00e9 necesitamos m\u00e1s hardware para el aprendizaje profundo?<\/strong><\/p>\n<p style=\"text-align: justify;\">La respuesta es simple, el aprendizaje profundo es un algoritmo, una construcci\u00f3n de software. Definimos una red neuronal artificial en nuestro lenguaje de programaci\u00f3n favorito que luego se convertir\u00eda en un conjunto de comandos que se ejecutan en la computadora.<\/p>\n<p style=\"text-align: justify;\">Si tuvieras que adivinar qu\u00e9 componentes de la red neuronal crees que requerir\u00edan un recurso de hardware intenso, \u00bfcu\u00e1l ser\u00eda tu respuesta?<\/p>\n<p>Algunos de los candidatos de mi mente son:<\/p>\n<ul>\n<li>Preprocesamiento de datos de entrada.<\/li>\n<li>Entrenando el modelo de aprendizaje profundo.<\/li>\n<li>Almacenando el modelo de aprendizaje profundo entrenado<\/li>\n<li>Despliegue del modelo<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Entre todos estos, la capacitaci\u00f3n del modelo de aprendizaje profundo es la tarea m\u00e1s intensiva. Veamos en detalle por qu\u00e9 esto es as\u00ed.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Entrenando_un_modelo_de_aprendizaje_profundo\"><\/span><span style=\"color: #ff6600;\">Entrenando un modelo de aprendizaje profundo.<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Cuando entrenas un modelo de aprendizaje profundo, se realizan dos operaciones principales:<\/p>\n<ul>\n<li>Paso adelantado<\/li>\n<li>Paso hacia atr\u00e1s<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">En el paso hacia adelante, la entrada se pasa a trav\u00e9s de la red neuronal y, despu\u00e9s de procesar la entrada, se genera una salida. Mientras que en el paso hacia atr\u00e1s, actualizamos los pesos de la red neuronal sobre la base del error que obtenemos en el pase hacia adelante.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Ambas_operaciones_son_esencialmente_multiplicaciones_de_matrices\"><\/span><span style=\"color: #ff6600;\">Ambas operaciones son esencialmente multiplicaciones de matrices<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\"><a href=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/\u00bfCo\u0301mo-entrenar-tu-red-neuronal-ma\u0301s-ra\u0301pido.png\"><img decoding=\"async\" class=\"alignright wp-image-743\" src=\"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/\u00bfCo\u0301mo-entrenar-tu-red-neuronal-ma\u0301s-ra\u0301pido-300x300.png\" alt=\"\u00bfCo\u0301mo-entrenar-tu-red-neuronal-ma\u0301s-ra\u0301pido?\" width=\"370\" height=\"370\"><\/a>Aqu\u00ed, podemos ver que cada elemento en una fila de la primera matriz se multiplica por una columna de la segunda matriz. Por lo tanto, en una red neuronal, podemos considerar la primera matriz como entrada a la red neuronal, y la segunda matriz puede considerarse como ponderaciones de la red.<\/p>\n<p style=\"text-align: justify;\">Esto parece ser una tarea simple. Ahora solo para darte una idea de qu\u00e9 tipo de aprendizaje profundo de escala, VGG16 (una red neuronal convolucional de 16 capas ocultas que se usa con frecuencia en aplicaciones de aprendizaje profundo) tiene aproximadamente 140 millones de par\u00e1metros; Alias \u200b\u200bpesos y sesgos. \u00a1Ahora piense en todas las multiplicaciones de matrices que tendr\u00eda que hacer para pasar solo una entrada a esta red! Tomar\u00eda a\u00f1os entrenar este tipo de sistemas si tomamos los enfoques tradicionales.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"%C2%BFComo_entrenar_tu_red_neuronal_mas_rapido\"><\/span><span style=\"color: #ff6600;\">\u00bfC\u00f3mo entrenar tu red neuronal m\u00e1s r\u00e1pido?<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\">Vimos que la parte computacionalmente intensiva de la red neuronal est\u00e1 formada por m\u00faltiples multiplicaciones de matrices. Entonces, \u00bfc\u00f3mo podemos hacerlo m\u00e1s r\u00e1pido?<\/p>\n<p style=\"text-align: justify;\">Simplemente podemos hacer esto haciendo todas las operaciones al mismo tiempo en lugar de hacerlo una despu\u00e9s de la otra. Esto es, en pocas palabras, por qu\u00e9 usamos GPU (unidades de procesamiento de gr\u00e1ficos) en lugar de una CPU (unidad de procesamiento central) para entrenar una red neuronal.<\/p>\n<p style=\"text-align: justify;\">Para darle un poco de intuici\u00f3n, volvemos a la historia cuando probamos que las GPU eran mejores que las CPU para la tarea.<\/p>\n<p style=\"text-align: justify;\">Antes del auge del aprendizaje profundo, Google ten\u00eda un sistema extremadamente poderoso para realizar su procesamiento, que hab\u00edan construido especialmente para entrenar redes enormes. Este sistema era monstruoso y ten\u00eda un costo total de $ 5 mil millones, con varios grupos de CPU.<\/p>\n<p style=\"text-align: justify;\">Ahora los investigadores en Stanford construyeron el mismo sistema en t\u00e9rminos de c\u00f3mputo para entrenar sus redes profundas utilizando GPU. Y adivina qu\u00e9; \u00a1Ellos redujeron los costos a solo $ 33K! Este sistema fue construido usando GPUs, y dio el mismo poder de procesamiento que el sistema de Google. Bastante impresionante verdad?<\/p>\n<p>Leer tambi\u00e9n:&nbsp;<a href=\"https:\/\/www.hostdime.com.ar\/blog\/gpgpu-el-trabajo-de-la-cpu-y-de-la-unidad-de-procesamiento-grafico\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPGPU el trabajo de la CPU y de la Unidad de procesamiento gr\u00e1fico<\/a>; <a href=\"https:\/\/www.hostdime.com.ar\/blog\/las-supercomputadoras-mas-poderosas-del-mundo\/\" target=\"_blank\" rel=\"noopener noreferrer\">Las supercomputadoras m\u00e1s poderosas del mundo<\/a>; <a href=\"http:\/\/blog.hostdime.com.co\/gpu-cpu-diferencias-similitudes\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPU vs CPU similitudes y diferencias<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00bfPor qu\u00e9 son necesarias las GPU para entrenar modelos de Aprendizaje Profundo? La mayor\u00eda de ustedes habr\u00edan escuchado cosas emocionantes al usar el aprendizaje profundo. Tambi\u00e9n habr\u00edas o\u00eddo que Deep Learning requiere una gran cantidad de hardware. He visto a [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":744,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-704","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/www.hostdime.com.ar\/blog\/wp-content\/uploads\/2019\/03\/\u00bfPor-que\u0301-son-necesarias-las-GPU-para-entrenar-modelos-de-Aprendizaje-Profundo.png","_links":{"self":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts\/704","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/comments?post=704"}],"version-history":[{"count":1,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts\/704\/revisions"}],"predecessor-version":[{"id":1602,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/posts\/704\/revisions\/1602"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/media\/744"}],"wp:attachment":[{"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/media?parent=704"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/categories?post=704"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.hostdime.com.ar\/blog\/wp-json\/wp\/v2\/tags?post=704"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}