{"id":1022,"date":"2023-06-20T11:51:45","date_gmt":"2023-06-20T11:51:45","guid":{"rendered":"https:\/\/www.appyweb.es\/diccionario\/?page_id=1022"},"modified":"2024-03-21T12:34:53","modified_gmt":"2024-03-21T12:34:53","slug":"data-lake","status":"publish","type":"page","link":"https:\/\/www.appyweb.es\/diccionario\/data-lake\/","title":{"rendered":"Data Lake"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone  wp-image-12017\" src=\"https:\/\/www.appyweb.es\/diccionario\/wp-content\/uploads\/2024\/03\/DataLake-300x180.jpg\" alt=\"Data Lake\" width=\"1132\" height=\"679\" srcset=\"https:\/\/www.appyweb.es\/diccionario\/wp-content\/uploads\/2024\/03\/DataLake-300x180.jpg 300w, https:\/\/www.appyweb.es\/diccionario\/wp-content\/uploads\/2024\/03\/DataLake-768x461.jpg 768w, https:\/\/www.appyweb.es\/diccionario\/wp-content\/uploads\/2024\/03\/DataLake.jpg 1000w\" sizes=\"auto, (max-width: 1132px) 100vw, 1132px\" \/><\/p>\n<div class=\"entry-content\">\n<p>Se denomina Data Lake o\u00a0<em>lago de datos<\/em>\u00a0a la informaci\u00f3n almacenada en su forma original, es decir, los\u00a0<strong>datos que a\u00fan no han sido procesados para el an\u00e1lisis<\/strong>. Estos pueden contener informaci\u00f3n relevante para una empresa y se utilizar\u00e1n posteriormente para crear informes, an\u00e1lisis avanzados o desarrollar t\u00e9cnicas de aprendizaje autom\u00e1tico.<\/p>\n<h2><span id=\"%F0%9F%93%8C_%C2%BFQue_es_el_Data_Lake\" class=\"ez-toc-section\"><\/span>\u00bfQu\u00e9 es el Data Lake?<\/h2>\n<p>Es el nombre que se utiliza para\u00a0<strong>denominar a los datos que se almacenan con fines no espec\u00edficos<\/strong>, suelen guardarse en archivos f\u00edsicos o digitales, de forma no estrat\u00e9gica y sin un orden en espec\u00edfico. Esta informaci\u00f3n puede repartirse en datos estructurados como documentos con filas y columnas, semi-estructurados (archivos CSV o XML), datos binarios (im\u00e1genes, v\u00eddeo y audio) y datos no estructurados (emails, PDF, Word).<\/p>\n<p>Por otro lado, puede utilizarse para almacenar toda la\u00a0<a href=\"https:\/\/www.appyweb.es\/auditoria-seo\/\">informaci\u00f3n referente a las auditor\u00edas SEO<\/a>\u00a0que luego ser\u00e1n organizadas y analizadas por un tercero, por ejemplo, un experto en an\u00e1lisis web. Pero, el objetivo principal de este es<strong>\u00a0almacenar digitalmente informaci\u00f3n en un espacio determinado<\/strong>, como un banco de informaci\u00f3n, que se utilizar\u00e1 en el momento y con los fines indicados.<\/p>\n<h2><span id=\"%F0%9F%93%8C_%C2%BFPara_que_se_usa\" class=\"ez-toc-section\"><\/span>\u00bfPara qu\u00e9 se usa?<\/h2>\n<p>Es un\u00a0<strong>m\u00e9todo que se utiliza para procesar Big Data<\/strong>, estos a su vez suelen utilizarse para analizar escenarios y oportunidades comerciales en el mercado, entender las preferencias de los usuarios a trav\u00e9s de sus interacciones o guardar\u00a0<a href=\"https:\/\/www.appyweb.es\/desarrollo-app\/\">informaci\u00f3n relevante para el desarrollo de apps<\/a>. Aunque \u00e9sta metodolog\u00eda ha sido cuestionada por expertos en anal\u00edtica web como David Needle, ya que esta estrategia no organiza la informaci\u00f3n, lo que provoca una gran p\u00e9rdida de datos que \u201cplanean utilizarse para el futuro\u201d, cuando realmente no es as\u00ed.<\/p>\n<p>Sin embargo, actualmente existen muchas herramientas que permiten que las empresas que est\u00e1n interesados en esta pr\u00e1ctica\u00a0<strong>puedan almacenar sus datos de forma segura<\/strong>. Una de ellas es Google Cloud Store, muchas de ellas se basan en la nube para evitar la p\u00e9rdida de datos f\u00edsicos.<\/p>\n<h2><span id=\"%F0%9F%93%8C_Extraccion_de_datos_del_Data_Lake\" class=\"ez-toc-section\"><\/span>Extracci\u00f3n de datos del Data Lake<\/h2>\n<p>La ventaja m\u00e1s importante de este sistema es que puede\u00a0<strong>almacenar datos de manera estructurada, semi-estructurada o sin estructuraci\u00f3n<\/strong>. Lo que es ideal para evitar generar ficheros independientes en diferentes herramientas, con el fin de ser utilizados en el momento en que se requieran.<\/p>\n<p>Igualmente, parte de este beneficio es facilitar la extracci\u00f3n de esos datos, algunos clientes de herramientas de data lake, como\u00a0<em>Apache Hadoop,<\/em>\u00a0mencionan que la informaci\u00f3n se puede procesar por lotes y compartir a trav\u00e9s de diferentes canales, como email.<\/p>\n<h2><span id=\"%F0%9F%93%8C_Ventajas_del_Data_Lake\" class=\"ez-toc-section\"><\/span>Ventajas del Data Lake<\/h2>\n<ul>\n<li>Los datos se almacenen con un sistema denominado \u201c<em>schema-on-read \u201c,\u00a0<\/em>que significa sistema contra escritura. Lo que\u00a0<strong>favorece que sean archivados sin ning\u00fan tipo de clasificaci\u00f3n<\/strong>\u00a0o esquema.<\/li>\n<li>Con este sistema, solo ser\u00e1n clasificados al momento de extraerse, seg\u00fan las necesidades del usuario.<\/li>\n<li>Los datos ya almacenados podr\u00e1n ser utilizados por los expertos inform\u00e1ticos con mayor rapidez, precisi\u00f3n y sin errores.<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h2><span id=\"%F0%9F%93%8C_Mas_informacion_sobre_Data_Lake\" class=\"ez-toc-section\"><\/span>M\u00e1s informaci\u00f3n sobre Data Lake<\/h2>\n<ul>\n<li><a href=\"https:\/\/www.appyweb.es\/diccionario\/big-data\/\">\u00bfQu\u00e9 es el Big Data y para qu\u00e9 sirve?<\/a><\/li>\n<li><a href=\"https:\/\/blog.powerdata.es\/el-valor-de-la-gestion-de-datos\/como-puede-ayudar-un-data-lake-en-la-estrategia-de-marketing\" rel=\"nofollow noopener\" target=\"_blank\">\u00bfC\u00f3mo ayuda un DATA LAKE a un CMO en la estrategia de marketing?<\/a><\/li>\n<\/ul>\n<\/div>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Se denomina Data Lake o\u00a0lago de datos\u00a0a la informaci\u00f3n almacenada en su forma original, es decir, los\u00a0datos que a\u00fan no han sido procesados para el an\u00e1lisis. Estos pueden contener informaci\u00f3n relevante para una empresa y se utilizar\u00e1n posteriormente para crear informes, an\u00e1lisis avanzados o desarrollar t\u00e9cnicas de aprendizaje autom\u00e1tico. \u00bfQu\u00e9 es el Data Lake? Es [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":12017,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"inline_featured_image":false,"footnotes":""},"class_list":["post-1022","page","type-page","status-publish","has-post-thumbnail","hentry"],"_links":{"self":[{"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/pages\/1022","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/comments?post=1022"}],"version-history":[{"count":6,"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/pages\/1022\/revisions"}],"predecessor-version":[{"id":12020,"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/pages\/1022\/revisions\/12020"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/media\/12017"}],"wp:attachment":[{"href":"https:\/\/www.appyweb.es\/diccionario\/wp-json\/wp\/v2\/media?parent=1022"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}