TAC, Data Catalog, Stewardship
language: ES
WEBVTT va a corresponder con una tarea bajo las definiciones que dice la herramienta. Y acá tenemos otro perfil que va a ser administrador de datos, es este Worship, que es la persona encargada de corregir cualquier problema de calidad que tenga esos datos. Entonces, ¿qué es lo primero? ¿Cómo empiezo con este tipo de herramientas? Lo primero que tiene que usted preguntarse es si tiene el modelo de datos para la campaña. Cada proyecto nuevo que usted vaya a hacer es una campaña como tal. Ahora, como es la primera vez, no tenemos el modelo. Entonces, este modelo lo tengo definido acá. Entonces, aquí tengo un modelo en el cual tengo identificación, nombre, e-mail, teléfono, dirección, ciudad, edad, sexo, estado civil. Aquí tengo unas características de reglas de calidad y voy a explicar entonces a medida que vayamos insertando cada uno de los elementos. Entonces, yo voy a tomar como referencia este documento y usted me sigue por acá en la pantalla como tal ahora sí. Deja esa pantalla del Data Inventor y ahí, quietecita. Ahí todavía está demorando. Y váyase a la pantalla o a la pestaña del Data Stores. Váyase a la pestaña del Data Stores si es tan amable. El caso tuyo, Arturo, un momento. Voy a cerrar tu pantalla para que deje eso que vaya subiendo. Voy a subir tu pantalla un momento de forma interactiva. Un momento, por favor. Para que no cierres ese proceso. Voy a darle aquí clic derecho, duplicar pestaña. Y voy aquí, permíteme un momentito aquí y hago lo siguiente. Voy aquí al Data Stores. Y te quedas en esta pestaña, por favor. Te quedas ahí. Perfecto. Dejemos eso que te ha sido aquí. Lo que está haciendo es calidad. Y por defecto va a encontrar tres modelos de datos que corresponderían a los ejemplos que importamos. Acto seguido, dele en el botón que dice Act Data Model. Como es la primera vez, me va a llevar a un tour. Cierre, por favor. Listo. Ahora, primero, el modelo, los satélites que indican por la convención que ya tenemos de muchas cosas del sistema, Indica los elementos obligatorios. Primero, vamos a colocar el nombre del modelo. Aquí es importante, no solo en esto, pero en esto más importante todavía, que estandarice los nombres. En este caso vamos a especificar lo siguiente. Vamos a coger el siguiente estándar. Vamos a colocarle el prefijo modelo y el nombre del modelo. Quiere decir lo siguiente. Vamos a hacer lo siguiente. Vamos a colocarle Name, modelo, espacio, clientes. Y la empresa se llama Retail. El nombre se va a llamar modelo, clientes, retail. Importante describir el modelo, aunque no es excepcional, entonces vamos a colocar aquí. Modelo de datos de los clientes de la empresa Retail SA. Por último, te aconsejo que adoptes un estándar. Adoptemos el estándar siguiente en que ahora los identificadores los voy a colocar en minúscula sin tilde y sin espacio. Entonces, voy a colocarlo identificación de este lado. Lo voy a llamar identificación en minúscula. Y el Name es cómo quiere que se visualice el dato. Es prácticamente el label. Entonces acá sí lo puedo colocar con espacios y con tildes, con acentos. Y te voy a colocar identificación de este lado con la tilde correspondiente. Entonces el Identify es el nombre de la variable. Y ahora debes especificar el tipo de datos del elemento como tal. Ahora, en este tipo de datos vamos a expandir por favor aquí el combo voz. Y aquí están varios tipos de datos. Uno que son estándares que ya los conocemos que es el texto, el integer, el décima para valores reales, el tey, el time, time stand y el boolean. Y esos semantic ties son los que había mostrado anteriormente cuando inicié la parte del menú. Todavía no nos vamos a meter con ese semantic tie. En este caso de forma básica, text. Le preguntan seguidamente si deseas crear una lista de valores. En ese caso no vamos a crear lista de valores. Y ahora aquí me piden un mínimo de longitud y máximo de longitud. Ese mínimo de longitud y máximo aplica más que todo para valores enteros. Y acto seguido aquí me pide una regla de validación. Estas reglas de validación se hacen a través de expresiones regulares. Entonces lo que deberíamos hacer y vamos a practicarlo más tarde. Es que vamos a usar una IA cualquiera y le voy a decir que me genere la expresión regular. Para validar alguna regla definida por gobierno de datos. En este caso la vamos a dejar entonces ahí en blanco. Seguimos entonces. Si nota en la parte superior derecha. Aparece un botón que dice adicional a tributos. Ya lo vio. Entonces tele clic en adicional a tributo aquí para agregar un nuevo elemento. Si quiere colapsa este señor aquí el que ya hizo. Voy acá arribita y lo colapsa un momento. Para concentrarme nada más en el nuevo atributo. Según el caso estudio me pide lo siguiente. Que el identificador sea nombre. Entonces por estándar me voy a colocar nombre minúscula. Y en el label quiero que me aparezca con la N mayúscula. Tipo título prácticamente nombre. Se me escapó. Aquí no voy a agregar más nada. Aquí hay una validación que me dice que si permite valores vacíos. En este caso está desactivada. Yo quiero que sea obligatorio es decir que no necesita elementos vacíos. Y ahora hacemos un ejemplo con esa parte de cuando hay vacíos. Listo entonces ahora veamos lo siguiente. Vamos a agregar. Una nueva columna. Perdón si listo nada más ese nombre de su cierro aquí. Y voy a agregar una nueva columna. Esa columna la voy a llamar y me. Y el me le voy a colocar como correo. Electrónico. Este electrónico lleva tilde en la o verdad. Electrónico en la o sí me estaba marcando. El nombre identificador es email todo en minúscula y quiero que label. Aparezca como correo. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Y me voy a agregar. Hagamos algo entonces. Hagamos un pequeño break de diez minuticos. Cada dos horas hacemos un break de diez minutos. Tomamos algo frío o caliente entonces. Y volvemos en diez un poco más reposaditos. Volvemos entonces en diez minutos para seguir con esta parte del modelo. Listo ya vengo. Listo gracias a ustedes. Bueno volvimos nuevamente. Estamos ahí conectados. Bien para resumir. Vamos a hacer nuestro primer ejemplo. Partimos de algo muy sencillo porque teníamos definido el modelo. Pero tienes que tener en cuenta que todas las campañas que vaya a definir. Tienen que tener un modelo previo. Sin el modelo no pudo crear la campaña. Entonces bueno antes de continuar. Verifiquemos cómo nos fue con la cacería del. Del ejemplo del data. El del archivo que estamos subiendo. Yo voy aquí a la pestaña esta. Ya ha demorado mucho tiempo. Yo no creo que suba de manera correcta. No creo que lo haga ya. Algunos verifique para ver si ya le subió de manera correcta. Voy a mostrar aquí el caso de Arturo. Con tu permiso Arturo. Si subió de forma correcta. Entonces dale F5 ahí Arturo. Dale F5. Crece ahora. Duplique la pestaña. Duplique la pestaña. Váyase al Talent Data Inventory. Vaya al Dataset. Y a los que ya le subió el primero. Suba clientes dos. Punto XLS. Si no le ha subido ninguno. Vamos a subir. Nuevamente clientes uno. En el caso mío no me subió clientes uno. Entonces lo voy a volver a subir. Y lo voy a soltar aquí. Explico qué es lo que está pasando ahí. Lo que pasa es que. Él intenta ejecutar. Y como hay mucho conectado. No tiene hardware para hacer algunos elementos. Por cuestiones de. De experiencia. Vamos a intentar subir. También el dos. Los que le subió ya el uno. Pues está subiendo el dos. No hay problema. Pero los que no ha subido ninguno. Vamos a abrir otra pestaña. Desde el Data Steward Sheet. Vamos a darle aquí nuevamente duplicar. Vamos a darle aquí. En Data Inventory. Data Set. E intente subir ahora. El cliente 2.XLS. Si ya como el caso Alfonso. Ya lo está subiendo. Pues no lo hagas. Déjalo ahí que vaya subiendo. En la otra ventana. Entonces. Dejamos eso quieto ahí. Para ver si nos alcanzamos a. Aquí nos pide que validemos. Dale entonces valide ya. Bueno para el segundo. Me salió algo extraño. El formato del segundo es Excel. Dígale que tiene hider. El Excel. Aquí en sec hider. Sec hider. Lo colocan uno. Si te apareció esta ventana. Queda valide y listo. Y él intentará subir nuevamente. Ese que está ahí. Me parece raro que no haya subido ese señor. Aquí me pide lo guiar nuevamente. Que raro que. Me haya. No haya subido todavía. Entonces déjelo ahí. Me subió uno. Me subió el que se llama clientes uno. Y la segunda vez que lo intenté. Clientes uno me subió. Y clientes dos está. Y clientes dos está subiendo entonces. El caso. Arturo creo que está subiendo. Y te salió un error ahí. Dale ahí. Formato. Format Arturo. Por favor. Dale clic en el combo vos. Auto detect. Para ver si lo detecta. Bueno sí. Detecta el formato. Que lo detectó. Dale validate entonces. Dale validate. Y lo dejas ahí entonces. Perfecto. Dejamos eso quieto un momento. Y nos vamos nuevamente al data inventory. Al data stewardship. Perdón. Data stewardship. Es la ventana inicial que la copiamos. Vamos al modelo. Y abrimos nuevamente el modelo. Para seguir editando. Estamos en la columna. Correo electrónico. Correo electrónico. Vamos entonces a. Validar el que el correo tenga un formato. Seguramente ya. Has podido tener de pronto en tu empresa. Alguna paliación específica. Como algunos datos. En este caso vamos a simular entonces. Que yo quiero que el correo tenga un formato específico. Para hacer esa evaluación. Tengo prácticamente pues dos formas. La primera forma es que haga la evaluación directamente en la columna. Es decir donde dice. Validation pattern. Este que está aquí. El. El text file que está de último. Y ahora si tienes poca. Ninguna. Mucha experiencia. Yo creo que. Generar un rellex hoy en día. Pues no es que sea complicado. Bueno hay unos rellex que son complicados. Hay que negarlo. Pero. Yo creo que te gastas mucho tiempo. Entonces hagamos lo siguiente. Todos. Abramos aquí una nueva pestaña. A ver si no te deja. Y vamos a acceder a. Chachi Piti. Aquí vamos a decir no deja aquí. Listo. Me pregunta. Iniciar ahora. Y nos quedamos ahí entonces. Chachi Piti. Y le voy a decir lo siguiente. Voy a escribir el siguiente pronto. Lo voy a escribir aquí en un. Para que todos los dejamos. Tengamos el mismo pronto. Le voy a decir genera. Una expresión regular. El rellex en inglés. Regular expresión. El rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés. Y el rellex en inglés.
on 2024-10-25
language: EN
WEBVTT Okay. Let's see if I can start with this new one. Let me check something before... I'm going to try to do something here, to do the engineering system. I'm going to turn off the cluster for a moment and turn it on again, to see if it suddenly takes over. One moment, please. Anyway, let me both, I'm going to run my machine and I'll share the file with you so you can upload it, so you can see it and try to upload it in another way. In that moment too. Okay, I'm going to upload the engineers here. Yes, it's working. One moment. I'm not going to do anything. I'm going to share this file, which worked for me for a moment. Let's see. Employee consolidated.csv One moment, please. We'll try to upload it in a different way. I'm going to share something with the group then. I'm going to share it with the group. One moment, please. I'm going to try to upload this to the S3. I think it's done. Employee consolidated.csv One moment, please. I'm not going to do the same thing with you, because I was uploading the file, and I'm not going to share it in another way. Let's see then. Let's go then. The main problem is that there is no machine. I'm going to enter interactive, because I had already lost the connection. I'm going with someone who had already... I'm going there. Let me upload point one. Perfect. I'm not going to do it. I'm going to do the same trick. I'm going to the Manus console. I'm going to turn off this machine for a moment. Who asked me to help you while I have this machine here? Who had told me to go there? Alfonso. Alfonso, tell me. There is no white space there. Save it for a moment. Okay. I got it. Remove the S. The S. There is a S and a slash. You saw it there. Remove the slash too. Remove the slash. Save it for a moment. Save the S. But are you sure it's that one? Remove that expression completely. And save the model again. Save the model. Okay. We are sure it's that one. Again, search for the expression. You can get that expression. It's the same one that is in the document. To validate it. I have the document here and I validate it to see. So, it needs to be seen. It would be here in... Tallinn. The address, right? Yes. Let's see. I'm going to take this expression that is here and validate it. It's weird. The expression is not bad. Wait a moment. I'm going to change it a little bit. Because I didn't find the error. So, I'm going to change the expression. Wait a moment. For a different one. That's what I was looking for. What address? Okay. Veronica, I think now... Let's go to the inventory. It should be that employee one. Here it is. Okay. Perfect. Now you can continue. Let's go with... Okay. Let's go. I'm going to change the expression. Let's change it. Now I'm going to your machine. I've seen it already. But... Alfonso, I'm going to see if I missed something. Well... Try to paste the regular expression last time. I've already sent you another one. I'm going to paste it last time. Wait a moment. Let's see. Let's see. Close. It's optional. Let's save it again. Is it text? Direction? Take the last one I sent you. Please. The last one with an asterisk at the end. Let's save it to see. I had the doubt that you have that expression. I'm going to check it here. I've already told you that. Of course. Veronica, I'm going with you. Ready, perfect. Let's see. That error was mine. I'm going to see it for a moment. And look for the regular expression of the direction. Direction, please. That error was mine. Direction... Direction. In the group of Tim, please take the last regular expression that is there. The one with an asterisk and paste it and overwrite it on that regular expression of direction that there is an error there. I haven't detected it yet. Paste it, please. Ready. Give it to save model. That was my error. Yes. Yes, the direction was fine. The problem was that Alfonso detected it. Yes, the last one with an asterisk, please. Look for the regular expression that I can't see there. I'm going to look for it here in the document. Wait a moment. I'm going to move data. What would be... Data, flight... Sorry. Employee of employment. Ok, perfect. Ready. The regular expression asks for the first letter to be in capital. So, let's go to the next one. I've already located it. Ready. Let's go to the tasks that would be campaign, employee of employment. Ready. First, remove the accents. Look at the column, remove the accents, please. It would be... There it is. Simple text. Simple text. What would that be? Ok, in case... Now, put all the text in capital. Go to the column, go to string. And at the end, there is a menu that says string. At the end, I lost the string menu. I lost Google. Or put there upper. So, to look in the search, upper in capital in English. I lost upper. When I press P... There it is. Change everything to upper. The first option. It says, change the text. Change the text. Change the text. The first option. It says, change to upper case. The other one. That one. Perfect. Now, it says, in case the second name is missing, complete with unknown. So, go to the search menu. Search and replace. Search the menu. Sorry, concatenate. Put concatenate. Concatenate with. Ok. So, click there with. Ready. Ok. So, change to value. Because we are going to add a value. Value. And put as suffix. There is a blank space. And put unknown in capital. Send it, please. And done. There it is. That's what I asked. You don't have to correct everything. That's just what you have to do. In case the language level is empty, delete the register. Let's see. Language. Go to that language to solve it right away. Language. There is language. The language level. Is there language level there? Did I add it or not? No, that language level is not going to go. Language level. Maybe the column was missing. Oh, no. That language level is not going to come out. If the age is not valid, put it in white. So, go to the menu. That language is not going. Go to the menu that is there. And please search for a menu that says Clicing. Ok. Go down to see. Go up. I don't remember where it is. Close it there for a moment. Close the filter. Ready. And let's go then to... Choose the column that is age. Select the age column because it has a name. And now if you go down. Under the menu of... Let's see. Ready. Go down more. No, it's going to be easier. Go to the column and click on the red dot. So that it doesn't mark the... No, it's already in white. It's already in white. You don't have to do anything. If the city doesn't match, put it all in unknown. Let's see. Take off the filter, please. The city, please. Click on the red. And put all that in unknown. Then go to the Clicing menu again. Clicing. Go down to see. There it is. Fill in Valixel Valway. Fill in Valixel Valway. That one that is there. Click there. Go down so that a menu appears. Practically, you just have to do this point. Click there again. In Valixel. Click there because a... Yes, that one that is there. Click. Ready. So, what value are you going to put? Unknown in capital. The capital D. Yes. No. Put Valway unknown. Put Valway on the right side. Unknown. There it is. Unknown so that you... Unknown. Give it Submit. I think I finished what I wanted. That's it. Take off the filter and that's the last point. There, I finished everything. Send it to me please. Done. Thank you. Of course. In what? Ah, okay. Go to the pipeline for a moment. Go to the pipeline. Go back a moment to confirm. Ah, nothing happened. Pipeline. What point would it be? Populate campaign. What is populating? What is the... What is pipeline? First... Ah, point one. Go to point one please. No, but the one that populates the campaign. He already did it. To clarify here that in English level, I had removed it as an element because I didn't have enough time. So that level of English is not going. The last thing to do is to change the cities that are invalid because of the unknown value.
on 2024-10-25
language: ES
WEBVTT creo que hay una falla fuerte porque cómo voy a comprar algo que en realidad yo no sé si me va a funcionar o se va a adaptar precisamente a lo que yo requiero. Entonces ahí parece que hay una pequeña falla a nivel de negocio desde mi punto de vista claro desde tal. Esa es una herramienta verdaderamente cara, carísima, carísima la herramienta tanto a nivel de comprar el core del software más cada uno de los usuarios que se tiene. Bueno vamos entonces quizás la primera pregunta para hacer entonces la introducción que nos podríamos formular es por qué una empresa hoy en día quisiese adoptar una solución a nivel de catálogo de datos partiendo en que hay muchas soluciones en el mercado. Bueno para poder entender digamos por qué o qué beneficios tendría una De igual forma vas a tener otros beneficios porque va a ser muy fácil entender y descubrir nuevos datos. Hago un paréntesis aquí cuando hablo de datos estoy hablando de metadata entonces no estoy hablando yo tengo por ejemplo una tabla de clientes. La tabla de clientes tiene las columnas identificación nombre y apellido. Cuando hablo de este activo de datos de estas herramientas de catálogo de datos son herramientas que lo que hacen es guardar como tabla metadata y en este caso la metadata de clientes sería los nombres y los tipos de datos de esa columna. No tanto no me interesa en esta herramienta no le interesa mucho los registros es decir los nombres de empleados no le interesa lo que interesa principalmente es la metadata que tú conservas de tus activos de datos. Ahora como esos datos tú ahora los vas a ligar y los puedes ligar con metadatos o que te atendiera el cliente de igual forma. Eso me parece interesante pues cada uno los define y digamos lo lo transmite de forma diferente. Ahora las herramientas también de catálogo de datos te van a permitir algo que ya hemos venido trabajando que es el concepto de calidad de los datos. Entonces por lo menos la herramienta te va a permitir hacer dos cosas te va a permitir definir por ejemplo si se están cumpliendo las reglas de calidad y te va a permitir monitorear si esa red de calidad cómo se están usando esa red de calidad como tal. Al final pues aquí hay un gan y gana de este tipo de herramientas porque por ejemplo para un analista de datos le sirve mucho encontrar datos rápidamente para hacer algún trabajo específicamente o para entender el significado de esos datos y para un equipo de negocios puede ser por ejemplo en que tú puedas tener una herramienta de auto servicio y pueda consultar fácilmente la ubicación de un muchísimo de datos del autor que cuando lo modificó que elementos modificó. Entonces ese es el concepto de lo que se llama meta. Entonces estos metados vamos a utilizarlo mucho acá dentro del concepto de catálogo de datos. Hay una definición interesante que los metados se definen como el ADN de los datos y aquí empezamos con lo siguiente tienes que ubicarte desde ya en qué vas a hacer dentro del sofá. No sé si alguien me comentó algo por ahí. Ok perfecto. Listo. Tienes que ubicarte el perfil que vas a hacer en la herramienta y vamos a empezar esa ubicación partiendo de los tipos de metadatos que la herramienta te va a permitir manejar. Primer lugar un metadato que llaman técnico. Ese es el metadato que vamos a recuperar de los archivos, las tablas o cualquier activo de datos que tengas en tu empresa. Entonces imagina que tienes una base de datos y vas a sacar los metadatos de las tablas. Básicamente vas a sacar los nombres de la columna y los tipos de datos. Este perfil no es tan técnico pero el perfil tiene un pequeño problema en que para poder definir el metadato técnico tendrías que saber la ubicación de ese data y cualquier elemento que sea un activo de datos en tu empresa. Vamos ahora con el metadato de negocio. Ese metadato de negocio está más ubicado para aquella persona que tenga un perfil y conoce más la empresa. Esta es la persona que va a definir entonces, digamos, la metadata a nivel de los glosarios de términos de negocio. ¿Por qué? Porque es la que ha trabajado y entiende que es la metadata a nivel de linaje. Entonces, esta linaje lo puedes llamar de tres formas. O lo llamas linaje, o lo llamas trasabilidad o lo llamas ciclo de vida de los datos. Cualquier de los tres nombres de sinónimo llámalo como tú quieras. Yo tengo unos datos técnicos y entonces esos datos técnicos seguramente pueden sufrir algunas transformaciones. Y la idea es que el dato de linaje, el metadato de linaje me diga entonces qué transformaciones se hicieron, quién las hizo, en qué fecha se actualizó esa transformación. De tal forma en que yo haga la trasabilidad del dato desde que inicia, se transforma hasta que se consume. ¿Por qué digo que debe ser más técnico? Porque aquí es que entran a juego los job, pipeline, workflow, como tú quieras llamarlo, que tengan de alguna herramienta de TL. Por ejemplo, seguramente quizás estás casado con PowerCenter o con Talent Studio. Entonces hay unos jobs que tienes ya definidos ahí y esos jobs son los que te van a definir el linaje o el ciclo de vida de los datos. Aclaro que puede ser posible en que definas proyectos de catálogo de datos sin linaje, pero con el linaje la herramienta es mucho más poderosa porque gráficamente te va a decir dónde inicia, qué se transforma y hacia dónde llega. Y ahí podías hacer un análisis de impacto en si yo cambio un valor, cómo ese valor afecta a esa cadena, a esa cadena que se lee, a esa cadena que se transforma y esa cadena que se consume. Entonces aquí es un poco más técnico. Quizás puede que en este momento no tengas los jobs o quizás tienes que definir cómo vas a hacer la política de integrar esos jobs dentro de la herramienta. De todos modos te voy a hacer un ejemplo de cómo se hace esto y cómo quedaría la herramienta con esos tres tipos de metadatos. Y por último tenemos entonces un poco un rol más de calidad de datos y básicamente ese rol de calidad de datos lo que la herramienta te va a permitir es verificar si están cumpliendo algunas normativas o reglas de calidad de datos. Aquí puede haber cuatro perfiles o dos perfiles o un solo perfil. Lo que pasa es que tienes que ubicarte en qué es lo que vas a hacer y cómo vas a trabajar con la herramienta. Técnicamente a nivel de usuario final pues o eres técnico o eres de negocio o eres de linaje o eres de calidad o eres todos. Pero es lo que te va a permitir la herramienta específicamente. Bueno voy a continuar entonces aquí. Sigo acá. Voy a definir ahora este concepto de unos conceptos que seguramente ya los conocemos pero para reforzar y que todos partamos de la misma base. ¿Por qué voy a agregar estos conceptos? Porque ahora estos elementos que voy a agregar aquí son fuentes donde yo puedo tomar mis activos de datos. Son fuentes para yo poder hacer los metadatos técnicos como tal. Primero empezamos con el concepto este de Data Warehouse que en realidad este concepto hay algunos que creen que Data Warehouse es una tecnología y en realidad no lo es. Data Warehouse simplemente es un modelo de datos en los cuales yo voy a crear otra base de datos y en esa base de datos yo voy a mantener entonces mis datos decisionales. Por ejemplo, digamos que tú quieres segmentar tus clientes por por edad digamos y en ese segmento de mercado vas a colocar entonces los datos que son relevantes para tus segmentos. Por ejemplo, carece de sentido mucho en que yo tenga en Data Warehouse por ejemplo un teléfono de un cliente. Por ejemplo, ¿por qué? Porque quizás ese teléfono no me da más información o me agrega información decisional de cliente. Normalmente yo lo que hago en Data Warehouse es llevar aquellos datos que son relevantes para tomar una decisión y por eso que algunos lo llaman como base de datos decisional. Pero no es una tecnología nueva, en realidad no es otro motor de base de datos. Si hay casos como de pronto usted ha escuchado en AWS una tecnología que se llama Redshift dice no Data Warehouse es un poco más comercial ese nombre que está ahí. ¿Por qué? Porque lo que busca ellos es y aquí voy a mencionar este concepto que se llama arquitectura empresarial básicamente para entender lo siguiente. La revenda tiene una sección que se llama arquitectura empresarial en el cual yo no estoy muy de acuerdo con el nombre. Porque la arquitectura empresarial que uno de los marcos más usados se llama TOGAF. Básicamente busca, digamos, sincronizar la estrategia de negocio con la tecnología. Eso no es tan fácil de hacer. Es como yo alineo esa estrategia con la tecnología y no es tan fácil en ciertos casos. Se necesita mucha madurez en el mercado. Yo creo que tengo que decir que la arquitectura empresarial fácilmente entró, se sentó, pero no hizo nada. Entonces hay un claro ejemplo en que no hay una alineación de tecnología con esa estrategia. Entonces la arquitectura empresarial está pensada para eso. Ya le voy a dar porque agregué esta parte. Entonces esa arquitectura empresarial se divide en cuatro tipos de arquitectura. Tengo esa arquitectura de negocio que es el que define la visión hacia dónde vamos ahí, el SEO, el que conoce la empresa. Tengo ese que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el que es el para Inglaterra y lo que me pillaron ahí textualmente era implementar una base de datos. Entonces esa implementación de esa base ya entendía que yo iba pues a hacer el diseño de la base de datos a partir de unos requisitos e iba a montar esa base de datos en el motor que yo quisiera. Entonces yo ese trabajo yo lo pues yo yo apliqué ese trabajo. Noté que la suma de dinero que yo pedía era muy pequeña comparada con las demás y me han contratado a mí. Cuando yo hago la entrega me dice el cliente eso no está incompleto. ¿Por qué? No porque que yo quiero es un sistema de informe prácticamente no me voy a decir era un sistema de información es decir me tocaba definir la base de datos me tocaba definir las interfaces gráficas y la conexión y todo o sea todo. Entonces ahí hay un problema y la carrera tiene cinco pendientes. Hay veces hay unos conceptos que no se pueden ver. Eso para cuando veamos a nivel práctico me vas a vas a comprender mucho más. Listo esas son las tres versiones que tú tienes actualmente los advances como tal. Listo básicamente lo que va a permitir la herramienta a nivel de usuario final es poder descubrir datos más específicamente cualquier metadato ya sea técnico de negocio o operativo como tú quieres llamarlo. Te va a permitir perfilar los datos es decir ahora los datos los puedes catalogar. Imagina todo lo siguiente tú tienes por ejemplo como con GDPR y en GDPR tú puedes catalogar algunos tipos de datos por ejemplo tipos de datos personales, tipos de datos sensibles como por ejemplo que puede ser la historia médica de un usuario. Entonces tú puedes perfilar esos datos y la herramienta te va a ayudar a perfilar esos datos. Te va a permitir organizar y te va a permitir documentar esos datos de manera mucho mejor porque ahora la organización tú puedes buscarlo como tú quieras y vas a ver unos gráficos que te van a permitir entender esos datos en la organización que te presenta la herramienta. Ahora básicamente al final lo que buscamos con este tipo de proyecto de catálogo de datos es primero entender qué significan los datos para ti. No tanto para ti bueno para cualquier empleado de tipo de proyecto que tú quieras implementar hoy en día. Bueno sus funciones son principal descubrimiento pues descripción de los datos y linaje como tal y ahora hay algo muy particular de la herramienta. La herramienta le va a permitir manejar el concepto de versiones. Ese concepto de versiones se ve mucho mejor con el ejemplo ese concepto pero ahora ve una versión de la siguiente forma. Tú tienes una tabla clientes el cual tiene identificación, nombre y apellido. Digamos a lo largo del tiempo tú puedes agregar más datos de clientes. Por ejemplo que tengo yo teléfono. Entonces una versión uno puede ser cuando tenía los metadatos con los tres columnas y la versión dos es cuando tenga los metadatos con las cuatro columnas. Más o menos ese es el concepto de versión. Eso te va a permitir entender cómo ha sido el flujo de cambios en tu ahora la la y ahora como tal la herramienta va a definir el concepto de objeto. Un objeto es cualquier metadato que tú tengas que puede hacer metadatos que obtengan a nivel de almacenamiento. Por ejemplo que lo tenga guardado una tabla, un archivo, un data lay en un data que son los archivos que manejan para para estas redes sociales. Entonces tú puedes mantener objetos de ese tipo. Puedes mantener objetos a nivel de los esquemas, tablas, informes, archivos. Cuando digo informes ahí son PowerBee, Tableau, Quick. Puedes ahora agregar objetos que lo llaman herramienta objetos a nivel de flujo de datos. Es decir todos los job, pipeline o workflow como tú quieras llamarlo que lo puedas integrar en la herramienta y puedes tener objetos a nivel de descripciones como grosarios, columna o etiqueta que quieras mencionar. Listo y entonces aquí esto te lo voy a mostrar a nivel digamos de implementación. Pero aquí me tomé la libertad de hacer un flujograma, un diagrama de flujo de cómo la herramienta funciona o cómo la herramienta trabaja. Entonces esto toda esta parte teórica que tengo aquí que configuraciones, worksheet como tal. Todo esto que está aquí vamos a tomar la herramienta y voy a complementar con la herramienta a nivel plástico y me devuelvo a la parte de la presentación y podemos ver entonces la teoría y la práctica al mismo tiempo. Entonces qué vamos a hacer ahora. Ahora sí vamos a acceder a la herramienta por favor a la máquina virtual para algunos. Sé que otros van a decidir montarlo desde su máquina original pero por lo menos necesito que alguno se conecte a su máquina virtual para poder ver yo debido a que no puedo acceder al software como tal. Daniel no sé si me das, veo que está conectado, no sé si me permites, te guío y nos va mostrando el software como tal. Si hay problemas en tomar tu pantalla y poder visualizarla. Listo perfecto. Primero vamos a definir entonces los siguientes conceptos. Cuando yo diga vayamos al home de la herramienta vamos a hacer lo siguiente. Daniel notas que en la parte superior izquierda hay Denise y Arturo están en esta pantalla. Por favor escogen, dale doble clic al test job migration que es la última opción que está ahí. Al final en el listado dele clic a ese. Perfecto y estamos exactamente en la misma ventana que está Daniel. Entonces cuando yo diga el home se van a esa parte y nos va a mostrar esto se llama el dashboard. El dashboard está integrado entonces por los elementos que voy a mostrar aquí. Por defecto tengo unos enlaces y tengo la palabra worship y das, perdón y das boar. Listo sigamos entonces. Daniel si eres tan amable dale clic abajito en el menú object, dale clic por favor. Esto object, dale clic ahí para expandir ese menú que tienes ahí. Esto objects que son fue lo que mostré teóricamente. Un object puede ser una metadata que tomé de una tabla, una metadata que tomé de un archivo en un data lay, una metadata que tomé por ejemplo de un job en talent studio o una metadata que tomé de un glossario. Entonces ese menú que está ahí me va a permitir encontrar los diferentes objetos que he creado como tal. Dale clic por favor al siguiente. Dale clic en collection. Listo entonces pre-transición lo siguiente. Estamos en la herramienta. La herramienta tiene el concepto que se llama configuración. Imagínate la configuración como una carpeta donde yo voy a guardar todos los objetos de mi proyecto. Nuevamente la herramienta maneja el concepto de configuración. Imagina la configuración como una carpeta donde yo voy a colocar todos los objetos de mi proyecto. Ahora qué es una colección. Imagina la colección como si fuese una subcarpeta dentro de la carpeta más grande del proyecto donde yo pueda agrupar por ejemplo subproyectos o pueda agregar elementos que tienen características comunes. Entonces configuración es como si fuese la carpeta dentro de los objetos y colección una subcarpeta que va a permitir agrupar los objetos. Vete donde dice worship. Por favor clic en worship al lado. Que es worship. Worship que es va a ser la consulta que tú vas a hacer en la herramienta de catálogo datos y que esa consulta tú lo puedes compartir con otros usuarios. Eso es lo que es un worship. Vete donde dice dashboard por favor. Clique en dashboard. Qué es dashboard. Dashboard simplemente es la interfaz gráfica de cómo tú quieres o qué elementos tú quieres mostrar por ejemplo cuando tú inicias el talent data catalog. Dese cuenta que por defecto me aparece un menú de acceso directo que dice welcome data catalog. Me aparece worship y me aparece data dashboard. Pero quizás tú quieres quitar su elemento y te aparezca algo diferente. Entonces dashboard simplemente es la interfaz gráfica que te va a permitir configurar y agregar los elementos que tú quieres ver en la pantalla inicialmente en esta pantalla que estamos actualmente. Y vete donde dice manage por favor. Dale clic en manage. Y aquí nos vamos a dividir un poco. Porque aquí podríamos pensar en dos tipos de usuarios de la herramienta como tal. Un tipo de usuario netamente administrativo de la herramienta y un usuario final de la herramienta. El administrativo le va a tocar hacer varias cosas. Entre esas por ejemplo la que hizo la persona de la persona de su empresa que fue la que creó los usuarios y le definió los permisos. Ese es un usuario netamente administrativo de la herramienta. Ahora esa persona seguramente no va a definir tú tienes que definir pues una planificación y el proyecto como tal. Quiere decir que la herramienta parte del hecho en que ya tú tienes definido un proyecto de catálogo de datos. O sea no va a empezar por sí sola como tal. Listo entonces para esta parte vamos voy a hacer lectura de este caso ahora permítame y voy a dibujarles el diagrama de cómo estamos actualmente en esa empresa. Entonces permítame voy a crear aquí un flujo de grama. Un diagrama de flujo. Listo voy a crear aquí un nuevo diagrama. Listo perfecto. Entonces actualmente la empresa tiene montado un data lake. Este data lake lo tiene montado específicamente en un s3. Bueno AWS3. Fácilmente puede ser tu empresa. Yo creo que tu empresa lo tiene montado si mi cálculo no me falla. Lo tiene montado sobre Azure. Tu data lake me parece a mi creo. Hay una base de datos en que tenemos estos datos que están acá arriba en el data lake y ahora estos hay un job hay un pipeline hay un workflow que son palabras exactamente iguales para lo mismo prácticamente. Lo que pasa que por ejemplo AWS llama pipeline a su job. Talent studio llama a los jobs jobs. Creo que Powercentro llama workflow. No recuerdo bien los nombres pero es lo mismo al final. Entonces tienes acá un job. Voy a colocar aquí job para ver si me sale. Básicamente este job que está aquí es un ETL. Un job ETL que lo que está haciendo es tomo los datos de acá de s3 y lo lleva acá a una base de datos. Ten en cuenta que esa base de datos la tienes replicada en diferentes partes a nivel mundial. Ahora tenemos cómo hacemos para explotar esta base de datos. Entonces tengo unos informes que los tengo presentados en Tableau. Así está aquí. Tengo aquí una tablita. Tableau se conecta voy a verificar permítame y voy a abrir acá un archivo para guiarme porque no tengo el software. Me espero un momento por favor. Listo ahora voy a verificar entonces si estamos en el caso tuyo Arturo. Por favor vete al menú repositorio. Que voy a salirte. Bien entonces vamos a crear una carpeta. Para crear la carpeta nos vamos a hacer un clic en la carpeta. Entonces ya yo le pudiera indicar a la persona que es mi intresible. Mira borra de todas las carpetas que empiezan por test. Todos por favor seguimos test guión piso de record curso under record Daniel. Démole ok por favor. Perfecto. Bueno creo que ya aclaro que aquí solamente veo las pantallas de lo que están trabajando en la máquina virtual. Entonces quizás haya alguien que no lo hizo y no lo puedo ver. Si tiene algún problema me avisas porque no estoy viendo sus pantallas entonces cuando están trabajando ya directamente en su máquina. Listo esta carpeta la creamos para organizar y meter todos los objetos del proyecto en cuestión. Ahora esta es la siguiente. Si el proyecto es nuevo o si vas a definir un proyecto para un ambiente de desarrollo sea jugada desarrollo o producción en estos dos casos vas a crear una configuración nueva. Nuevamente repito si el proyecto es nuevo o lo que va a definir es un proyecto a nivel de un ambiente de desarrollo sea developer o producción vas a crear una configuración. Te había hecho la analogía. Una configuración es como si fuese la carpeta que va a contener todos los objetos. Pero internamente para el señor talent data catalog. Esta herramienta que está acá es para verlo visualmente pero él ahora los objetos los une a través de una configuración interna. Entonces para crear una configuración vamos a lo siguiente. Se sitúa justamente en el nombre de la carpeta que creo y le va a dar clic derecho. Vamos al menú new y vamos a donde dice configuration por favor. Escogemos la opción configuration. Vamos a llamarla toda exactamente igual. Llama todo en minúscula. Ok. Daniel. TDC. De talent data catalog. Las siglas TDC. Underscore. Configuración. Underscore. Tu nombre. En ese caso no le vamos a agregar descripción. Ok. Perfecto. ¿Por qué creamos una configuración? Porque vamos a crear un nuevo proyecto. La configuración lo que va a mantener unidos son los diferentes objetos internamente y la carpeta lo que me ha permitido que sale visualmente. Aclaro tú puedes tener un proyecto que tenga objetos que tengan diferentes carpetas. Por eso creamos una carpeta todos uno. Una única carpeta todos. De tal forma en que los objetos que creemos cada quien pues no interviene con los objetos que crea otro usuario. Perfecto. Ahora sumamente importante lo siguiente ahora. Cuando en el menú la parte superior derecha va a encontrar ahí un avatar, eso lo voy a explicar más tarde, pero antes del avatar aparece un combo voz que parece una una ella parece como unas pequeñas flechitas. Si le alcanzas a ver a Daniel superior derecha al lado del avatar vas para derecha a la punta derecha. Ve el avatar ahí que está como el usuario y dice test John Migración. Sí, ¿Viste dónde dice test John Migración? Creo que todos estamos ahí. Dale clic ahí por favor. Clic ahí y se va a expandir un menú. Ojo a lo siguiente, ese test John Migración me va a indicar en qué configuración estoy conectado actualmente. Como la idea es que cada uno vamos a crear un proyecto diferente, cada uno nos vamos a conectar a la configuración que hicimos. En el caso particular de Daniel sería a TDC configuración. Si no aparece, dele more por favor. Si no te aparece, dale more y busca tu configuración que se llama TDC. Debe estar abajo. Ahí está, TDC por favor escógela, selecciona y dale doble clic. Vete a repositorio, cuando yo diga repositorio, Manage, repositorio. Compruebe por favor que en la esquina superior derecha le aparezca justamente la configuración que usted creó. Perfecto, comprobamos que es la configuración. Entonces cuando vaya a acceder al curso el día lunes y el día martes, asegúrese por favor en que esté ubicado en la configuración suya. O más precisamente a nivel de producción que esté en la configuración del proyecto que usted quiere trabajar. Bueno, hagamos un pequeño break de 10 minutitos y volvemos entonces para continuar. Voy a buscar un poquito de café y volvemos en 10 minutitos. Bueno, continuamos. Estamos ahí conectados? Sí. Por favor Daniel, antes dale clic en el nombre de la configuración, no en el número ese que está ahí en la fecha sino arriba, en el nombre de la configuración que dice TDC Configuration. Listo, empezamos entonces con esta parte. Cuando creas un objeto en la herramienta, salen unos menús que van a ser muy comunes. En primer lugar aparece entonces el overview que da un resumen del objeto, ese menú es común. Va a aparecer la descripción que tú puedes agregar esos labels que aparecen ahí por defecto son los labels que están agregados acá. Características de los labels. Yo puedo definir labels a nivel centralizado y hay unos labels que son muy particulares de la configuración. Los labels que son centralizados significa lo siguiente, en que todos los usuarios de los proyectos obtienen esos mismos labels. Es decir que si agregamos un nuevo label, todos los usuarios del Talent Data Catalog van a tener esos labels. En teoría, aquí es que vemos tú independiente de la herramienta, hay veces que la herramienta pues no se va a adaptar completamente a tu proceso de negocio. Tú normalmente adaptas tus procesos a la herramienta como tal y este no es el caso. Entonces tú tienes que adaptarla. Normalmente según recomendación, mira mi pantalla, voy aquí a crear un archivito, según recomendación de la herramienta esos labels deberían decirte a ti un estado de los objetos como tal. Por ejemplo, lo ideal según lo que recomienda la herramienta es que ahí aparezca label que digan en revisión, por ejemplo, que te diga aprobado, voy a colocarlo más grande, que te digan, por ejemplo, que te digo yo no conforme o que te diga en desarrollo. ¿Cuál es la idea al final de la etiqueta? En que si yo marco, por ejemplo, esa configuración y digo en revisión, yo puedo hacer una búsqueda fácilmente y que me permita encontrar de manera muy rápida todas las configuraciones que están actualmente en revisión o yo puedo buscar todas las configuraciones que están actualmente no conforme. Esa es la idea de ese label, en que yo pueda mejorar y encontrar más rápidamente algunos elementos que tienen alguna condición. Aclaro que para el caso particular de la forma en que está implementado, alguno pues seguramente en alguna reunión concibió que la mejor forma era definir la eso que están ahí. Bueno, vayamos nuevamente al repositorio, si es tan amable. Vete al repositorio, al nombre de la configuración, dele clic nuevamente al nombre de la configuración. Y entonces ahí tienes esos labels. Aclaro, hay unos labels que son de toda la herramienta y hay unos labels que son de la configuración. En el caso, por ejemplo, si también crea un label de tipo de configuración, solamente apliquen la compresión de él. Ahora, no vamos a agregar ningún label ahí o coloque el label que se llama DG, daños catálogo, por favor. DG, daños catálogo, simplemente para la práctica de agregar un label. Listo, ahí. Dale clic por fuera de ese combo para que le tome la... Dale en safe porque el cambio le hace... En pocas palabras, si yo intento buscar ahora todos los objetos que tengan el label DG, daños catálogo, pues me va a llevar a ese objeto, a esta configuración que creó Daniel y la que hemos creado todos actualmente. Ahora vete a la parte de Responsibility, al menú del lado, por favor. Responsibilities. Por defecto, hay un conjunto de roles que definen la herramienta, pero esta parte de responsabilidades se crea para definir quién tiene acceso al objeto como tal. Esta responsabilidad lo vas a encontrar exactamente igual, independiente del objeto que crees en la herramienta. Ahí vas a definir quiénes tienen permiso y qué tipo de permisos tienen. Normalmente eso lo define el administrador del software. Quizás tú eres usuario final y te dan permiso para hacer algo, pero esta parte de asignar permisos a otros usuarios es una tarea netamente del administrador. Más tarde les explico cómo sería entonces para darle permisos a otro usuario. Vete a la sección de Versión. Versión. Le había comentado que una de las diferencias que tiene la licencia, especialmente la estándar, con la Avance, es que la Avance le permite tener varias versiones. Ahora, lo interesante de la herramienta es que tú tienes versiones por objeto. Por ejemplo, yo puedo tener cinco versiones para objeto A y cuatro versiones para lo objeto C. O sea, las versiones son por objeto, no por proyecto, no por configuración. O sea, cada uno va a tener su propia versión, a excepción de los glosarios, que nada más tiene una pequeña diferencia ahí. Pero note entonces que aparece una versión que esa versión corresponde con cuando se expande la configuración, me coloca un número que está ahí. Ese número indica la versión. En esa versión va a registrar todos los elementos y cambios que hicieron en esa versión en particular. Listo, dale clic ahora en Lock, por favor. Aparece la bitácora de cambios que todavía no se han hecho nada, todavía prácticamente lo que hicimos fue crear y vete por último al History. Y el History le va a servir, por ejemplo, a un auditor especificar qué hizo cada quien y a qué hora lo hizo específicamente en el software. Me da cuenta que ahí Daniel dice, Shunata, Confiratributo. Bueno, ahí tú puedes hacer una auditoría de qué está haciendo cada quien dentro del software. El caso particular, pues lo acasamos a ver porque tenemos un perfil que es administrador, que es prácticamente dueño de toda la herramienta como tal. Ahora, si son tan amables, denle clic al nombre de la versión, que sería cuando se expande el TDC, te aparece como si fuese un hijo. Dale clic acá abajo del lado izquierdo, por favor, en el nombre de la versión. En el 2024 1101, dale clic ahí, por favor. Cada Keto va a tener su propia versión. De esta parte tengo solamente una. Si es tan amable, del lado derecho donde aparece el relojito, le das clic y si deseas puedes cambiar el nombre de versiones. Ahí te aparece un lápiz y pones ahí este desarrollo. Cambia el nombre y le colocas desarrollo. Creo que para mí es buena práctica dejarle esa fecha porque vas a saber exactamente qué fecha hiciste los cambios como tal. Listo, desarrollo 2024. Dale clic por fuera. Ahí tienes un chulito, por favor, dale clic ahí en el check. Aquí te recomiendo es que definas un formato estándar de definir esas versiones. Por lo menos, te recomendaría que dejar la fecha para saber cuándo se creó lo Keto o cuándo se creó esa versión de Keto como tal. Perfecto, listo. Hicimos la primera parte. Vamos con lo segundo. Partimos del hecho en que ya tú tienes un proyecto de catálogo de datos. Ahora vamos a definir Vamos a definir con objetos de tipo técnico, modelos de tipo, o sea, metadatos de tipo técnico. Vamos a empezar por ahí. Para definir estos metadatos de tipo técnico, entonces primero debes saber dónde están. Si no sabes dónde están, pues no lo puedes definir. Entonces el perfil de esta persona, el técnico, metadatos técnicos, yo creo que no tiene que tener unos conocimientos técnicos tan altos. Lo que sí es saber es que debe conocer dónde se encuentra el elemento al cual quiere hacer metadatos técnicos. Entonces vamos a lo siguiente. Para definir dos tipos de metadatos, que son los técnicos y los operativos, creamos un modelo. Nuevamente repito. Para los metadatos de tipo técnicos y operativos vamos a definir un modelo, quiere decir que todos nos posicionamos entonces en la carpeta. En la carpeta tuya, listo. Te posiciono en la carpeta exactamente. Dale click ahí por favor si están amables. Vamos a darle new y vamos a escoger a ir a aparecer new model. En ese new model preguntan inicialmente el nombre. El nombre se llama, vamos a colocar el siguiente nombre si están amables, Daniel y todos, Acme. Acme de empresa con C. Acme de los muñequitos Listo. Expande por favor el combo boss de server si están amables. Dale click en el combo boss que dice import server. Dale click por favor ahí si están amables. Note que ahí solamente existen dos tipos de servidores. Esto lo voy a explicar y muy pendiente a quien va a ser administrador de la server. Y ahora si yo digo default server significa que la conexión va a ir de allá, de aquí hacia acá. O sea del talent data cloud hacia la base de datos que tú tengas. ¿Qué problemas puede tener esto? Bueno, un par. Primero, si el talent data cloud está hecho sobre Java, si el driver de conexión hacia esa base de datos no está en el talent data cloud, no lo puedo subir. O sea, el software, digamos la la empresa actualmente no me permite a mí subir datos allá directamente como archivos de conexión de drivers. No lo permite hacer. Significa que prácticamente no me podría conectar esa base de datos si no tengo el driver. Y el segundo y principal, aunque yo creo que el problema está bien, no, porque la mayoría de drivers están montados allá arriba. Entonces imagínate que esta es tu empresa AXA. Esto está aquí, AXA. Digamos de esa forma. Y tienes acá tu servidor está aquí interno. No tenga duración esta interno. Si yo cojo default server, significa ahora que va a intentar conectarse de aquí a acá. El problema de conectarse de la nube a tu red privada es que yo creería que pues ninguno de seguridad te va a permitir hacer eso. Porque no te va a abrir el puerto para que este señor se conecte. Si abres este puerto aquí sobre esa base de datos, pues es un agujero de seguridad. No creo que te lo dará. ¿Qué es lo que hace entonces el talent data cloud? Te ofrece en que tú técnicamente se llama, instales un motor de
on 2024-10-25
language: ES
WEBVTT ¿No? Normalmente eh si ya tú lo tiene ya esto referenciado y modelado. Hay un botón que está en la parte superior derecha debajito de la mano que dice Star Editing. Dale clic en el botón de la mano ¿No? Claro que sí. Ehh muy claro voy Arturo. Tendría que compartir pantalla porque no veo tu pantalla. Okay perfecto. Listo. Vete al botón Mapping a esta opción que se crea ahí ese ese que dale clic que llega allí por favor. Escoge la opción query mapping y vas a coger el modelo de salida que en este botón de la mano escoge la cuadra de tabla que dice Dean countries Dean escoge esa tabletura de la cuadra de tabla la selecciona con control o con shift como usted quiera para que sean las cuatro Okay ahora vamos a configurar Dean countries dele clic en countries ahora Listo del lado derecho en la parte inferior de la tabla de Star Editing por favor y por ahí vamos perfecto Listo voy a volver a compartir entonces compartir pantalla perfecto ahora por favor dale clic eh del lado donde dice como más le das clic en cualquier parte de ese campus. Ad Source. Está ese dale clic ahí por favor y el modelo de salida es el que dice es el modelo de transaccional expandelo por favor que eso metes las tablas y la tala se llama ref country toma la tabla ref country como entrada. Recuerden que eso es lo que simplemente es relación de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla de la tabla Le das por favor salvar ahí podía agregar algunas descripciones de esos elementos pero está ahí dale a salvar vele nuevamente al al mapeo al padre que sería ahí mismo está de cuenta que todas las imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de imágenes de este tipo de ahí te lo está ahí te muestra la relación es decir muestra la relación date cuenta que tengo la acción de AP es por ti web con el data warehouse de tipo mapeo semántico no hay que hacer un mapeo semántico para esta parte perdón y prácticamente sería todas las herramientas que tienen las herramientas a nivel de digo que es ahí creo que se me escapaba también que la herramienta permite es que usted se pueda integrar a herramientas que le permiten definir modelos eh eh diagramas por ejemplo entidades de relación o diagramas nacionales entonces la herramienta se permite integrarte a esos a esos elementos y podrías obtener de ahí metada también la herramienta que tenga en esos modelos listo bueno sigamos entonces vamos a lo siguiente por favor vete a Manage un momento repositorio por favor dale en la carpeta eh te discurso Daniel y vamos a ver si me faltó algo ahí new model semantimapping datamapping configuration perfecto eso lo hicimos perfecto eso lo hicimos hagamos hagamos un break de diez minutitos por favor para que me permita hacerle un favor aquí a mi ama y venimos entonces en diez minutos por favor volvimos nuevamente seguimos entonces ya hemos visto prácticamente eh digamos que el cor de la herramienta vamos a ver ya elementos ya un poco más de detalle de algunas cositas que podíamos hacer adicionales con la herramienta primero vamos nuevamente a la la parte de search si es tan search busca por favor todas las columnas eh con el texto e-mail por favor y que pertenezca a una base de datos entonces en categoría por favor escoge database database nada más ahí las columnas ahí está e-mail e-mail adres ahí me está mostrando el name el y el context el context la ubicación donde se encuentra la columna en particular ahí me aparece que está en las columnas de customer e-mail order order us y anonimize en algunos casos puede que le toque a usted cambiar el nombre que viene por defecto de la metadata raro dale clic en escogemos la opción y le colocas en el palo de correo y le das ok ahí está esa es la opción que deberías usar cuando deseas cambiar el nombre de la metadata que viene por defecto de ya sea de la tabla o ya sea un archivo S tres un en el C por otra parte la herramienta ofrece una pequeña clasificación que aclaro esta clasificación no no la he encontrado para modificarla dentro de la herramienta como que viene por defecto viene estática haz lo siguiente seleccionemos todas las columnas que dicen e-mail adres por favor todas tres últimas te selecciona la primera exactamente nuevamente editar y ahora escoge la opción business domain o dominio de negocio debajo de en el está debajo de en el y expande ahí a debe aparecer un combo voz al lado de replays y aquí lo que hace es que me muestra varios mercados en los en los cuales yo podía concentrar o podía agrupar esos términos entonces aclaro que estos términos aquí no he visto la forma de agregar diferentes pero pues por ejemplo sería esos correo e email sería la tercera opción que son personal personal la tercera opción por favor esta que está ahí dale clic si eres tan amable perfecto le das nada más y puedo clasificarla al final eso es un que voy agregando en que yo podía hacer una búsqueda de aquellas columnas que pertenezcan a un cierto dominio de negocio aclaro que esos dominios que aparecen ahí seré me no he visto la forma de de donde cambiarlos o donde agregar algo nuevo pero es una forma que también me va a permitir a mí clasificar es como una especie de label o una especie de que voy agregando ahí dale ok por favor y listo son detalles un poco más específicos de la herramienta voy a mandar esto por chacar ahora aquí algo por chat para que lo vaya a usar también allá voy a abrir acá mi browser un momento y voy a hacer consulta lo que le manté ahí bien la herramienta trabaja con cuatro tipos de documentaciones ya hemos visto la mayoría primero esa pisa documentation no la hemos visto ahora la otra es term documentation o documentación de términos es la que creamos y definimos cruzario de términos tengo esa que se llama documentación mapeada que es lo semantic mapping o su efecto data mapping y tengo esta esta otra que es otra documentación que es la que normalmente la puedo cantar cuando hago un jármenes de una tabla de una base de datos que siempre lo vamos a hacer ahora vamos con vamos con este visto en documentation entonces en torno a lo siguiente vamos a bueno voy nuevamente a la a la ventana en que está Daniel dale click por favor a email documentation a cualquiera de esos que están ahí por favor email documentation a cualquiera de los tres y me da el perdón y me la adres perdón y me dale click ahora al la piso que está ahí documentation en un término ahí al final dale click en ese término en la pique aparece en el término para tu momento que pronto está muy particular está de aquí ya que está yo no lo deja cambiar pero tu momento a ver por qué no me sale aquí ah listo dale click en email adres term por favor perdón documentation dale click en email adres dale click ahí creo que era al lado realmente qué pena dale nuevamente no justamente no en el término como tal sino como en el cuadrado dale click en ese cuadrado y para él en el lápiz ahí está nota que aparece ese concepto que dice business documentation en la teoría primer lugar dos cosas que tengan en cuenta solamente este business documentation será para metadatos técnicos para metadatos de negocio ya tengo los términos y los crónimos entonces los metadatos técnicos que tenemos hasta el momento son un archivo ssv que sacamos de un s3 y tengo tres bases dos bases de datos que son una mysql y una que está en pogres entonces a todos esos metadatos que son de tipo técnico le podemos agregar un business documentation en teoría el business documentation lo que es detallar más el elemento para que las personas puedan entenderlo por ejemplo dale click ahí en en el define define al local business day dale click ahí por favor para modificarlo a pesar de un lápiz más arriba ahí está tiene que darle primero un nombre puede colocarle si quiere en español correo electrónico y en la descripción correa coloca correo electrónico de lo empresarial de los clientes correo electrónico empresarial de los clientes perfecto y ahí lo que te hace entonces es que te agrega más documentación a lo que ya tienes anteriormente nuevamente solamente son para metadatos técnicos esa parte hagamos la parte de los para ver si debería aparecer ahí para confirmar lo que estoy diciendo vete al repositorio por favor y entra al modelo que se llama polices entra la primera versión del modelo y accede a las columnas de la primera versión entra al folder ahí me aparece esa documentación que está ahí es documentación business para ese archivo dale clic en polices sv y dale clic en número de polices por favor número de polices y ahí está dale clic en documentation en el marco ahí dale clic en el lápizito en el que ven a en el lápizito que aparece cuando cuando coloque el mouse ahí está el lápiz y ahí está el business documentation entonces agrégate una documentación simplemente para hacer la práctica dale clic ahí en adicional valor entonces aquí colocamos número espacio polices business documentation número que identifica de forma única una polices de seguro número que identifica de forma única una polices de seguro perfecto no hay problema no hay problema no hay problema dele clic en lo siguiente le apareció documentation ya lo vio a entre por favor al folder que dice no le probó que pena al folder no le probó que está bajito eso cualquiera cualquiera llega dele clic ahora en polices puntos sv esto lo puede hacer a nivel de lo que es del pocket lo puede hacer a nivel de del archivo pero lo hicimos la práctica fue con número de polices dale clic en número de polices y aparece documentation dele clic coloque el mouse por encima y al final va a aparecer un lápiz por encima de tan emica al final de un lápiz dele clic en ese lapicito por favor y ahí tiene business documentation dele ad valor en business documentation ahí aparece una valor que está bien pequeña y listo entonces le colocamos número espacio polices sí y la p mayúsculo hemos colocado en la decisión colocamos número identifica de forma única una policia de seguro ok ok y se debe agregar esa información entonces cuando tengamos metadatos técnicos podías hacer visit documentation ya sea de la base de datos ya sea de la tabla o ya sea de conceptos de o atributos que tenga la tabla o el archivo te da al final lo mismo es simplemente para agregar más documentación en teoría ahí vas a agregar solamente la documentación para que pueda entender con más detalle el término o el atributo como tal o close por favor perfecto entonces ya vimos revisto nuevamente mismo business documentation término documentation llama vio lo hicimos no falta entonces otra documentación listo entonces vamos a hacer lo siguiente voy a conectarme de mi equipo voy a conectarme para que no la guste al fin y al cabo todos vamos a estar conectados a la misma base de datos momento y hago la conexión hacia la base de datos de mysql que todos estamos conectados que creamos continuar perfecto entonces en esta base de datos mire lo que voy a hacer voy a agregar esta tabla voy a agregar una tabla que se llama clientes pero con una característica interesante que es esta tabla está comentada en teoría de buenas prácticas el ingeniero o el diseñador de datos de la base de datos o el la parte o el developer de la base de datos debería como buena práctica documentar las columnas y las tablas este es el caso en particular todo motor te permite hacer esto te permite comentar aquí la tabla y te permite comentar cada una de las columnas que están en esa tabla voy a ejecutar aquí listo y me aparece aquí un error dice y el error es cual que no lo veo fecha nacimiento y mail dice momento por favor y la respuesta acá que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el error que no sé cuál es el
on 2024-10-25
language: ES
WEBVTT En este caso, puedes apuntar las direcciones tuyas. Agrega lo siguiente. Hay un componente que se llama HTML text. Suéltalo en la segunda columna, por favor. Vete donde dice configurar. Y ahí coloca entonces dashboard. Cambia las letras que tú quieres en el tamaño que tú quieras. Dashboard curso TDC.
on 2024-10-25
Visit the TAC, Data Catalog, Stewardship course recordings page