Cloud Desktop Teaching Platforms

Talend Big Data Integration

language: ES

WEBVTT
Esta máquina virtual tiene montado un par de cosas inicialmente.
Voy aquí a formatear, darle más grande esta letra.
Vamos un poquito más grande por acá. En primer lugar tienen montado un contenido de Docker. En este
caso para el Windows se llama el Desktop Docker. No lo subas todavía. Ese por aquí lo puedes
encontrar, pero aquí Docker, aquí debería aparecerte Docker Desktop. No lo subas,
porque esto ya no vamos a trabajar. En ese Docker Desktop lo que tienes es un contenedor con High
2.7. Ahí está en 4.0, pero tuve un problema con el sistema operativo que me salió un error que
no me dejaba montar. Entonces por cuestión de tiempo monté en 2.7. Esto no te afecta para
el Big Data, pero sí te afecta si vas a algo en producción. ¿Qué diferencia hay? En que High lo
que hace es que cuando te haces una consulta SQL en 2.7 te genera el script MacReduce,
pero en 4.0 ya High no usa MacReduce, sino usa Spark, que evidentemente es mucho más rápido porque
todo tiene memoria. Aclaro que solamente por observación, siempre y cuando tengas memoria,
porque si no tienes memoria termina haciendo swapping, ir a memoria, ir a disk y ir a memoria y
prácticamente haría lo mismo que MacReduce. Eso tienes que tener memoria para poder montar eso.
Entonces es la única diferencia. El 2.7 se basa en MacReduce y el High 4.0 se basa en Spark,
mucho más rápido. Para lo que vas a hacer es transparente, porque el Spark, porque al final
el señor se conecta desde el High y hace todo de manera visual. Entonces ya el High internamente
es una cosa que te la devuelve hacia el talent o hacia quien lo consume, pero para la práctica
es, digamos, es transparente la diferencia que hay como talento. Por otro lado vas a tener montado
una máquina virtual sobre Ubuntu, o sea, sobre Ubuntu si no estoy mal 20 y en esta máquina virtual
vas a tener el Hadoop. ¿Por qué la máquina virtual? Bueno, varias cosas. ¿Por qué no lo monté
sobre Windows? No, en realidad lo intenté montar, pero me salió un error ahí y a veces errores
desgastan en tiempo y encontrarlo. Entonces decidí montarlo en Ubuntu. Si analizamos a nivel de
Listo, entonces vamos al Hyper-V.
Bueno, ahí va a estar montando, lo dejo quieto por un lado. Voy acá al Hyper-V y aquí tengo una
máquina virtual llamada NobleProp. Esa máquina virtual, como te decía, está Ubuntu y tiene montado
el Hadoop. Por favor dale doble clic a la máquina virtual y dale Start si eres tan amable. Aquí le
dice, tú divertiste en el periodo automatic checkpoint. Dale continuar, ahí no recuerdo
qué dice en esa parte. No sé qué dice en ese checkpoint, no recuerdo. Y esperamos que monté.
Va a haber muchas tecnologías en juego, esperamos que no tengamos ningún problema técnico con las
tecnologías. Esperamos que suba entonces la máquina virtual. En este caso la máquina virtual tiene
2 GB. Aquí le monté, en Ubuntu le monté la capa gráfica, pero recordará que cuando estamos a nivel
de servidores normalmente yo tengo capa gráfica. Es por una cuestión netamente porque la capa
gráfica lo que me ocupa lo puedo utilizar para atender más clientes. El caso de las últimas
versiones de Windows, ya tú puedes montar tu Windows Server sin necesidad de la capa gráfica.
Espero entonces un momento. Si tiene dos chicas, entonces ahí empieza a hacer cositas y puede
molar un poco. Espero entonces, espero que todavía le cargue a Bruno, le cargó a Bruno, todavía
entre el usuario Hdud y el password es Hdud como está ahí, como está el nombre de usuario,
pero en minúscula. Es decir, es el mismo no, el password no es el mismo nombre de usuario,
sino que el H en minúsculo. Ahí no le coloque en realidad más memoria porque es que después cuando
bueno espero que cargue entonces listo. Por favor entonces hagamos lo siguiente. En primer lugar,
aquí no nos vamos a meter nada con la capa gráfica, no sé, al final no se para qué le
coloque esa capa gráfica. Voy a ver por la aceleración que tenía. Váyase aquí al menú,
mire si le aparece en la parte final terminal que es la shell, la shell que vamos a usar,
la shell en bash que tiene el señor Ubuntu. Le clic en terminal y te va a abrir una shell, ok?
Acá bajito, acá le da clic aquí, ahí están los puntitos para que salgan todas las aplicaciones
y clic en terminal. Si no te aparece, aquí escribe la palabra terminal y te va a aparecer entonces.
Veo para ver si estamos todos. ¿Cómo se ve? Acá en la parte de abajo, ve. Acá en la parte de abajo,
show application aquí y le das clic en terminal si no te aparece. Si no te aparece,
ahí listo, perfecto, ya está. Bueno, perfecto. Bruno, el power es Heduque minúsculo, ok?
Ok, el mismo nombre Heduque minúscula, así como está el nombre del usuario pero con minúscula
y en la terminal, en esta terminal coloque el comando ifconfig y le da enter.
Ifconfig
y analiza la dirección, creo que la dirección es igual para todos. Mi dirección IP de esta
máquina es 172.20, 176.2. ¿Esa es la misma para todos? Creo que sí porque coge la máquina de
Torme, sí, bueno, perfecto, listo. Ahora, en el Windows, en la máquina host, abre una shell,
vamos a abrir la shell de CMD y dele el comando entonces acá, el mismo pero con IP, ipconfig.
IPconfig
y mi dirección acá de esta máquina es 10.10.3.47 y tiene un adaptador de su
red que apunta a la misma red con máscara su red que igual a la de la máquina. Queda esa parte
técnica, haga lo siguiente, haga un pin, comando pin hacia, es decir, coloque pin hacia 172.20.176.2.
El sitio de Windows, la shell de Windows CMD, haga el pin y verifique que tenga respuesta.
Vamos a ver.
El problema es que este adaptador le generó una su red diferente. Bueno, hagamos lo siguiente,
entonces, si no va a llegar. Perdón, confirmo si no te va a llegar porque la su red es diferente.
Hay que cambiar la su red que no saca, hay que cambiar la dirección IP de acá. Sabía que esto
Entonces, hagamos lo siguiente.
Vaya por acá y aquí está como una pequeña red aquí. Aquí le da click en este botoncito
y vaya a la opción que hice conectado por cables, wire connect y coge wire setting.
Y vamos por la misma. Aquí le da click para la conexión.
Vaya a IPv4 y cambie la dirección por la siguiente. Esta dirección que está aquí,
vamos a cambiarla por la siguiente. Cambiemos por la siguiente,
cambiamos por 172.25.64.2. 172.25.64.2. Dale a aplicar.
El password de J.Mendes es Juan. Todo en minúscula. Juan. J.U.A.N. Todo en minúscula. Juan.
Recuerda, la dirección es 172.25.64.2. Listo, después que hiciste eso,
hay que aplicar los cambios. Entonces, apaga la tarjeta de REC y la vuelves a encender.
Por favor, vete nuevamente a la terminal y flecha arriba, busca el comando ifconfig y
le das enter. Y te va a aparecer la nueva dirección que configuraste.
Si terminaste, por favor vuelve a hacer pin sobre la nueva dirección que configuraste y te debes
tener respuesta. No, .64. La dirección que vas a cambiar es esta. Un momento y la coloco acá.
Y te aparece la lujba. Cuenta más.
No, porque tendría que colocarla. Yo creo que lo mejor. A todo le aparece una máscara,
una dirección IP diferente acá en Windows. Hace que como que genera elatorio. Es decir,
esta dirección de la tarjeta de su REC es la misma para todo.
No, no, no. Entonces, hagamos lo siguiente mejor. Hagamos lo siguiente. Váyase aquí,
no nos compliquemos la vida. Váyase por aquí. Y dígale IP virtual que se la genera automáticamente
un DHCP. Él busca un DHCP y lo genera. Léle aquí aplicar. No la use manual.
No, si te funcionó bien. Si te funcionó a ti no hay problema. Déjala así. Ok. Si te funciona el pin.
Entonces mejor apliquemos aquí automático. Aplicamos acá.
Apagamos nuevamente. Volvemos a encender y busque. Dígame.
Esto. Entra a la configuración esta. Pasa IPv4 y aquí IP método de licencia automática, DHCP.
Listo. Después que haces eso, apaga la tarjeta de REC y la vuelves a encender. Debería darte
una dirección en el mismo rango de la IP virtual del túnel que tienes. Dale IP config.
Y mira a ver qué dirección te dio. A esta dirección que te dio le das un pin a Windows.
Por ejemplo, a mí me dio un pin a 172.25.67.182.
Hazle pin a la dirección que te dio a ti. Porque como está generando el atorio la IP,
entonces ahí fue un problema de configuración de la máquina virtual. Listo. Ya pa' qué.
A quién le colaboro para ver? No sé quién hizo el pin. A quién no le funcionó el pin pues?
Perfecto. Ten en cuenta esa IP que la necesitamos ahora.
¿Quién no? Bruno. Voy para allá, Bruno.
Bueno, vamos a ver. Tú hiciste automática, ¿Verdad? Dale entonces acá en Windows,
acá en la, como decía alguno, en la ventanita negra. Dale pin.
Pin ahí, pin con G espacio a la 172.30.98.104. Qué raro. Dale entra ahí.
Vamos a ver si tiene respuesta. Ahí está, repli. Perfecto. Ojo con esa IP, ojo con esa IP. No,
la necesito ahora, viste. Bien, esa IP la necesitamos ahora. Bien, sigamos entonces.
Eso va más que todo a nivel de conexión. Ahí pido disculpas y debí configurar eso de manera
estática. Pero bueno, ahí ya lo que fue, fue ya. Listo entonces. Ahora, comandos típicos. Dale
entonces el comando Clear para borrar. Clear aquí. Le borra. Clear.
Esto en realidad lo monté de esta forma porque partiendo del hecho de que
en experiencias pasadas con la máquina virtual se nos perdían unos archivos,
entonces hay la posibilidad de que se nos pierdan algunos archivos. Entonces, por eso lo configure
de esta manera. En caso que se configura hay que reiniciar nuevamente los servicios. Me voy ahora
en que no es necesario que usted sepa esto, pero para poder montar esos servicios vamos a darle unos
comandos propios del señor Hadut. Más específicamente el HDS de Hadut. Ahí en esa ventana vamos a
escribir el siguiente comando. HDFS main node menos format. Eso lo que hace es que formatea todas las
carpetas que tenga ella anteriormente y cualquier archivo lo borra por si acaso hay algún. Para
bueno ese fue el primer comando lo dejo aquí y él termina de ejecutar. Perfecto. Eso lo que hizo
fue que si había una carpeta en el sistema de ficheros de HDS de Hadut, la borró porque hice
que formateara. Ahora sí vamos a subir los servicios de Hadut. Para subir hay varios servicios entonces.
Vamos entonces a lo siguiente. El servicio que vamos a subir inicialmente se llama así star dfs.sh.
Entonces haga lo siguiente. Como yo tengo ya en el path la ruta de ese archivo va a copiar nada más
y escribe de tab. O sea escribe hasta la D si quieres y le das tab. Es lo que va a hacer es que va a buscar
en el path algún al fichero que empiece de esa forma y le agregas aquí si le das tab. No, no hay nada.
Hay varios archivos le agregas el sh y le das enter.
Espérate puede demorar un tiempo porque nada más tengo 2 gigas de memoria.
Agrega la arquitectura que te haya visto los day nodos que es el señor maestro y
delega tareas hasta el day nod. El puede demorar un tiempo porque principalmente
tengo problemas a nivel de memoria. Tengo poca memoria. Es claro que las operaciones
las vamos a hacer sobre archivos muy pequeños pero al final le da lo mismo. ¿Por qué? Porque
da lo mismo grande o pequeño simplemente el problema es de máquina. Esperamos un momento.
Y espero que todo le termine. A mí todavía no ha terminado de subir el servicio.
Cuando termine voy escribiendo entonces el otro servicio.
Cuando termine le vamos a dar entonces start y cap.
Con el comando es así yarn.sh
Aquí en la el caso tiene que esperar que termine. Te del prom.
En el caso tuve no terminado todavía me parece.
Ahora sí terminó. Si terminó le das entonces este start yarn. ¿Cómo haces?
Y le agregas el sh. Ese es el comando.
Al final le das enter también puede demorar subiendo algunos servicios que necesitas a un
y una cuestión desde mi experiencia que cuando estos señores vienen
a ver si tienen. Pues nuestros señores vienen de Linus y debo confiar en Win,
te aseguro que en Linus es más fácil configurarlo. A menos que en Win tengas un
punto X. Si no mi hermano se hay que agregar una cantidad de cosas que hacen no funcionan.
Deberías que fallan. Ah eso no. Y espere a que termine entonces. Cuando termines,
si ya terminó le das el comando JPS y te va a mostrar los los servicios que tiene montado.
Bueno acá se llama demonios. Los demonios que son los mismos servicios en Windows.
Normalmente un servicio que es un proceso que se ejecuta en background.
Es exactamente el mismo término siendo que acá se llama demonios.
Los demonios no vienen a religioso. Y ahí te vamos a dar entonces los servicios que
montó. Deberían servicios coincidir con los míos que tengo acá. Si no coinciden tenemos un problema.
Sí creo que bruno todavía te falta el YAR, ¿verdad? El comando YAR.
Carlos tiene Liana también, Arturo también. El segundo comando. Si el segundo comando es este.
Star YAR. Lo dejas hasta la Y y le das tap o lo que llaman Y. Espera a que termine de ejecutar y le
das JPS. Los servicios deben coincidir con esto que está acá. Esto simplemente para agregar. Cuando
estábamos en el SB recuerda que el SB o tú ejecutabas por allá un servicio tipo REST. Lo que
hacía es que te abría un puerto TCP. Esos servicios lo que están habiendo son puertos TCP y si te toques
la parte de configuración tienes que estar pendiente de abrir el firewall para esos tipos
de servicios. Si tú quieres darle el siguiente comando net stat. Net, perdón. Net stat. Espacio
Bueno no lo veo pero espero que sí esté. Bien, revisa lo siguiente. Cuando veas esto 0000 indica
que a este puerto TCP se pueden conectar cualquier IP. Si quieres vamos a expandirlo aquí mejor.
Cuando veas un 0000 significa solamente cualquier IP se puede conectar y cuando veas por ejemplo
un 127 así significa que solamente esta máquina se puede conectar a ese puerto. Es la teoría básica
de redes que está ahí. Bueno esto me lo dejas abierto aquí. Si quieres ahora vete y abre una
recuerda la IP. Entonces a esa IP que está ahí la vas a colocar acá en el browser en la
barra direcciones. Le vas a colocar dos puntos y le vas a decir que se conecte a la máquina
virtual que es la IP y le vas a dar que te muestre que tiene en el puerto 9870.
Esta es listo. Entonces sería esto así.
Vas a colocar allá. Aquí te coloco XXX. X punto X punto X punto X porque la IP tuya es variable.
Dos puntos 9870 entra. Te va a aparecer esa interfaz que te va a dar el estado del del del
hot. Avisa si alguno tiene problemas. Espero todavía que hay algunos que veo que no han
verificado si tiene conectividad. El comando que me dijo por el... perdón que me dijo el...
lo que vas a colocar en el browser. En el browser vas a colocar la IP de la máquina
remota que hiciste spin le agregas dos puntos y el puerto 9870.
Y te va a aparecer la interfaz gráfica que tengo en la parte de atrás. Normalmente esto tú no
lo configuras. Esto lo configura el departamento IT. Fue su defecto el DevOps de tu empresa. Tú lo
que haces es que te conectas a esto que está acá. Pero aquí somos todero en esta vez. Somos ingenios
troperos. Tengo que montar todo. Listo. No sé. Misael, ¿Listo? Bruno, ¿Cómo vas? Diana, ¿Te salió?
Vamos a ver entonces. Vamos a ver. Bien. Entonces cópiate esta. Si quieres selecciona. Selecciona
este IP después del pin. Selecciona ese IP. Perdón. Sí, sí, esa. Dale enter. Dale enter ahí. Ah,
bueno, copiar también. Sí, enter te copias. O le das copia. Ahí está. Copia o enter. Ahora pega esa dirección ahí
Bueno, listo. Pues apareció. Yo creo que todos la tienen ya perfectamente. Vamos entonces aquí.
Sobre esto, aquí, ¿Qué podemos ver interesante? Bueno, nada me interesa solamente una parte de esta
interfaz. Aquí solamente para mencionarte, tengo solamente, en DayNode, nada más tengo uno activo.
Evidentemente, si empezamos a comparar, tradicional, a ver si tengo la gráfica por acá,
pero ese momento que fue que lo cerré, bueno, parece que la aburré. Sí, la aburré. Bueno,
si recuerda que tradicionalmente que hacía yo, formaba clúster y hacía un escalamiento horizontal.
Los nodos son los que escalan horizontalmente. Entonces, ¿Qué ventajas tendrías tú comparado?
Ventajas, ventajas. No significa que lo necesites. Ventajas. Ventajas comparado con el sistema
tradicional. Primero, el escalamiento horizontal te llega a miles de nodos. Mientras que el
escalamiento horizontal en un sistema tradicional de base de datos te llega a cientos de nodos.
O sea, de ahí te va ganando el Big Data. Segundo, a nivel de costos. Costos, primero, económico. Si
hablamos de licencias, al montar un clúster, no lo tengo así, estoy sincero que hace rato yo no me
meto con precio de Oracle, pero Oracle es carito. O sea, Oracle, bueno, Oracle si tiene Oracle es
sinónimo de billete porque eso es caro. Pero cada nodo que tú vayas agregando tienes que pagarle
a Oracle más billetes, más plata por la licencia, si no, no lo puedes usar. Y por costos a nivel de
complejidad, no. Agregar un nodo simplemente tú vas a un archivo xml, dar la configuración del
nodo en características a nivel de la IP, en el otro nodo instalar una cosa muy mínima. O sea,
la configuración en costo es mínima comparado con lo que tú haces allá con el Oracle o con el Pocres.
Y que vamos, o sea, bueno, ya te hablé de precio. Bien, solamente eso a nivel de, ah, otra cosa,
a nivel de costo, se me escapó decirla ya. Cuando tú montas un clúster a nivel de escalamiento
horizontal, de base de datos, llama a Oracle, Pocres, de secure server que te gusta a ti,
porque la mayoría te lo permiten. El problema es que la máquina tiene que tener encendida,
independiente que ese clúster lo use, o sea, use todos los nodos que están en ese clúster.
Entonces, partiendo del hecho, si tu infraestructura está un premais, eso te acarrea costo a nivel de
electricidad porque tienes una máquina más encendida. Al tener una máquina más encendida,
consume la máquina y el aire acondicionado, porque tienes que tener una temperatura estándar,
te consume más, paga más billete. En cambio, que ahora lo que estamos haciendo, lo que se está
haciendo hoy en día, y esto está más que todo sobre el cloud computing, es lo siguiente. Es decir,
tú cuando vayas a necesitar nodos, el cloud computing se estira, que es la principal diferencia
cloud computing o el cloud autocontracional, es que yo me puedo estirar dependiendo de las
características. Al final, ¿qué es lo que tú haces? Tú montas un Kubernetes y lo que hace al final
es que dependiendo de la cantidad de nodos que necesites, se van creando contenedores, contenedores,
y esos contenedores te ayudan a solucionar problemas en tiempo de ejecución, en el momento que tú
incides. Recuerda que esos contenedores tú los montas sobre un cluster de hardware, cluster
grupo, y esos contenedores se ejecutan sobre hardware, digamos, sobre la arquitectura del
cluster que tengas tú. Esas son las principales diferencias de las ventajas. Nuevamente, no es que
signifique big data, es comparado de pronto un big data con un cluster a nivel de base de datos.
Listo, ¿a qué hora tenemos uno? No tenía máquina para montar dos, porque me tocaría,
para que tenga sentido, me tocaría montarlo en dos máquinas, porque montar dos nodos en la misma
máquina, lo que me serviría es para réplica del sistema de ficheros, pero de ahí para más nada.
Y lo que me interesa al final, eso simplemente es para mostrar, yo en realidad no, aquí te muestra
cuál es el volumen, cuánto es el tamaño que tiene cada nodo, pero eso no es el objetivo. Lo que me
interesa aquí es este que dice Browse al sistema de ficheros. Te aparece en blanco, ¿verdad? Bueno,
configuremos eso. Listo, vete a la máquina virtual que tienes. Perdón, ¿a qué? Ah, en la última
opción que te dice Utilities, la primera opción. Déjame esa ventana ahí, que es la que le vamos
a necesitar un poquito. Vete ya por último acá a la máquina virtual, si eres tan amable,
la tienes abierta aquí. Se cerró por el tiempo, vuélvete a loguear como a HEDU.
Dale click a la terminal si eres tan amable. Perdón, aquí le di con doble C.
Vamos a dar el siguiente comando. Vamos a crear una carpeta en la cual voy a tener mis archivos.
Recuerda que en este caso voy a montar un data lake. Al final necesito una carpeta. O sea,
recordándole, amigo mío, un S3. Vamos entonces. Mira lo que vas a hacer ahora. Vas a ejecutar el
siguiente comando. HDFS-MKDIR y crea la carpeta. Slash, el slash es importante.
Aquí slash en el Linux es sumamente importante y va a crear la carpeta NobleProc.
Lo que está diciendo es que oye, créame en el sistema de ficheros de Hadoop una carpeta que se
llama NobleProc. Esa carpeta no está directamente sobre el sistema Linux,
sino que está sobre la capa de Hadoop. O sea, en este caso no está sobre Ubuntu.
Permítame y la memoria no me falla. Voy a hacer esto porque de pronto me falla la memoria.

on 2024-02-27

language: ES

                  WEBVTT
para conectarte a esa carpeta, no es más semente virtual,
tiene diferentes formas de conectarte, ¿OK?
Yo creo un bokeh especial para esa parte.
Entonces, cuando tú descargaste, cuando descargaste los archivos,
descarga tu archivo que se llama AWS.
Entonces, reemplaza.
Te pide primero el access key.
Entonces, cópiate el access key de aquí,
de esto que tengo yo acá, Control C.
Y pégalo en el access key.
Recuerda que como es Java, tiene que ir entre comillas doble.
Y acto seguido, te va a pedir un secret key.
Ahí lo tienes.
Copia desde el más hasta el final.
Y lo pegas aquí en el señor.
Aquí lo pegas aquí dentro de las comillas dobles.
Y ahí lo tienes, OK.
Vas a configurar el secret key y el access key.
Recuerda que como es Java, tiene que ir entre comillas dobles el
valor que vas a pegar.
Sí, todo va entre comillas dobles, exactamente.
Es porque como es un string y como el lenguaje que está por
debajo de Java, necesariamente necesito comillas dobles.
Todavía en este paso no he hecho nada con Hadoop.
Estoy desambientando el tema para el Data Lake.
Creo que.
Sí, la que está por defecto.
No hace más nada así.
Sí, es la que está por defecto.
No, está de credencial.
Esa es la que tomas.
Está de credencial.
La que está por defecto, exactamente.
La región por default.
Que creo que la tengo en el este, no me acuerdo ahora.
Bueno, no me acuerdo, no lo hice.
La que esté por defecto ahí, no hay problema.
Bien, ahora sí sigamos entonces.
Ahora voy a subir, vamos a subir tres archivos que vamos a
utilizar durante entonces la práctica.
Entonces vamos a hacer lo siguiente ahora.
Para subir un archivo, este es un poco más engorroso aquí esta
parte de el tal en la forma.
Entonces una forma es búsquete uno un cómo se llama T.S.
3.
Subamos dos porque si no necesitamos más tiempo.
Entonces voy a quitar ese tres.
Voy a colocar un T.S.
3 por cada archivo que vaya a subir.
Alto seguido entonces, configuremos el primero.
Aquí le vas a decir que va a usar una conexión existente y
vas a buscar, te sale por defecto y a la que tienes.
Y aquí tienes entonces el bokeh.
El bokeh que es una bonita carpeta, carajo.
Ese tres es en cool dry y el bokeh es una carpeta.
Eso no lo puede negar a nadie.
Una carpeta.
Por favor, sígueme el siguiente estándar.
Ya yo tengo una carpeta creada ya.
Entonces vas a crear donde dice la opción donde dice,
perdón, donde dice bokeh.
Bokeh.
Vas a iniciar de la siguiente forma.
Vas a decir entonces que el bokeh donde lo va entre
comillas doble va a ser noble proc slash.
Por favor, coloca el nombre tuyo para que creemos una subcarpeta
en esa carpeta.
Entonces en el caso mío pues será yo.
Para no confundirlo, créate una carpeta con nombre.
Creo que aquí no hay nombre repetidos.
Entonces créate una carpeta para cada uno.
Esta carpeta es la que está en ese tres.
No, es diferente.
Lo que hace que yo tengo ya.
Sí, lo que hace que yo tengo un bokeh allá que se llama noble
proc.
O sea, otra carpeta.
Ese tres es una carpeta.
El bokeh es una carpeta.
Quedaría entonces de esta forma en noble proc.
Alguno le quedará Diana, otros Iván, otros Luis.
Bueno, ahí le quedará de pendiente entonces.
Y el key va a ser el nombre del archivo con que va a quedar en
el en el S3, en el bokeh del S3.
Entonces vamos a subir nada más dos archivos.
Ya le vamos a seguir.
Vamos a subir el archivo de super market y el archivo de
tin.
Voy a copiarme el nombre de aquí para tratar de
automatizar el proceso.
Voy a copiar todo el nombre aquí.
Y lo voy a pegar entre comillas doble acá.
En este caso voy a subir inicialmente el de super
market.
No coloco no coloque la extensión completa para tener
formato.
Aunque recordará que para el caso del talent que tenemos la
capa de la capa la capa silver.
Si no tiene extensión, no hay problema.
Pero para estabilizar nuestros archivos vamos a colocar el
punto ccv.
Y aquí entonces tienes aquí busca por acá.
Y lo que hace para los mapas hacia el archivo que va a subir,
que está en tu disco duro, dónde está.
Caso mío lo coloque en temporal y entonces escobre el
archivo que voy a mapear.
Le digo open y aquí sí me ayuda.
Te acuerdas del problema que tuvimos cuando mandaste de
file, de file output de la de la carpeta.
Bueno, acá sí lo casi te ayuda.
Aquí una vez alguien que fue Iván el que me preguntó qué
pasaría si un componente cuando conecto entonces hay error.
Yo le decía bueno, hay componentes que tienen la
opción die on error.
Si yo chuleo esta opción significa en que no sigue el
flujo del job.
Se muere ahí.
Quiere marcarla.
Y ahora vas a conectar este señor.
Aquí tienes dos opciones.
On sub job OK o on component OK.
Aquí la mejor opción sería on component OK.
Si ese componente está todo bien, voy aquí.
Yo pude ejecutar los dos sin unirlos.
Significaba que paralelamente iba a subir los dos archivos.
De la forma en que los conecte significa que ahora sube
primero este y después ejecuta este.
Tú úsalo como más convenga dependiendo del contexto en que
estés.
Yo lo pude dejar separado y entre comillas se conecta,
se ejecutaba concurrentemente.
En esta versión no, pero en la de en la del Talent Enterprise
si puedes configurar cuántos siglos de ejecución quieres.
Con el segundo vamos a hacer exactamente lo mismo.
Entonces, uso una conexión existente.
Y ahora el bokeh, cópialo de acá arriba.
El bokeh es tu nombre, el no le poco tu nombre.
Y subamos un archivo interesante aquí.
Lo vamos a llamar el de team nba.csv.
Team nba.csv.
Este es el que colocas acá en el key,
sería el nombre del archivo.
Y en el file string, pues, hace lo siguiente.
Mapeas el archivo team.
Solamente por repasar a lo siguiente.
Agrégale aquí un team.
Esas vos que fue el primer componente que hicimos.
Conecta el último elemento.
Le das un componen OK.
Y colocas el mensaje, archivos subidos exitosamente.
No, hagamos esos dos.
Inicialmente vamos a trabajar con esos dos.
Y demoramos tiempo con esos dos.
Demoramos tiempo con esos dos ahí.
Porque con esos dos se pueden hacer muchas cosas.
Bueno, voy entrando aquí a mi cuenta del señor AWS.
Voy a buscar los buckets.
OK, listo.
Aquí tengo buckets.
Bueno, vamos a proceder entonces a ejecutar.
Y esperamos que no tengamos ningún problema.
Voy aquí a guardar.
Y voy a ejecutar aquí.
Esto exactamente lo voy a hacer con el target data integration.
No hay ningún problema.
Aquí todavía no he metido nada de build data, claro.
Está demorando un poco por la ejecución.
Por tanta cosa que monté ahí.
Esto demora nada más en la creación.
Cuando recordarás que esto te genera un punto Java.
Y al final de ese punto Java, tú lo exportas y lo ejecutas
después.
Entonces, aquí es porque está creando el archivo.
Le hizo conectado.
Se conecta.
Aquí me salió un error.
Fue de la máquina virtual.
No fue de los componentes.
Este error le salió a algunos de ustedes.
Y me hice un problema de memoria.
Dígame.
Bueno, intentemos nuevamente.
Aquí me toca cerrar y abrir.
Pero antes de que cierre, por favor, hagamos algo.
Vamos a ver si corregimos este problema.
A los que salió el problema.
A los que no, no hay problema.
No hagan nada.
Pues vamos aquí.
Váyase a su equipo de computo.
Váyase a Program Files.
2bd.
2bd.
Y busco un archivo que se llama 2bd win x86 pero .ini.
Creo que es el último que te va a mostrar.
Entonces.
Miércoles.
A un momento de Jimena.
A.
Se pasó.
Tendrá que Jimena.
A entonces a los que ya tiene por ahí doctor aquí esperemos a
que me hagas cuenta pero los que están en esta ventana por
favor.
Como lo siguiente.
Cambie esta configuración.
Vamos arriesgando entonces.
2048.
Este señor lo cambia a 4096.
Fue diciendo que ocupe mínimo 2 gigas.
Máximo 4.
Eso fue lo que hice ahí.
Vamos a ver si de pronto nos funciona mejor.
Porque entrometa en 512 mínimo.
Lo guardamos.
¿El qué?
Me confundí.
Muestra para ver.
¿Quién me habló?
Bruno, voy para allá.
Para que me muestre porque me perdí.
No, no, no, no.
No, no, no, no.
Bruno, no te veo.
Ah, ya perdón.
No, eso no.
No, no.
Malito.
La de guardar, por favor.
Sí.
Bueno, acá, antes antes que siga, acá lo que veo son la
carpeta Carla que subió citosamente, Oblea subió y Rafael subió los dos archivos.
Pero cuando se terminó de ejecutarse se cerró.
Así es la historia.
¿Está bien?
Es error.
Bueno, por la experiencia la herramienta no lo es.
O sea, porque yo he trabajado.
Aquí.
Sí.
Bueno, aquí lo que hay que hacer es lo siguiente.
¿Por qué se desconfiguró?
Hay que corregirlo de esta forma.
Váyase aquí a C.
A lo que salió este error.
Váyase a C.
Program Files.
Java.
JDK.
BIM.
Acceda acá a la agarra de reacciones.
Y va a copiar esta ruta.
Control C.
Llega hasta el BIM. Va a llegar hasta el BIM.
Hasta el BIM va a llegar.
Control C.
Entonces ahora.
Va nuevamente al archivo de configuración.
Del talent.
Que estaba en C.
Program Files.
TOSBD.
TOSBD.
El archivo este que estaba aquí.
Das enter aquí y agregas
siguiente. Menos BM.
Enter.
Agregas la ruta.
Slash.
Java W.
Punto X.
Te das guardar.
Y vuelves a ejecutar nuevamente.
En el caso mío a mí me salió fue un error.
Hay un enter.
Hay un enter. Hay un enter.
Hay un enter. Buena pregunta. Hay un enter ahí.
Vamos entonces aquí.
Vamos a ejecutar.
Y ahí cual es.
Ah.
Ah.
Ah.
Ah.
Ah.
Un momento por favor.
Voy a dejarle la configuración.
Si fue que coloqué mucho. No sé si.
Aquí tenía
512, ¿verdad?
No creo que sea eso.
Y 1496 y mi cartón no me falla.
Un momento por favor.
Safe.
Si. Error de memoria.
Si a mi es el error de memoria.
Si. Claro que este es un problema de la más que dentro.
No es. No es la herramienta. La herramienta no es.
No. No es la herramienta.
Es la más. Es decir.
Ese problema de memoria es
un problema de procesos. De que
la aplicación le pidió memoria
al sistema operativo.
Y esa memoria como estoy en un clúster no sé si hubo un error ahí.
Al parecer fue
cuando le cambié las variables
no sé por qué salió
ese error.
Díjale las
vamos. Vamos a intentar. Permítame antes
antes antes antes
vamos a cambiarle a un giga
no pongamos 4. Vamos a ponerla aquí
espérate yo pruebo primero. Un giga
1024 hasta
2 giga 248
Alguien me comentó de que la
presión de ventana era negra. No sé. ¿Todavía sale?
O ya se conectó la máquina.
Y ya.
Ah.
Este porque tenía tantos.
Confirme. Espera un momento.
Confírmeme algo. No sé si es
MGR aquí.
Pena que pene aquí.
No. Configure la que coloqué yo.
No sé. No hubo ningún problema.
1024
inicial y 248
como máximo. O sea 2 gigas
como máximo.
A ver si nos mejora y evitamos
problemas de memoria. 1024 y
248.
Y después ejecuta para ver.
1024 mínimo
y 248
máximo.
No funcionó ahora vamos para ver.
Aquí no le funcionó.
A ver si me sube a mí porque me subió.
Vamos a ver. Un momento. Espera un momento. Deja comprobar
si.
Aquí no le funcionó. Me dijo
Luis.
O Luis ven acá
yo mira lo que yo veo.
Voy a conectarme a esta máquina. Yo no veo esto aquí en el avión blanco.
Ahora sí.
Ah.
Bien.
Cierra ahí.
Dale a ejecutar.
Ah. Espera un momento.
Espera un momento.
Espera un momento.
Deja hacer de modo interactivo
tu máquina para comprobar.
Vamos a ver de modo interactivo.
Voy aquí un momento a cerrar
tu CMD.
CMHR.
Aquí tienes montado este docker.
Este docker lo voy a bajar.
Porque este docker se está ocupando
450 medias que me pueden servir.
Voy a bajar este señor aquí.
No va a dejar ese condenado.
A ver si bajo este docker acá.
Tú tienes 93% de memoria ocupada.
En que tienes ocupada esa memoria.
Ah. Hazme un favor Luis.
Reíche tu máquina pero no subas el docker.
Sí.
A los demás si le subió.
A los demás si le subió.
Vamos a ver. Bueno acá está subiendo.
A los demás le subió.
Sí, sí le hizo bien.
A quién fue, bueno, pero quién faltaría acá
por subir.
Ok.
Ok. Esperemos ahora que reenciemos entonces.
Voy a volver a ejecutar
el job para ver si me sale error.
Intenten ustedes volverlo a ejecutar.
Creo que va a sobre escribir el archivo. No hay problema.
A los que ya le subió intenten ejecutar el job
para ver si le cierra nuevamente el te...
el
big data.
¿Te sale qué?

on 2024-02-27

language: ES

                  WEBVTT
esos 12 gigas no están ahí en esa máquina porque es que si tú sumas hay un tida 12
hacia la huya de los cocos. Voy a intentar lo siguiente ahora.
Voy a intentar lo siguiente. Esta máquina que está acá.

on 2024-02-27

language: ES

                  WEBVTT
En teoría lo que me está diciendo esto es, señor que está aquí es lo siguiente.
Voy un momentico aquí atortoso aquí y me está diciendo de que esto es mucho para el
sistema operativo.
Decir que esto no lo puede colocar.
No hay espacio suficiente para ocupar los 2 GB.
Voy a bajarle aquí nuevamente a 512 a 1024.
Esto no haría lenta la aplicación.
Aquí estoy probando con violencia.
Un momento, un momento.
A ver aquí.
Deja confirmar algo aquí.
Es decir, técnicamente lo que pasa es que cuando las herramientas las ejecuto, la memoria
que tengo es insuficiente.
Aclaro que el problema que también se nos deriva es que tenemos mucho más cosas montadas
comparadas con los cursos anteriores.
En un momento.
Y todavía no he montado el Docker ese, porque el Docker ese te ocupa, no, yo lo confío

on 2024-02-27

Visit the Talend Big Data Integration course recordings page

United Arab Emirates - Talend Big Data Integration

4 videos

Talend Big Data Integration | Videos

Talend Big Data Integration