Getting started with Apache Superset


language: FR

                  WEBVTT
Tout ce qui va se passer, vous allez avoir votre navigateur local qui va s'ouvrir dans votre navigateur.
Donc les cinq ou six premières fois où on essaye de changer de navigateur, souvent on se trompe.
Parce qu'on prend son navigateur à soi et pas son navigateur...
C'est-à-dire, là en fait, on va ouvrir Firefox sur la VM.
Exactement.
D'accord.
Ah c'est bon, je vous vois Alison. Super.
Ah bah j'y suis plus, pour ça je comprends.
Ah.
Donc en fait, on peut être connecté avec Chrome sur la VM et ouvrir dans la VM Firefox par exemple.
Oui, oui.
Et là on exécute les commandes CD Super 7, les questions indiquées, d'accord.
Là concrètement, vous voyez ce qu'on tape sur nos écrans virtuels là.
Je peux le voir.
D'accord.
Oui, je vois vos écrans de loin et je peux regarder de près si je veux.
D'accord, ok.
Non mais c'est pour savoir si jamais on est bloqué à un moment donné.
Ouais, c'est aussi le principe, c'est que je puisse vous débloquer.
Moi du coup, là je ne sais pas du tout ce qu'il faut que je fasse en fait.
Là je vois que la VM est ouverte.
Je ne vois pas l'activité dessus.
Est-ce que... Là vous êtes où dans la desktop ?
Bah je me suis connectée.
Ok. Et est-ce que vous avez une petite VM avec un bouton play dessus, quelque part ?
Non.
D'accord.
Teki et Sylvain, vous avez fait comment ? Parce que moi je n'ai pas vu la partie LM à chaque fois.
Moi j'avais le bureau virtuel, j'ai cliqué sur Terminal.
D'accord.
Et là j'ai exécuté les commandes au point 3 en fait.
Mais pour arriver sur le bureau virtuel ?
Comment j'ai fait pour arriver sur le bureau virtuel ?
Bah je me suis connecté et après je me suis connecté avec mon identifiant Google.
Et après quand je m'étais connecté, j'avais l'écran décomposant deux parties.
Donc avec ta machine, Romain, je vous permets de tutoyer.
Ouais, on peut tutoyer si ça vous va.
Voilà. Et l'autre partie, il y avait l'écran, mon espace apparemment.
D'accord.
Et avant ça, il y avait un bouton vert sur lequel tu peux arriver justement à ce double écran
qui nous permet de rentrer sur le bouton vert pour passer sur le double écran.
Est-ce qu'on peut faire un partage d'écran, Alisson ?
Oui.
Alors j'arrête le partage.
Ça vous va le tutoiement général ?
Oui, oui, oui, bien.
Alors...
C'est normal par contre que les commandes soient longues à exécuter ?
Alors c'est juste Docker qui doit être long parce qu'il construit tout.
Ouais, Docker il est long, enfin moi ça fait quelques minutes là que ça...
Ouais, ça fait trois, quatre minutes.
Ouais, alors c'est long parce que je voulais potentiellement vous montrer
l'utilisation des templates de Ginger qui nécessite d'avoir cette version-là.
Mais pour ce qu'on fait sinon, il y a une autre commande qui est aussi possible.
Alors on va juste regarder...
Mince.
J'ai un faux contact, ça ne va pas bouger.
Alors, du coup, Alisson peut-être dans Training Room ?
Voilà.
Ok, mais ce n'est pas très grave.
Donc là à gauche ça va être mon écran virtuel et à droite c'est ton écran.
Et du coup, tu peux mettre le tien en grand et puis regarder le mien quand tu as besoin
ou si tu as besoin ou si je vous avais montré.
Sinon c'est...
Voilà.
Et là, bah terminale et puis...
Juste de commencer, deux seules lignes de code qu'on aura à taper.
Je crois qu'il a dit qu'il ne supportait pas ta version de...
que tu n'es pas pro ou un truc traditionnel.
Je ne sais pas.
Je crois que tu...
Paris, Alisson, je les ai tapés.
Les deux premières lignes, oui, j'ai tapé, oui.
Il va pas, il faut que je respecte les espaces et tout.
Oui, oui.
Taiki, toi, tu es aussi au point où la commande s'exécute ?
Oui, je suis à la SuperSense tirée node.
La première fois, j'ai eu un code d'erreur, ça s'est arrêté.
Là, j'ai relancé la seconde ligne de commande.
Donc, on s'est avancé.
Oui, c'est ça, c'est sur l'exécution de la commande au point 3 du coup.
Pourquoi il y a eu une erreur ?
Je ne sais pas, ça s'est bloqué à un moment donné, c'était erreur
et puis il restait bloqué sur le 6 slash 10.
Et après, il m'a sorti de la commande, je relance et là, je suis un peu plus loin.
D'accord.
Ça continue.
Ok, normalement, exactement la même chose.
Voilà, pour ma part, c'est fini.
Comme on a la même machine, je pense que ça devrait être fini bientôt pour vous aussi.
Moi, c'est terminé à priori.
Ok, et bien, tu peux te rendre à un navigateur sur localhost.8088.
Et puis normalement, on n'ouvre plus un terminal pendant deux jours.
C'est-à-dire qu'il vaudra mieux laisser la machine allumée cette nuit, non ?
Pour pas rouvrir le terminal ?
Vaut mieux laisser la machine virtuelle ouverte cette nuit ?
Je crois qu'elle s'éteint, mais c'est juste la première fois
qu'il va prendre le temps de construire l'ensemble des composants.
Mais après, pour la redémarrer, ça va vite.
C'est juste la première fois.
Parce que là, il faut qu'il construise tout.
Il y a une partie qui est ce qu'on appelle les feature flags,
qui est dans la configuration de Python et qui n'est pas accessible dans la version...
Si on prend la version déjà taguée officielle, ça prend 10 secondes à se lancer.
Donc voilà, je vois que Sylvain est arrivé sur Super7.
Ça continue de mon côté.
Oui.
Et pour...
Du coup, comme c'est une formation à distance,
quand je suis dans une salle, je peux sentir quand c'est le moment de faire une pause, ce genre de choses.
Autant c'est plus difficile à distance.
Donc n'hésitez pas, surtout, si jamais...
Je proposerai, je serais à te proposer au moins une fois par période de faire une pause au milieu.
Mais si jamais vous sentez que là, il faut un café ou il faut une pause ou...
Il faudrait une pause à midi surtout.
Oui, mais c'est ça.
Mais si vous voulez, au milieu c'est bien parce que sinon,
tout devant l'ordinateur, c'est presque pire.
Voilà, je disais à Alisson même à couter, pff, c'est parti.
54,31, t'es qui ?
54,31, oui.
Et donc pour Alisson, c'est presque fini aussi.
Alors connexion à la base de données post-grès, on le fait tout de suite ça ?
Oui, vous pouvez, il n'y en aura qu'une seule.
Vous voyez, le principe c'est un près, la même chose à chaque fois.
Donc pour ça, c'est...
J'ai juste à attendre qu'Alisson ouvre un navigateur pour y aller,
comme ça je pourrais vous expliquer tous les deux en même temps.
Donc maintenant Alisson, allez sur Firefox à l'intérieur de l'AVM,
et puis allez sur localhost 2.8088.
Tu peux enlever le S de HTTPS, juste localhost.
Je pense que c'est ça qui perturbe.
Et donc là c'est admin admin, et vous êtes absolument seul sur votre machine.
Donc là je vais à la fois suivre le CAD,
et puis passer sur les différents contenus qu'il y a dans l'interface sur le desktop.
Vous pouvez suivre l'un et l'autre.
Donc tout d'abord, ça c'est l'interface principale de Super7.
Là vous allez avoir la barre supérieure.
Donc c'est là où on va voir toutes les actions un peu globales,
et c'est une barre qui vous suit partout dans Super7.
C'est le seul truc qui ne bouge pas.
Donc là vous avez, on arrive directement sur les tableaux de bord.
Donc là vous avez les tableaux de bord d'exemples qui seront montés à partir de données d'exemples qui viennent avec Super7,
et c'est les fameux tableaux de bord, dashboard,
qui vont illustrer tout ce qu'on peut faire dans Super7.
C'est alors une interface pour les graphiques.
Donc les graphiques, c'est les éléments que vous faites à partir des différents jeux de données.
Voilà, que vous pouvez arranger dans les dashboards.
Vous avez malheureusement pas, alors peut-être qu'on m'a pas mal demandé,
il n'y a pas de système de dossier ou ce genre de choses.
On peut taguer et il y a beaucoup d'éléments de recherche.
Mais il n'y a malheureusement pas de choses beaucoup plus suffisibles que ça.
Souvent on n'a intéressé que par ses dashboards à soi,
on peut toujours s'arranger, c'est en général pas forcément un problème,
mais pour les très grosses organisations ça peut l'être.
Ensuite on a la partie data set, où là ça va être les jeux de données qu'on a.
Un petit peu en avance, on va avoir deux types de data set, les physiques et les virtuels.
Vous avez les virtuels en bleu clair et les physiques en noir.
Et on va arriver très vite sur ce que ça signifie complètement.
Et là, l'interface SQL.
Ici on va pouvoir faire des requêtes sur nos différentes tables,
si on en a envie, mais on va pouvoir éviter si on en a tant.
Ici on va avoir tout ce qui est la gestion de nos données.
Donc là par exemple, pour ajouter une base de données on va aller là.
Et ensuite les settings, là on va avoir tout ce qui concerne les utilisateurs,
les différents rôles avec les permissions associées.
Le Action Log, qui va être ni plus ni moins que le log de tout ce que font tous les utilisateurs sur SuperSec,
qui lui aussi est sujet à la permission.
On va voir telle personne, on va consulter tel truc, telle personne a modifié tel truc.
La partie la fameuse sécurité au niveau de la ligne, pour cacher le salaire de la directrice.
Les connexions en base de données qui ont déjà été faites.
Et puis ensuite tout ce qui est un peu plus dehors de la customisation,
à savoir les templates CSS qu'on veut utiliser, les alertes et les rapports qu'on veut configurer,
et les couches d'annotation qu'on veut aussi faire figurer sur certains de nos graphiques.
Donc là pour ajouter la base de données, on va simplement aller sur Data et Connect Database.
Alors Data, c'est le petit plus.
Et là c'est une post-graph.
Voilà, c'est une base post-graph.
Il y a un raccourci pour basculer dans le bureau virtuel de la vue ou du partage de la vue,
où on voit que notre écran, parce que ça que moi je mets côte à côte les deux, mais c'est vrai que c'est assez petit finalement,
on a du mal à voir ce qu'on tape, je ne sais pas comment vous faites.
Moi je fais échappe à chaque fois et puis ça me remet sur...
En fait moi je suis sur deux écrans dont un grand écran, et en fait je peux voir de loin où vous en êtes,
juste en regardant les quatre écrans.
Mais si toi t'es sur un seul écran ?
En fait non, j'en ai plusieurs, mais pour le bureau virtuel il est sur deux.
Du coup comme j'ai ouvert un onglet dans l'applicateur, c'est pour mettre sur les deux écrans.
Je ne sais pas comment on peut faire.
Moi j'ai sorti ma fenêtre, j'ai agrandi pour...
Ah mais du coup tu as fait ta fenêtre sur deux écrans.
Ouais c'est ça.
Donc voilà, là j'ai tous mes pays,
avec à chaque fois le nombre de transactions.
J'ai plein d'options, telles que je peux avoir envie de faire.
Je peux mettre des sites sur mes axes, je peux mettre des légendes ou pas.
Je peux interagir, donc là c'est la lierie E-Charts, telle que je parlais tout à l'heure.
On peut à chaque fois cliquer sur une légende pour faire disparaître de ma sélection.
Et je peux avoir aussi envie de me concentrer sur certains pays plutôt que d'autres.
Imaginons que je suis en Europe, ce qui m'intéresse c'est l'Europe.
Voilà, je peux ajouter un filtre sur les pays.
Et on veut que ce soit un pays, la France, l'Allemagne ou le Royaume-Uni.
Et j'ai plus que mes trois pays.
Après je peux le sauvegarder et je vais même ajouter directement un dashboard si j'ai envie.
Alors j'ai une question par rapport à ça au filtre.
J'avais testé ça sur un graphique, alors j'ai pas vu clairement comment tu tapais.
Par exemple, je tape country in France, je commence à taper, donc j'ai de l'autocompensation, une suggestion qui se fait.
Je clique dessus mais il y a ce que j'ai tapé qui reste.
Alors c'est question parce que quand je tape autre chose, il faut que je supprime ce que j'ai tapé avant.
Si, je comprends mais c'est pas quelque chose que j'ai chez moi.
Tu vois par exemple, je sais pas si...
Alors, je vais arrêter l'écran, deux secondes, je vais mettre dessus.
Voilà, vas-y.
Par exemple, là je tape Germany.
Déjà je sais pas pourquoi je le tape.
Bah si il est là.
Tu vois, je l'ai et je sais pas si tu vois.
Si, si, je vois très bien.
Mais de mon côté, j'ai pas ça.
Pourtant, alors là, pour le coup, c'est sur une VM donc...
Ouais, et puis j'avais eu le même problème qu'on a testé sur notre instance chez nous.
L'instance qui est utilisée en place.
Ouais, tu vois, c'est le référent qui reste.
Ah si, bah ouais, je vais pas faire de fond parce que j'ai cliqué directement.
Bah je t'avoue que je l'ai pas sur le...
Je sais pas si c'est une astuce...
Bon après c'est un petit détail économique mais...
Ah ouais, non mais je sais pas du tout.
Moi je l'ai pas sur...
Après c'est de les sélectionner directement dans la liste déroulante et après...
Enfin du coup, on a un peu...
Ouais, mais par contre, tu vois là, moi j'ai sélectionné les trois.
Mais si je me mets à droite, je peux pas voir les autres dans la liste déroulante.
Ça fait un peu bizarre.
D'accord.
Est-ce que toi tu cliques là-dessus ?
Ah bah merde, là du coup là ça a tout effacé.
Bon.
Ah non, ça c'est compris.
Ah non mais j'ai pas accès à la liste déroulante.
Alors, tu fais IN.
Ouais.
Je suis très IN et là j'ai pas accès à la liste déroulante.
Je sais pas si tu vois mon écran.
Mais c'est vrai que c'est un peu...
De fait, c'est un peu casse-pied.
Mais alors peut-être qu'il y a un raccourci ou quelque chose.
Parce que là j'ai bien une liste déroulante.
J'ai plus de liste déroulante.
Et même là, je tape FRA.
Il me propose FRA.
Il me propose pas les valeurs en fait.
C'est vraiment étrange.
Peut-être qu'il faut que je recommence.
C'est peut-être un petit bug.
Si je fais country IN.
J'ai pas la liste moi.
C'est étrange.
Parce que si je tape FRA, il me propose FRA.
Ça par contre, moi je l'ai.
À la liste.
Peut-être ça.
Je vais recommencer.
Mais de fait, c'est que c'est un peu...
Toi tu sélectionnes.
Ça t'as pas le souci Taiki ?
Non, bah moi j'ai bien la liste.
Moi j'ai bien la liste déroulante aussi.
Ouais ?
Ouais.
Il me demande de taper une valeur.
Est-ce qu'il y a un truc qui a merdé quelque part ?
Ou est-ce que je suis pas sur le bon ?
C'est country, count, time stamp, public, traduction de fou, save.
Quand tu tapes sur la barre de recherche,
il te propose pas par défaut.
Il défile pas la liste.
Non, tu vois, il met tipo value here.
Si par exemple je mets francs,
et ben ça me met francs.
En plus ça me garde encore celui d'après.
Du coup je fais save.
Peut-être charte.
Bah forcément,
voilà, j'ai plus rien.
C'est un peu embêtant ça.
Et j'avais le même problème.
Je sais pas quoi c'est du.
Peut-être qu'il y a un truc que j'ai zappé quelque part.
Essaye de recréer le graphique.
Bah non, dataset.
Donc là je suis pris ma limite.
Laisse-le, si tu le laisses, il va pas se mettre à jour.
Clique sur dataset en haut.
Clique sur transaction full.
Ouais.
Voilà, et là on recommence.
On fait sur line chart.
Ouais, donc là on avait mis time stamp.
Donc là ça fonctionne bien.
Save.
Metric.
Metric, tu mets de compte.
Voilà, l'auto-compression fonctionne bien là jusqu'à présent.
Voilà.
Ensuite, dimension.
Ah, j'ai pas mis dimension encore.
Bah si, c'est ça ?
Ah bah voilà, là ça charge.
Pourquoi ça fonctionnait pas tout à l'heure ?
Donc on a dit France, Tamiko, Yuka et Germany.
Et bah là ça fonctionne, ouais.
Contribution mode.
Bon, je sais pas pourquoi.
Un truc qu'il a pas aimé, mais en tout cas tout à l'heure ça fonctionnait pas.
Bah non, bah là j'en ai qu'un là.
Pourquoi ?
Ah bah attends, j'ai fait...
T'as pas mis dimension pour le pays ?
Oui, c'est autant pour moi.
Autant pour moi...
Ouais, je sais pas pourquoi j'avais ce souci là tout à l'heure.
Ça peut être des fois, je sais pas quand t'avais fait le changement de nom.
Si t'avais pas déjà ouvert ce panel avant, moi je sais pas.
Ouais, y'a eu un truc bizarre.
Bon, désolé.
Voilà, donc là, vous voyez le principe de création d'un graphique.
Et puis ensuite, on est libre d'aller plus loin.
Nombre de tendations pays.
On va juste le sauvegarder.
Et puis ensuite, on peut créer un dashboard.
Transaction de test.
Et là on peut directement y ajouter notre graphique.
On le sauvegarde.
Oui, d'accord.
Ça a plus payé d'appliquer sur draft.
Ouais, ça a beaucoup plus...
Voilà.
Et donc là, on a notre tableau de bord avec un graph.
Donc pour créer un tableau de bord, on va dans le dashboard.
On fait plus dashboard.
Là, on peut déjà faire un glisser déposé, donc le fameux drag and drop.
Et puis là, on sauvegarde et on est bon.
Bon après, c'est assez simple d'éditer.
On peut rajouter les dashboards.
On peut jouer avec le layout.
C'est un système de grid qui permet facilement de s'y retrouver entre ces différents graphiques,
de faire des choses plus grandes, plus petites, de mettre des graphiques.
De mettre des graphiques côte à côte.
Comment tu l'as étendu ton graphique ?
Rien.
J'ai fait édite dashboard.
Et ensuite, quand tu vas sur les côtés, tu vas avoir des petits clips qui vont apparaître.
Voilà. Donc là, on a laissé un peu la partie SQL de côté.
Mais vous avez une bonne vue d'ensemble de l'ensemble de l'interface de Super7.
À chaque fois, vous allez avoir ces trois petits points-là.
Que ce soit quand vous êtes sur un dataset, quand vous êtes sur un chart, quand vous êtes sur un dashboard,
vous allez pouvoir avoir ces trois petits points qui vous permettent de faire certaines choses.
Donc ça peut être édité directement.
Voilà.
Là, vous pouvez faire des choses un peu différentes.
Vous pouvez changer de site. Vous pouvez mettre une granularité.
Vous pouvez changer les métriques.
Si la métrique ne nous plait pas, quand tu étoiles, ça ne me plait pas trop.
Ok, je vais dans les métriques.
J'ajoute une métrique.
Nom de transaction.
Voilà.
Je vais dans Joli.
Et puis, c'est la même.
Voilà, on s'en fiche à la rigueur.
Hop, voilà.
Là, j'ai mis à jour. Donc maintenant, la métrique est là.
Voilà.
Donc à chaque fois, au préalable, on doit construire notre métrique dans le chart.
Et on ne peut pas la créer directement dans notre construction du chart.
Alors, la métrique, elle est rattachée au data set.
Pas à la source.
Et ensuite, non, on n'est pas obligé de le faire.
C'est souvent bien parce que, visuellement, on aime bien pouvoir mettre des profs, des labels.
On préfère avoir Nom de transaction plutôt que Kernstar.
Mais on peut aussi, si vous avez vu dans la métrique, vous avez les métriques saved.
Donc celles qu'on vient d'ajouter.
On a déjà mis celles qu'on avait, donc on n'a plus.
Là, on va avoir une métrique simple.
Donc ça, ça va être des agrégats par colonne.
Oui.
Donc là, si je veux, le nombre distinct de merchant category par colonne, je peux l'avoir aussi.
Ça va pas être beau, mais je peux l'avoir.
Allez.
D'accord.
Allez, pour me distinguer, je vais pas être gentil.
Mais voilà.
Voilà.
Là, donc après, quand je vais passer dessus, je vais avoir un tool type qui est pas forcément celui…
Enfin, le code distinct merchant category, j'ai peut-être envie que mon utilisateur y voie autre chose.
Donc voilà.
Mais je peux utiliser ça aussi.
Et sinon, j'ai la troisième option qui est d'aller utiliser du SQL directement.
Voilà.
Et là, ensuite, je vais avoir tous les différents éléments avec lesquels je vais pouvoir jouer.
Donc ça, je vais reprendre un peu les slides parce que du coup, c'est facile de couvrir tout d'un coup.
Je vais pas vous mailler.
Mais c'est là où tout ce qui va être un peu plus avec des fenêtres de temps différents, avec des fenêtres de temps différents,
est-ce que c'est pour que la légende soit plus belle, pour ce genre de choses ?
Ouais, là, c'est ça qui prend le nom de la colonne et pas le label de la colonne.
Mais si on est sur des affichages un peu différents…
Voilà.
Il va t'afficher le nombre de transactions.
D'accord.
Par exemple, ça…
Bah non, moi, je l'ai toujours pas.
Pourquoi j'ai les fonts ?
Attends, non, pardon.
Au temps pour moi.
Toi, t'es sur un affichage, quoi ? La table ?
Table.
C'est le tableau.
Le label, ok.
Ah, ok, ça marche.
Ok, je comprends.
C'est un peu bizarre comme nom, metrics, je trouve.
Enfin, ça fait…
Je n'ai pas trop compris le concept, mais…
La métrique, ça…
Les metrics, c'est une valeur numérique que tu vas vouloir afficher.
D'accord.
En gros, soit tu vas vouloir afficher une valeur brute,
par exemple, tu t'affiches une colonne, des salaires,
des rémunérations, des montants, ou ce soit.
Sinon, ça va être quelque chose qui va être quelque chose de travaillé,
quelque chose de…
Qui va être une formule à partir de différentes colonnes
ou peut-être d'éléments extérieurs
qui va agréger quelque chose de manière numérique.
La finalité, c'est toujours ça, c'est quelque chose de numérique.
C'est pour ça que ça s'appelle métrique.
C'est parce qu'à la fin, c'est quelque chose de numérique que tu vas afficher.
D'accord.
Par exemple, ça pourrait être le minimum ou le maximum ou…
Oui, donc tu les as qui sont proposés dans les métriques
et sinon tu peux le définir en…
Dans ton… Dans tes métriques.
Ça, par exemple, ici,
mettons que je n'ai pas envie d'avoir ça, j'ai envie d'avoir…
Le plus petit montant par pays.
Hop.
Voilà.
Oui, donc là, tu as mint, amout et c'est ça que tu peux renommer après…
Oui, après, libre à moi de renommer ça dans une métrique associée à mon data set ici.
Hop.
Ajouter les métriques, voilà.
En fait, le label, ça correspond au Ase quelque part en SQL.
Nommer tes trucs Ase quelque chose.
C'est plutôt le key métrique qui va correspondre au Ase.
Le label, ça va vraiment être quelque chose que tu vas afficher à la fin.
D'accord.
Mais tu vois, c'est le NB transaction qui va être plus…
Le Ase, d'accord.
Oui, d'accord.
Oui, il faut dissocier le résultat de la requête et l'affichage, d'accord.
Oui.
Voilà.
Taki, Alison, tout va bien ?
C'est bon.
Ok.
Également.
Ok, parfait.
Est-ce que vous voulez faire une petite pause ?
On est déjà un peu plus de la moitié de la matinée, si vous voulez ou pas.
Tu comptes faire une pause à midi vers quelle heure et combien de temps, à peu près ?
L'idée, normalement, c'est de l'ordre d'une heure.
On peut se mettre un peu plus, un peu moins, si vous préférez, pas de souci.
Ça, c'est bon pour moi, une heure si tu veux.
Oui, une heure, c'est bon.
Une heure, c'est suffisant, oui.
On peut prendre une petite pause maintenant ?
Une petite pause maintenant, oui, c'est pas mal.
Oui, une petite pause maintenant pour partir frais sur les slides après.
C'est pas grave, on rentre dans le dur.
On reprend à 50 dans 8 minutes, ça vous va ?
Oui, c'est bon.
Ça marche, à tout de suite.
C'est peut-être trop court, une minute.
Non, ça va un peu trop court.
9 minutes la prochaine fois.
Après, si vous voulez 5 minutes en plus, ça va pas de souci.
Oui, 5 minutes, vous voulez ?
Non, c'est bon pour moi.
Du coup, maintenant, l'expérience, c'est mieux de passer sur l'interface
un peu à la main pour se faire venir de ce que c'est,
avant que j'en parle.
Maintenant qu'on l'a vu, est-ce que c'est vraiment...
sur ces questions-là, on peut...
Désolé, je suis un petit peu en retard.
Oui, donc je disais...
Donc là, on a vu un peu l'interface rapidement
et l'ensemble du workflow superset,
c'est-à-dire, je connecte une base de données,
je crée une table, je sélectionne ma table,
je crée un graphique, j'ajuste ce que j'ai envie d'ajuster,
et puis ensuite, je mets mon graphique dans un rapport.
Donc là après, tout ce qui va suivre, ça va être...
quelle complexité je veux, qu'est-ce que je veux montrer,
quelle complexité pour mon graphique,
comment est-ce que j'arrange mon dashboard,
comment est-ce que je veux faire si je veux avoir plusieurs tables
dans le même graphique, comment faire...
C'est toutes ces choses-là, mais qui vont être que des extensions
de... comment est-ce que je vais partager ça,
est-ce que je vais envoyer un lien à quelqu'un
pour qu'il ait consulté le tableau de bord,
est-ce que je vais lui envoyer un rapport,
est-ce que je veux des alertes, oui.
Les E-Frames, ça fonctionne ou pas ?
Oui, on peut importer des tableaux de bord dans nos E-Frames.
D'accord, ok. Donc on peut imaginer une page web interne
où on a des E-Frames, des tableaux de bord, d'accord.
Et ça, ça va être... enfin on va voir après
tous les différents partages.
Oui, oui, après c'est... oui, oui, on peut faire un exemple là-dessus aussi.
Ça marche.
L'idée c'est quoi, c'est d'avoir une page interne avec juste le...
Non, mais je me dis, nous si par exemple on fait des articles
sur notre site web, et si par exemple on met des bases de données
en open data, qu'on fait une analyse de données,
derrière peut-être par exemple, M. Camembert qui a réussi
cette base de données, enfin voilà, enfin...
Ça peut potentiellement être ça ou faire de l'analyse de données,
avoir derrière des petites cartes, des choses qui sont...
Ok.
Voilà, ce serait ça. Enfin moi c'est l'usage que je vois.
M'entends.
Après ou par texte d'un lien pour la visualisation.
Enfin voilà, ça je me dis ça peut être important pour nous,
pour nos clients.
Là par exemple, typiquement sur le projet sur lequel je travaille,
on a un financeur on va dire, des clients importants aussi,
donc partager certaines données à eux mais pas à d'autres.
Enfin voilà, ça va pas être leur données lancées mais leur montrer des schémas
pour ça qu'ils ont des liens ou si on met tout ce qu'on veut.
Ouais, avoir des versions différentes pour chacun.
Ouais, voilà, il reste ça.
Ok.
Donc, l'interface, on a vu les principales zones de navigation,
on retrouve en haut tout ce qu'on a besoin et puis ensuite on descend petit à petit
dans les choses plus précises.
On va avoir tout ce qui est la mise en page, ça se fait au différents moments,
ça peut être quand on édite le chart, quand on édite le dashboard,
on a plein d'opportunités de modifier ce qu'on veut.
À savoir que quand vous faites un graphique, il y a une seule version de ce graphique
qui existe, donc si vous utilisez un graphique sur trois dashboards différents,
vous allez le modifier sur trois dashboards différents.
Voilà.
C'est l'idée de réutiliser les composants, donc si c'est pas les mêmes,
voilà, c'est quelque chose d'important à retenir.
Et à chaque fois d'ailleurs que vous faites des modifications sur un graphique
et que vous utilisez dans plusieurs dashboards, normalement vous avez une petite alerte,
puis attention, vous allez modifier partout.
Et pareil pour le data set, attention, vous avez plusieurs graphiques qui s'appuient dessus,
vous allez modifier, vous faites une modification qui potentiellement va impacter différents graphiques.
Je pense que c'est pour garder à l'esprit.
Donc voilà, les composants principaux pour la construction de graphes,
vous l'avez vu, on a une partie data, on va pouvoir mettre de manière assez fine
tout ce qu'on a envie d'observer.
Et on va avoir la partie, l'autre table, qui va être tout ce qui est la customisation,
où là on va pouvoir mettre le changement de code couleur,
le changement de comment les choses sont affichées, sont formatées,
et tout ça selon le type de graphique qu'on va avoir dans la main.
Du coup, il y a l'environnement SQL Lab qui aussi mérite qu'on ferme un peu de lui.
Je vais juste aller dessus.
Donc là, à chaque fois, ça va être toujours un peu la même chose.
Vous avez la base de données jusqu'au choix de data set.
A noter, enfin, au choix de la table, forcément, parce que vous pouvez faire des requêtes sur une table
sans forcément que ce soit un data set.
Le passage par le stade de data set, il est nécessaire seulement pour la création de graphique.
Vous pouvez très bien faire des requêtes sur une table sans créer de data set.
Donc là, imaginons que je veuille sélectionner les montants maximum.
Voilà, donc là, c'est un peu une variante de ce qu'on a vu tout à l'heure sur le graphique,
mais là, c'est une requête avec une agrégation par pays.
Donc là, j'ai le montant maximum dépensé par pays.
Donc là, je peux faire de l'exploration d'une manière assez intuitive.
Je peux faire des tri, je peux filtrer des résultats normalement.
Pourquoi il ne veut pas, là ?
C'est intéressant.
C'est intéressant, c'est inquiétant.
Parce que c'est une clé d'agrégation.
Ok, c'est une régression.
Donc ici, j'ai un champ pour filtrer les différents éléments qui m'intéressent.
C'est assez pratique aussi.
Je vais avoir à chaque fois aussi les historiques de mes requêtes avec les durées qu'elles ont prises pour être exécutées.
Et puis, potentiellement, si ça m'intéresse, une rapide vue des premières lignes de ma table.
Ce qui est intéressant avec les requêtes, c'est que je peux les sauvegarder.
Et quand je les sauvegarde, je crée ce qu'on appelle un dataset virtuel.
Un virtual dataset.
Un jeu de données virtuel.
Un dataset, c'est une vue quelque part.
Oui, exactement. C'est une vue, sauf qu'elle est gérée par Super 7.
Elle n'est pas gérée par la base de données qui est derrière.
C'est exactement ça.
Une vue ou un résultat de requête, en fait.
Oui, après, dans ma requête, toute requête SQL peut être transformée, à partir du moment où elle est valide, en dataset virtuel.
D'accord.
Donc là, il apparaît en bleu.
Là où celui qu'on a créé juste avant apparaît en noir.
Parce qu'il correspond au mapping d'un dataset vers une table.
Voilà. Et ça, par contre, autant les datasets physiques qui correspondent à une table physique, autant je ne peux en avoir qu'une seule.
Je peux avoir un seul dataset physique par table physique.
Je peux avoir une infinité de datasets virtuels.
Parce que déjà, on n'est pas limité à une seule table.
On peut avoir plusieurs tables.
Et ensuite, parce qu'on peut en créer autant qu'on veut pour des besoins aussi variés qu'on peut avoir.
Voilà pour les fonctionnalités.
J'ai plusieurs états de travail.
Donc, je peux à chaque fois m'intéresser à plusieurs choses en parallèle.
Ça, c'est des choses assez classiques que j'ai déjà trouvées dans des éditeurs de requête SQL.
Et puis, ensuite, les exports que je peux faire aussi assez simplement.
Voilà.
C'est une manière assez pratique d'explorer les jeux de données avant de les visualiser.
Si je reviens à la présentation.
Donc, j'ai pas mal de choses à faire.
Je peux mettre en forme aussi normalement.
Voilà.
En mode SQL joli.
Avec les bonnes conventions.
Voilà, j'ai de l'autocomplétion.
Je peux avoir l'historique.
J'ai de la coloration syntaxique.
J'ai différents volets qui me permettent de bien comprendre ce que je fais et où j'en suis.
Et ensuite, donc là, j'ai les éléments d'interface qui sont en haut avec les menus d'action.
Tout ce qui va être les filtres.
Donc, ça, ça va être plus sur la partie dashboard.
Alors.
Lors du pan métrage, est-ce qu'on a la possibilité de mettre plusieurs chartes sources ?
La partie public transaction full.
Est-ce qu'on peut en ajouter, enfin, peut-être deux, croiser deux bases de données de sources et puis après de pouvoir requêter une puis l'autre et ensuite de pouvoir croiser les éléments ?
Alors, on peut croiser différentes tables sans problème.
Par contre, on peut croiser des tables que si elles sont dans la même base de données.
D'accord.
Typiquement les jointures, je les vendrai après.
On peut les faire que si elles sont dans la même base de données.
Et ça, ça se gère en autrement ?
En autrement, est-ce que ça peut se gérer par l'outil, par d'autres outils que faire une requête SQL ?
Les jointures, pas vraiment.
Non.
Non.
Non, pour joindre deux tables, il n'y a pas, soit on fait en dehors de Super 7, soit on fait via Super 7 et dans ce cas là, ça se fera par SQL.
Ouais, il y a passé par le menu chartes ou data set, on va se faire ça.
D'accord.
Donc voilà pour cette partie là.
Connexion de vos sources de données.
Donc après l'avoir fait, on va l'expliquer.
Donc on a plein de bases de données disponibles.
Donc le partir du moment où ça parle au moins un petit peu SQL, on peut les connecter.
Vous allez retrouver tous les...
Là, j'ai mis que les grands classiques, mais qui couvrent une grande partie de ce que...
Si vous vous soulevez, chez Amazon, AWS ou Azure, normalement, il n'y a pas trop de questions à se poser sur la faisabilité, il n'y a pas de problème.
Vous êtes hébergé comment ? Gérez vous-même ou vous êtes chez un cloud provider en particulier ou plusieurs ?
Nous on n'est...
Enfin, c'est pas hébergé en loco, tu me corrigeras, t'as qu'ici...
Non, c'est ça, oui.
Nos bases de données sont hébergées chez FullSave.
À full save et à terme...
Et à terme, je vois.
On est en cours justement.
Et on utilise du postgreSQL.
Ouais.
Donc là, pour la connexion, on a déjà vu, on a déjà fait.
Pour connecter, on a déjà fait aussi.
Là, les écrans, c'est bien pour dans trois semaines quand vous aurez oublié la formation, vous pourrez revenir aux différents écrans et ça se passe et bien.
Quelque chose d'intéressant qui a été ajouté il n'y a pas si longtemps que ça.
Je pense que ça fait un peu plus d'un an et demi.
La chaîne superset, c'est pas si longtemps que ça.
Google Sheets en tant que base de données.
Donc ça, c'est comparable au postgreSQL ou du base de données SQL très bien.
Mais on peut avoir envie de faire un peu plus de choses.
On peut faire des choses comme ça.
On peut faire des choses comme ça.
Donc comparable au postgreSQL ou du base de données SQL très bien.
Mais on peut avoir envie juste de faire des tests ou d'afficher des choses avec des données qu'on a nous dans un fichier Excel par exemple.
Et en fait, là, on va avoir deux choses, deux alternatifs qui sont possibles pour pouvoir utiliser superset quand même.
Une, ça va être faire des uploads de fichiers CSV vers la base de données.
Donc ça, c'est une option qu'on va pouvoir autoriser.
C'est hyper pratique parce qu'après on peut utiliser nos données comme souvent quand on fait un sous-sous.
Je pense que le domaine pay, compta, finance, Excel, c'est un peu l'outil de facto.
Et c'est bien de pouvoir faire quelque chose aussi.
Et sinon, avec Google Sheets, on peut aussi connecter directement à superset.
Alors si c'est une feuille publique, ça se fait quasiment instantanément.
Si c'est quelque chose de privé, ça se fait aussi.
Il faut juste regarder un petit peu la configuration.
Mais du coup, je vous proposerai un exemple de chaque pour voir comment ça fonctionne.
C'est super intéressant pour pouvoir faire des choses variées.
Donc à chaque fois, quand on fonctionne comme ça, l'entelle de chaque colonne est considérée comme le nom de la colonne, tout simplement.
Et puis ensuite, chaque ligne, c'est une ligne qui va être entrée dans la base de données.
On utilise beaucoup les Google Sheets pour gérer les couches d'annotation.
Donc les couches d'annotation, ça va être des événements, soit mondiaux,
ou que l'on veut faire figurer parfois sur photographes, ou des événements d'entreprise.
Par exemple, on veut montrer l'évolution de la productivité ou machin.
Bah là, on va mettre la mesure de l'activité.
Et puis ensuite, on va vouloir mettre, OK, donc à cette date-là, il y a un petit trait qui dit mise en place du télétravail.
Et ensuite, ah bah mise en place de...
En fait, c'est des éléments qui vont avoir un rapport avec la réalité qu'on veut faire figurer, mais qui ne sont pas proprement parlés.
Ils ne sont pas partis des données qu'on va essayer de montrer sur le graph.
Donc c'est des données externes qu'on va pouvoir pluger sur nos différents petits graphiques.
Et ça, on l'a aussi dans la partie...
Tout à l'heure, on est passé dessus, c'est dans la partie data.
Vous avez la partie data et la partie customize dans le constructeur de graphique.
Et dans la partie data, vous avez la possibilité d'ajouter une ou plusieurs couches d'annotation.
Et ça, c'est super intéressant pour pouvoir rongler les graphes plus explicites.
Ensuite, plus en termes de modèle mental, ça, c'est un peu la slide qui résume tout.
Donc on a la base de données. Sans elle, il n'y a rien. C'est là où on va tout chercher.
Le dataset physique, qui va être une sorte d'avatar de la table physique dans Super7.
Là, on va pouvoir déjà faire des opérations sur les colonnes, des phénomènes métriques, ce genre de choses.
Le dataset virtuel, qui va être lié à une enquête SQL.
Comme le disait Sylvain, ça ressemble beaucoup à une vue, sauf que c'est dans Super7.
La question qui suit, c'est pourquoi on ne prend pas une vue tout simplement,
pour ne pas passer par Super7.
La réponse, elle est, généralement, on peut aussi utiliser les vues de sa base de données.
Mais il y a le templating, en utilisant Jinja, qui peut être utilisé.
Et là, avec le dataset virtuel, c'est le seul moyen de l'utiliser.
Le templating, c'est une partie qui a beaucoup intéressé nos amis belges en début de semaine.
Elle ne va peut-être pas vous intéresser autant, je passerai là-dessus quand même.
Mais l'idée, c'est d'avoir une boucle de rétroaction entre votre navigateur et votre système,
et vos requêtes dans la base de données.
Typiquement, ça va être, j'ai une équipe en Espagne, une équipe en Allemagne,
et j'ai envie, quand je leur envoie un dashboard, de mettre un petit paramètre dans l'URL,
pour que quand ce soit les Allemands qui cliquent sur leur dashboard,
ils aient directement les vues qui concernent l'Allemagne,
et quand c'est les Espagnols, ils aient une vue qui ne concerne que l'Espagne.
Donc avoir un peu les mêmes données, mais filtrées de manière un peu différente.
Ça peut aussi être avoir des vues qui soient adaptées par utilisateur.
Donc voilà, il y a plein de choses comme ça.
Il y a plein de choses comme ça.
L'idée, c'est vraiment de communiquer avec Super7 des éléments
pour qu'il puisse adapter ses requêtes SQL avant de faire le rendu de ses tableaux.
Je ne dis pas plus, je regarderai celui-ci, s'il faut.
Mais voilà.
Et ensuite, on a le graphique qui est relié à un dataset, dataset physique ou dataset virtuel.
Et ça, c'est ce qui va nous intéresser.
Donc là, on a déjà fait la gestion de dataset.
Donc encore une fois, on peut avoir qu'un seul dataset physique par table.
Ça fonctionne comme ça pour Super7, et vous ne pourrez pas en créer plus de toute façon.
Donc un dataset physique, et ensuite autant de dataset virtuel que vous voulez.
On a toute la partie de paramétrage.
On est passé dessus déjà.
Mais regardez pour les références.
Ensuite, on a ce qu'on appelle le dataset virtuel.
Le dataset virtuel, c'est basé sur une requête SQL.
On va pouvoir combiner plusieurs tables.
Et on va pouvoir faire des choses qu'on ne peut pas forcément faire de manière aussi simple dans le dataset physique.
Donc ce qui est bien, c'est que l'avantage essentiel, c'est qu'on peut avoir plusieurs tables ensemble dans un dataset virtuel.
Mais attention, il faut que ces tables soient toujours dans la même base de données.
Même si le partage est de la même chèvre.
Donc là, ça va être pour créer le dataset virtuel.
Il y a des petites bonnes pratiques à respecter.
Pas d'agrégation dedans, de préférence.
Et ensuite, se limiter à des jointures simples.
Pas des jointures qui vont être très lourdes.
Avec beaucoup d'entités d'un côté et de l'autre.
C'est-à-dire, justement, joindre deux alines en deux colonnes, ce genre de choses, ça va.
Par contre, si on veut faire des tables qui sont déséquilibrées, avec beaucoup plus d'éléments d'un côté que de l'autre,
ça va alourdir beaucoup les requêtes.
Et ça va être un petit peu trop difficile.
C'est tout à fait faisable, j'ai déjà fait.
Mais c'est pas recommandé.
Voilà, puis ensuite tout ce qui est renommé, mettre des labels différents, créer des regroupements à partir d'une colonne.
Vous avez des âges qui vont de 18 à 65 ans, vous avez envie de faire quatre colonnes.
Là, vous pouvez facilement, en SQL, faire des requêtes de ce type-là pour faire du braquetting.
Et puis ensuite, vous pouvez aussi créer des liens.
Si jamais vous avez des tableaux et que vous voulez afficher des références,
vous pouvez très bien créer des adresses, des URL, que vous affichez directement dans un tableau et qui seront cliquables après.
Par exemple, vous pouvez partager un tableau de bord avec différents liens.
Et là, vous faites un graph de type tableau et vous pouvez faire avoir du formatage HTML à l'intérieur de vos cases.
Voilà, donc ça, c'est typiquement ce genre de choses.
Vous basez, rajoutez des balises, quelques tags HTML pour pouvoir afficher ce que vous voulez avec le lien qui vous intéresse.
Voilà, c'est mon usage.
Ça, on en a parlé, je ne vais pas revenir dessus, mais pour référence, vous l'avez.
Donc là, on est sur l'écriture de requêtes, machin.
Ça, c'est plus du SQL en général.
C'est faire en sorte que les résultats de vos requêtes ne soient pas trop lourds.
Pour Apache et pour le confort de navigation.
Et là, par exemple, c'est du groupe-bag et du order-bag.
Oui.
Vous avez compris que du coup, il ne fallait pas l'utiliser.
Ça, c'est plus pour les requêtes en général, mais après, rien n'empêche de l'utiliser quand même.
Ce qu'il faut, ce n'est pas que ce soit trop lourd à chaque fois.
Mais en fait, c'est juste que là, ce n'est pas forcément intéressant d'utiliser parce que ce qui va se passer,
c'est que les virtual data sets, c'est un peu comme des sous-requêtes qui sont exécutées.
Et quand vous allez afficher, vous leur affichez un graphique, vous allez refaire une requête SQL encore une fois.
Quand je fais un tableau et que je veux agréger, afficher par jour et que je veux tel métrique,
à chaque fois, c'est une requête SQL qui retourne à l'extérieur.
L'idée, c'est de privilégier l'exécution des group-bites par les graphiques plutôt que par le virtual data set.
D'accord. Donc group-bites, order-bites par graphique.
Oui. Parce qu'à chaque fois, quand on est dans le graphique, on fait pour la plupart des cas, sauf pour les tableaux,
on va vouloir afficher des données agrégées.
Quand on a déjà des données agrégées en entrée, on va être obligé de faire,
si j'ai mon graph avec une valeur par pays, je vais être obligé de faire de la bidouille en disant,
affiche-moi le maximum par pays, puis en sachant que j'ai une valeur, j'aurai la valeur par pays.
Donc voilà, c'est là où c'est pour ça.
Du coup, là, je pense qu'on en sait assez pour commencer notre premier TP, qui sera plus intéressant, je pense.
Je vais de ce pas le mettre en ligne.
Est-ce que c'est clair jusqu'à présent ?
Oui.
Je pense qu'il faut voir avec l'exemple, on comprend que ça sera plus parlant.
Oui.
Voilà, j'ai mis le TP sur le drive que je vous ai partagé.
Donc l'idée, là, ça va être assez simple, on a déjà importé la table, on a déjà créé la data set.
L'idée, ça va être de jouer un peu avec les différents types de graphs,
et de voir comment ça fonctionne et comment on les organise sur un dashboard.
Donc c'est Super7 TP1. Est-ce que vous le voyez ?
Oui.
Du coup, là, forcément, si on crée le data set, on nous dit que c'est pas possible qu'il y en existe déjà pour cette table-là.
Oui, oui, ce que j'ai dit, c'est déjà fait.
Mais normalement, si vous essayez, il doit vous envoyer balader pour cette...
Exactement.
Oui, 200, il bloque, oui.
Par contre, en fait, ce data set, après, on peut le renommer ?
Oui, on peut le renommer.
Parce que, du coup, data set, à l'indicatif d'Edit, et là, on peut le renommer...
Parce que là, on a un data set qui existe déjà, qui s'appelle Transaction de Full.
Mais du coup, si je veux le renommer en Analyse Fraud, c'est pas possible, puisqu'en fait, le data set, c'est le nom de la table, finalement.
C'est un data set physique.
Oui, vous pouvez pas le renommer.
Donc, en fin de compte, il faut qu'on aille directement dans le chart, quelque part.
Oui.
En fait, moi, j'ai du mal à comprendre ce qu'on cherche à faire, déjà.
Alors, on cherche à faire un dashboard avec une analyse des différents KPI, une analyse temporelle, une analyse géographique, et puis, ensuite, créer des interactions dessus.
Parce que, clairement, il n'y a pas dans notre table. Parce que moi, j'ai besoin de comprendre sur quoi je travaille.
Alors, c'est...
C'est les données qu'il y a dans la table et ce que c'est, en fait.
Oui, c'est les tables de transactions.
Des transactions par...
Par vrai, des transactions individuelles et sur lesquelles on va avoir des données.
Transactions type transactions carte bancaire, transactions...
Oui, c'est ça. Transactions, en vrai.
Si je vais voir directement...
Voilà. Donc, ici, je vais avoir à chaque fois un identifiant de transaction, un identifiant de client, un numéro de carte, un timestamp.
Et puis ensuite, des types de commerce, des types de monnaies, des pays où ça a lieu, la taille de ville où ça a eu lieu, le type de carte.
Enfin, voilà, plein de...
OK.
Plein de choses comme ça.
Et du coup, c'est créé en vue de faire de la fraude.
Et donc, on va trouver ce fameux petit flag ici, is-fraude, qui veut dire si oui ou non une transaction est considérée comme frauduleuse.
Là, tu te formes même tant que nous pour qu'on voit un peu...
Oui, oui, je me forme même tant que vous. Après, vous êtes libre d'avancer à votre rythme et de ne surtout m'interrompre si jamais...
Voilà, déjà, je trouve que c'est... Alors, la configuration des colonnes.
Par exemple, là, la colonne Amount type Métrique, donc c'est effectivement...
Comment tu peux... Parce que moi, là, je suis dans colonnes dans Chart. Quand je passe effectivement le curseur, je vois bien le type de données dont il s'agit.
Si c'est un booléen, si c'est un temporel, si c'est une chaîne de caractère.
Mais par exemple, là, tu as mis groupe et bole, format $.2F.
Toutes ces choses-là, ce n'est pas des choses qu'on peut voir d'emblée.
C'est toi qui... C'est quand on regarde dans le contenu de la table ou c'est toi qui nous donne cette info-là, en fait ?
Oui, après, c'est en explorant aussi. L'idée, c'est de le voir à chaque fois.
Mais oui, on peut le faire. Mais du coup, ça, c'est pas... Après, ça, c'est des détails.
C'est vraiment pour... Déjà, pour vous être relativement... Pas autonome, mais vous comprenez un peu comment c'est l'environnement Super7.
L'idée, maintenant, c'est de voir un petit peu sur des choses plus précises, comment ça fonctionne.
Là, tu nous laisses aller... Je pose beaucoup de questions, mais tout ce qui est question va être consommé assez vite.
Tu nous laisses aller jusqu'au bout ou on se fait un point...
Oui, on peut faire un point. Moi, je ne bouge pas. Je suis ici de toute façon.
Donc, ça peut être... Comme vous le savez, je peux vous laisser un petit peu regarder.
Et puis dans cinq minutes, on peut faire un point, dix minutes, comme vous voulez.
Donc là, pour les métriques, on est toujours dans l'onglet propriété de T7.
Pour les métriques, propriété du data set...
Quand ils parlent de différentes...
Ah, mais tu les configures là. D'accord, ok.
Moi, j'étais dans l'éditeur SQL et tout. Je ne comprenais pas pourquoi ça ne s'exécutait pas. D'accord.
C'est dans la partie éditeur SQL des métriques.
Mais moi, j'étais dans le recruteur SQL en général.
Oui, pas de soucis.
Est-ce qu'il vérifia à ce moment-là si t'as recaté correct ou...
Non, pas ici.
D'accord, ok.
Moi, j'ai du mal à comprendre ce que je dois faire, tout simplement.
D'accord. Alors, ce n'est pas de soucis.
Donc là, on est dans les métriques.
Donc on va aller directement dans notre data set, dans les propriétés, et on va éditer les métriques.
Et c'est là où on va dire quelle est donc la métrique qu'on veut.
Et ensuite, dans l'expression SQL, on va mettre la métrique telle qu'elle est définie ici.
Donc là, ce qu'on veut, le taux de fraude, c'est qu'on compte à chaque fois le nombre de flags qui sont à vrai.
Donc le fameux hisfraude égale 1.
Et ensuite, on divise par le nombre total de lignes.
Et du coup, c'est un peu déstabilisant parce que ça fait un peu une requête SQL incomplète.
Mais ce qu'il faut se dire, c'est que c'est à chaque fois exécuté dans le cadre d'un graphe.
Quand on fait un graphe.
Donc en fait, cette chose-là n'a de sens que quand on est sur un graphe.
Et à partir de là, c'est là on va pouvoir calculer selon les différentes sélections, selon le nombre de pays qu'on choisit, selon la période temporelle qu'on choisit.
Ce nombre de taux de fraude va évoluer de la même manière en fonction de ces paramètres-là.
Pareil pour le montant moyen de la fraude.
Là, on va filtrer le.
On va prendre la moyenne des montants où le drapeau fraude est mis après.
Et puis ensuite, on va calculer ça dans le contexte de notre graphe selon les autres paramètres qui auront été fixés.
Est-ce que c'est plus clair ou pas trop?
J'ai vraiment du mal à comprendre ce qu'on fait.
D'accord.
D'accord.
Là, on a un dataset avec plein de transactions.
Ce qu'on est en train de faire là, c'est préparer les métriques qui nous intéressent dans notre dataset.
Pour pouvoir ensuite les exploiter en créant des graphes et en organisant ces graphes dans un tableau de bord.
Là, ce qu'on fait, c'est qu'on est en train de définir les métriques qui nous intéressent, à savoir le taux de fraude et le montant moyen de la fraude.
Pour pouvoir les utiliser à l'étape suivante dans nos graphiques.
C'est ça que c'est? C'est flou?
Non, non, j'ai vraiment pas l'habitude de travailler sur ce genre de choses.
Moi, j'avais pas compris comment était formulée la consigne. Je comprends pas du tout ça.
D'accord.
Du coup, en fait, c'est juste la consigne, c'est ça?
Mais dans la page 3, configuration des colonnes, ça, je vois pas quoi ça sert.
C'est pour configurer notre dataset.
C'est déjà configuré comme il faut?
Pour certains, oui, c'est juste pour vérifier, soit configurer si c'est nécessaire.
Par exemple, le transaction hour, normalement, il n'est pas considéré comme temporel.
Mais comment on change du coup?
On clique sur la case « liste temporelle » dans les settings de notre dataset.
Parce que moi, je pensais que c'était juste informatif la configuration des colonnes.
Oui, c'est pas le plus, par défaut, normalement, il le fait bien et c'est pas…
Parce que là, tu vas, pour changer la configuration des colonnes, tu vas dans dataset.
Oui.
Datasette et colonnes.
Ok.
Non, qu'est-ce que j'ai fait?
Datasette, là j'ai colonnes et là j'ai une case « liste temporelle ».
Ah oui, d'accord.
Voilà.
Par exemple…
« liste temporelle », ok.
Et par exemple « amount is metric », c'est…
Parce que là, on a un type double précision, mais comment tu peux préciser que c'est…
« Petite métrique », c'est le format…
Non, en fait, c'est « amount », il va rester tel qu'il est.
Donc c'est double précision.
C'est pour après.
Oui.
Il y a « isFront », donc ça c'est bon, c'est un boléen.
Par contre, « merchant category », lui c'est un texte et…
En fait, le data type, on ne peut pas le changer.
Non, on ne peut pas le changer.
On peut juste changer… Ce qu'on peut juste dire, c'est si c'est temporel…
Oui.
On peut dire si on l'utilise comme filtre et si on l'utilise comme dimension.
D'accord.
Donc en fait, nous là concrètement, on a juste à changer « transaction aware » et dire que c'est un type temporel.
Oui, c'est ça.
Le reste, c'est pas à changer.
Non.
D'accord.
Que t'appelles format 2S, format 2 d'AntodiaPorama 4 ?
Oui.
Ou 5 ?
C'est 3, je pense.
C'est celui-là, 5.
Pardon.
Oui.
Point 2S, c'est quoi ? C'est…
C'est le nombre de chiffres après la virgule que tu mets.
D'accord.
Donc pareil, point 2 pourcentage, c'est le nombre de chiffres après la virgule.
C'est point 2 et ensuite, oui, pourcentage.
Point 1.
Mais là, par exemple, transaction totale, on peut…
Là, effectivement, j'ai le même résultat que toi, mais comment on peut changer la précision, là, par exemple, de format ?
Si on voulait mettre qu'un chiffre après…
Moi, j'aurais dans une métrique.
Là, nombre de transactions.
Moi, je vais mettre 6.1S.
Je ne l'avais pas vraiment enregistré.
C'est ici.
Donc là, tu es dans Customize, Adaptating, Formatting.
D'accord.
Du coup, c'est ici qu'on choisit ce qu'on veut.
D'accord.
On va essayer genre 1.
Oui, ça c'est là que tu veux.
1.
1.
1.
1.
2.
3.
1.
Ah, mais cette convertie après en…
Oui, ils expliquent à chaque fois ce qu'il…                

on 2024-11-21

Visit the Getting started with Apache Superset course recordings page

United Arab Emirates - Getting Started with Apache Superset