Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

jeu de donnée #19

Open
sbuisson opened this issue Oct 20, 2016 · 11 comments
Open

jeu de donnée #19

sbuisson opened this issue Oct 20, 2016 · 11 comments

Comments

@sbuisson
Copy link

tout est dans le titre: vous auriez des exemples de jeux de données?

@inattendu
Copy link
Collaborator

Non ; c'est d'ailleurs une bonne partie du problème. Il faut pour le moment faire du reverse.

Pour des raisons évidentes de confidentialité, un jeu de donnée officiel ne sera jamais publié, mais il est prévu de faire la demande d'un jeu "fake" ou au moins de la structure. (à suivre dans le wiki)

@piwai piwai reopened this Oct 20, 2016
@piwai
Copy link
Collaborator

piwai commented Oct 20, 2016

Vu qu'effectivement on aura jamais un vrai jeu de données, je me demandais dans quelle mesure on pourrait réutiliser ce simulateur: https://github.com/arnaudriegert/comprendre-apb et brancher la partie sql à la place du modèle existant. Bien sur il faudra sans doute adapter le code pour enlever toutes les features spécifiques Oracle.
@arnaudriegert: un avis sur la faisabilité de la chose?

@sbuisson
Copy link
Author

Meme un truc de tests?
J'ai déjà travaillé sur des données confidentielles "réelles" qui avaient été "obfuscées" pour les confidentialiser.

Mais bon, quand on voit comment on a recu le code à la base :$

@inattendu
Copy link
Collaborator

inattendu commented Oct 20, 2016

Le simulateur n'est qu'une application issue d'une interprétation de la théorie publiée précédemment.
@piwai : Je doute qu'on puisse garantir la reconstruction d'un jeu de donnée à partir de celui ci.
Par contre si on obtient les sources de http://www.simulation-apb.fr/, ce sera plus parlant.

Pourquoi ré-ouvrir ? je ne comprend pas le rapport.

@sbuisson : L'enjeu est de construire une nouvelle demande à l'éducation nationale. Un jeu de donnée "Fake" fait déjà partie de ce qui va être demandé ; CF : https://github.com/jeantil/admission_post_bac/wiki

@piwai
Copy link
Collaborator

piwai commented Oct 20, 2016

@inattendu : C'était juste que de ce que j'ai cru voir de l'application, elle pourrait peut-être faciliter la création d'un faux jeu de données (en attendant mieux)

@jpotier
Copy link
Collaborator

jpotier commented Oct 20, 2016

Une ébauche de création de table a été mergé ; reste à la compléter, c'est un premier pas vers un jeu de données factice.

@jferard
Copy link
Collaborator

jferard commented Oct 20, 2016

Un problème lié à ce jeu de données factices est celui des possibles valeurs négatives au niveau de l'ordre des voeux, mentionné en #12. Une fois que la structure des tables est "découverte", comment déterminer ce qui devrait s'y trouver (en particulier les fourchettes de valeurs) ?

@IBG2016
Copy link

IBG2016 commented Oct 20, 2016

Bonjour
J'ai essayé le site officiel de simulation http://www.simulation-apb.fr/
Je voulais regarder comment ils formalisaient le fait de classer les voeux.
Person, cela m'étonnerait que les voeux soient en négatif dans le système, cela semble tellement plus compliqué à gérer le changement de l'ordre quand on ajoute un voeu et c'est moins intuitif.
Mais bien que je dispose d'un numéro d'INE (élève de 1ére, donc ça tombe bien, il est censé pouvoir s’entraîner ), je n'ai pas de numéro OCEAN.
Avez-vous une idée de la structure du numéro ?
Je ne pense pas que l'outil vérifie la donnée elle-même, juste la structure.
Merci

@khena
Copy link
Collaborator

khena commented Oct 20, 2016

Je suis entièrement d'accord avec @IBG2016 , les codes négatifs, franchement, je veux bien que plus rien ne nous surprenne vu la qualité du code, mais franchement, à moins d'avoir une très bonne raison qui nous échappe, c'est une faute professionnelle là.

@AxelVoitier
Copy link

AxelVoitier commented Oct 20, 2016

On ne sait pas comment marche l'esprit du developpeur. Certaines personnes arrivent sans probleme a reflechir en "anti-normal", en contre-intuitif, simplement parce qu'eux, a l'inverse de la majorite qui definie le normal et le naturel, arrivent a se representer des algorithmes marchant aussi bien en positif qu'en negatif, dans un sens ou dans un autre.
Ca peut etre un raccourci alambique pour resoudre un probleme qui aurait peut etre etre pu resolu d'une facon plus explicite, mais qui ne collait pas a la facon de reflechir du developpeur.

Aussi, ne pas oublier la possibilite que les voeux soit bien en positif, et que le cas du zero en premier soit resolu en post-traitement.

Edit : dans un post-traitement qui nous est inconnu ;).

@arnaudriegert
Copy link
Contributor

Bonjour, et merci à @piwai de m'avoir fait signe :)

Le projet que j'ai lancé au moment de la publication de la première partie de l'algorithme a pour but de faire une reconstitution d'APB, dans un langage plus compréhensible que le SQL qui vient d'être diffusé pour que les développeurs, chercheurs et autres enthousiastes puissent se l'approprier, le forker, etc., ainsi que d'avoir une application web permettant de faire des simulations.

Je vais travailler ce week-end pour essayer de comprendre le code et mettre à jour mon dépôt. J'ai l'habitude de certaines bases de l'Éducation nationale, cela m'aidera peut-être à démêler certaines choses.

En termes de jeu de données, il y a un travail en cours au ministère pour mettre à disposition une version partielle la base APB (qui sera bien sûr anonymisée) auprès de chercheurs et peut-être du grand public. Je vous tiens au courant lorsque j'ai plus d'informations communicables à ce sujet.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

9 participants