Vicnent (.|)

jeudi 30 juillet 2009

Cum hoc ergo propter hoc

Corrélation, causalité : le mélange est souvent facile pour peu qu'on n'ait pas les bases en Logique. Le meilleur moyen d'en voir ou d'en écouter et de regarder soliloquer un journaliste généraliste parler d'un sujet qu'il ne maitrise pas. On a alors droit à des contre vérités, des erreurs d'ordre de grandeur et ... des effets gigognes.

La corrélation exprime le fait que des données sont liées.

La causalité exprime le fait que de deux événements, l'un est la cause de l'autre. Raffinement : l'un ne peut être que la cause partielle de l'autre.

Si vous prenez par exemple le pourcentage de gamins qui ont essayé des produits faisant partie de la famille des Cannabaceae[1], dont le principe actif est le tétrahydrocannabinol, on ne le rappelle jamais assez ET le taux de mortalité en France des personnes de 50 ans, vous vous rendez compte que les données sont corrélées : le premier augmente linéairement, le second descend linéairement. Y a-t-il un lien de cause à effet pour autant ? Dans ce cas ci, le bon sens vous ferait dire non. Le scientifique lui, procède autrement : il exprime une théorie : soit A l'augmentation en pourcentage des fumeurs de cannabis de 18 ans et B la diminution du taux de mortalité des personnes de 50 ans. Puis il se pose la question (qui est sa théorie, ici en 3 sous théories) : A est il la cause de B ? Ou B est il la cause de A ? Ou l'un et l'autre sont-ils équivalent ?

Il y a alors deux façons de traiter la théorie : soit on émet des hypothèses qui serviront à réfuter le théorie, soit on la démontre.

Pour réfuter la théorie, il faut ici traiter 3 cas. (les cas ci dessus énoncés : A => B ?, B => A ?, A <=> B ?)

Prenons le premier cas : A => B. Pour réfuter la causalité, il suffit de modifier la cause pour montrer qu'il y a ou pas influence (dans un cadre monofacteur... si on ajoute des modus barbara, on n'est pas sorti). il suffit donc de faire fumer les jeunes, soit plus du tout, soit beaucoup plus pour montrer que cela n'influence pas le taux de mortalité des personnes de 50 ans, lui resté fixe.

Pour le deuxième cas, B => A, là encore, il suffit de trouver une forme de contre exemple. Tuons toutes les personnes de 50 ans, et voyons si les jeunes fument plus ou moins !

Pour le troisième cas, qui est est une équivalence, il suffit de montrer qu'une des deux implications est fausse pour que l'équivalence soit fausse. Pour montrer que l'équivalence est vraie, vous devez montrer que les deux implications sont vraies.

Comme on le voit, il y a ici des difficulté protocolaires (tuer des gens, faire fumer beaucoup plus de cannabis, ...). Mais il faut bien comprendre que pour démontrer une vérité, il est nécessaire de montrer que tous les cas sont vrais, alors que pour infirmer une vérité, il suffit de montrer qu'un cas est faux. Et cela peut être fait de beaucoup de façon différentes.

Je travaille actuellement sur ce genre de problématique : montrer qu'il existe ou non des liens de causalité sur des données corrélées. C'est un bonheur parce que c'est difficile. La difficulté vient entre autre du fait que les données sont à la fois statistiques mais surtout qualitatives.

En gros, j'ai une situation A que je caractérise par un état B. De cet état B, je réalise un traitement T(B; x,y) avec plusieurs critères (il y a principalement deux de libres, dont la cardinalité totale du produit en croix vaut 40). J'arrive dans un état C.

Premier problème : chaque traitement T se compose de deux phases dont le total prend 1 à 2 minutes.

Deuxième problème : il faut comparer des données strictement qualitatives avec tout de même un tout petit peu de statistique. Si le bon sens et le coté statistique me permettent d'écarter tout un tas de résultats foireux, je peux aisément me retrouver avec le problème d'avoir à comparer cinq ou dix pages concernant A, passées par C1 = T(B;x1,y1), C2 = T(B;x2,y2), C3 = ... Et quand c'est du pur qualitatif, ce n'est pas simple, ne serait ce que de déterminer des tendances.

Troisième problème : c'est tout bête, c'est le temps : Comparer deux pages de résultats qualitatifs, c'est difficile et long. Et si comparer deux pages peut se faire en un certain temps, faire le même travail quand on sort de 4 h du même intense travail, c'est plus long.

Quatrième problème : Et quand on trouve des hypothèses (pour moi, le réglage de x et y), encore faut il démontrer qu'elles sont justes ! C'est à dire vérifier que certaines corrélations sont aussi des causalités. Ça veut dire contre hypothèse etc... Et quand parfois une sous causalité induite s'en mêle, ben, c'est le bordel : les résultats peuvent sembler incohérents !

Cinquième problème : il faut que les réglages soit exhaustifs (au maximum) et stables pour A. Car ce qui m'intéresse aussi, c'est que le réglage trouvé pour le jour j le soit aussi pour le jour j+1 ! Et sur un ensemble de définition suffisamment étendu pour qu'elles soient stables : mes situations A du jour j et du jour j+1 sont par nature indépendantes. Pour revenir à nos fumeurs et nos personnes de 50 ans, imaginez qu'il y ait une causalité, mais seulement sur des bornes bien définies de consommation (intra) ou pire, sur des données externes au problème (par exemple, la territorialité des essais !)

Sixième problème : il faut trouver un résultat ! Quitte à ce que ce soit un résultat négatif. Et ce peut être pour beaucoup de motifs : c'est le traitement en lui même qui n'est pas bon, ce peut être le nombre de paramètres qui est insuffisant, ... car tout cela a un but : je ne fait pas C = T(Etat(A ; x,y) pour rien. Et c'est difficile en soi : si je dis tel réglage est bon, alors, il suffit de vérifier que pour ce réglage, c'est toujours bon (ie ne pas permettre de trouver un contre exemple). Alors que si je dis Aucun réglage n'est bon, il faut alors montrer que pour tous les réglages, les résultats ne sont pas bons.

Septième problème : mon voisin refait sa toiture. Entre cloutage d'ipn en bois, découpes de carreau et autres gouttières à la machine à disque, martelage de clous, mes oreilles, malgré une position au deuxième étage et des double vitrages, en ont soupé comme on dit. [edit : j'ai oublié de préciser que ce qui est aussi gênant, ce sont les bruits de la perceuse, leurs engueulades en roumains et probablement, vues les conditions de sécurité dans lesquelles ils travaillent, la sirène des pompiers qui ne va pas tarder...]

Bref, c'est aussi difficile que c'est le bonheur. Et prise de tête. Moi qui ai l'habitude de dire que pour un problème pour lequel j'ai déjà une vague idée de la façon d'obtenir une solution, ça ne m'intéresse que peu, me voila servi. Et c'est du trois étoiles.

Note pour moi même : trouver qui dirige le Consortium Unicode. Lui péter la gueule.

Widget Tags par Wikio!


[1] : si je dois avouer avoir fumé une dizaine de pétards dans ma vie (et encore, je n'ai pas fumé autre chose que des cigarettes de Cow Boys depuis plus de 15 ans), je dois avouer que le Kafiristanica me laisse un bon souvenir... Vu le ton de la phrase précédente, je dois aussi vous signaler ceci : Depuis la loi de 2007 sur la récidive ou loi Dati, des peines plancher sont applicables aux récidivistes. En pratique, l'achat de 2 grammes de cannabis pour sa consommation personnelle, par une personne considérée par la loi comme récidiviste conduit ainsi à une peine plancher de quatre ans ferme. Le reste est sur legifrance.gouv.fr, code pénal...

mardi 21 juillet 2009

Tour de France, qu'on t'adore.

Fin juillet 2007, Antoine Vayer (Professeur d’EPS et ancien entraîneur de Festina, il dirige AlternatiV, une cellule de recherche sur la performance, à Laval.) écrivait dans Libé :

[...]
Contador, au plateau de Beille, a développé 433 watts de moyenne. Mieux que les honnis Basso et Armstrong au même endroit, trois ans avant. Avec la longue quinzième étape de montagne censée épuiser les organismes après plus de cinq heures d’effort, il a réussi d’incroyables accélérations à 465 watts de moyenne pendant 4 min 55 s dans le col de Peyresourde. Rasmussen peinait dans sa roue. Quatre démarrages sur une pente à 8 % en moins de 2 km, alors qu’à peine 500 m à 410 watts auraient dû le faire zigzaguer jusqu’à le mettre à l’arrêt. Normalement, un champion parfaitement entraîné aurait produit de l’acide lactique qui brûle les jambes. Lui, rien.
[...]
Cette année, Rasmussen était leader avec une moyenne de 430 watts, dont 428 pour l’Aubisque, 436 pour Peyresourde, 433 pour Beille et 425 pour la Colombière. Il cède sa place à Contador, qui tourne à 427 watts de moyenne (respectivement 419, 436, 433 et 419). Quant aux Français, ils s’en sont pris plein la gueule. Partis avec le plus gros contingent (34 coureurs), les trois meilleurs, Goubert, Halgand, Moreau (380 watts), terminent tuméfiés à plus d’une heure du vainqueur. Ce sont pourtant trois ex-Festina de la grande époque. Des durs. A Madagascar, on dit : «Le même tombeau pour les morts, la même maison pour les vivants.»
[...]

Cette année, en juillet 2009, Contador s'est fait le Verbier à presque 500 Watts, pendant 21 minutes, explosant tous les records, et arrivant frais. Et Amstrong n'est qu'à une minute derrière.

Merci Nicolas.


Note : pour mémoire, Rasmussen a été viré par son équipe le 16 juillet 2007, en plein Tour de France, Leader du Tour de France, et après avoir remporté l'étape du jour parce qu'il n'aurait pas donné correctement son emploi du temps d'entrainement de pré saison (il se serait entrainé en Italie, et non au Mexique). En septembre 2007, le laboratoire de Châtenay-Malabry révèle que des traces de Dynepo ont été trouvées dans ses prélévements, et Rasmussen se prend deux ans de suspension.

vendredi 17 juillet 2009

Qu'est ce que faire une expérience ?

EDIT IMPORTANT :

Après moult vérifications (et ça, c'est tout à notre honneur...), il semblerait en fait qu'on ait eu que j'ai eu à faire un autre artiste, de qualité redoutable, et à un ami qui m'a trompé, de bonne foi ou pas, à cet instant, je ne peux que lui laisser le doute.

Donc, il n'y aura pas de diffusion ce soir, puisque nous avons désormais des éléments qui laissent plus que planer un doute, finalement, sur l'authenticité du titre.

J'aurai aussi pu dire que Sony avait déjà pris contact ou que sais-je, mais non, j'assume : je me suis trompé.

Mes excuses aussi les plus plates et les plus sincères à Presse citron et à Korben, que j'avais mis aussi dans la boucle, qui n'y sont finalement pour rien, et qui ont failli, comme je l'ai été, être abusés. Mais excuses aussi aux éventuels lecteurs qui auront peut être espéré, mais qui auront perdu quelques minutes ici.

In fine, le titre du billet est très bon, mais pas dans le sens auquel je pensais initialement...

et les couv' restent bonnes


C'est le sujet de l'épreuve de Philosophie sur lequel j'avais eu à plancher pour le bac.

Un peu tardivement, presque 20 après, je ne vais pas re écrire une réponse. Je vais la vivre.

C'est l'histoire d'un type qui connait un type qui connait un type qui a enregistré des chansons avec un autre type. Il y a environ 2 ans.

L'un des types ci dessus, c'est juste Michael Jackson. Et parmi les autres types, il y a Usher. Et puis moi, tant qu'à faire.

Et parfois, on se retrouve sur un tas d'or. Des trucs inimaginables. Incroyables. Déments. Inconcevables. Pour le Fan que je suis en tout cas...

Des trucs à enterrer TMZ aussi. Parce que ça ne sera pas juste 25 secondes.

Désolé par avance pour les 503...

On s'écoute ça à 20h00. Ici. Et vous aussi, vous pourrez faire planter Shazam avec un titre de Michael Jackson. Ce n'est pas courant :-)

samedi 11 juillet 2009

You too ?

EDIT D'APRES CONCERT : Photos ici. (ET concert formidable, The edge est toujours un robot, Bono a retrouvé sa voix, passage sur l'Iran, Ang San Suu Ki, Michael Jackson "What a waste", Desmon Tutu, et quelques mots échangé en direct avec la station orbitale...)


La dernière fois, c'était le 9 juillet 2005. Et puis aussi, le 10 juillet 2005, le lendemain, sur un coup de tête (et de carte bleue aussi, forcément...)

Ce soir, 4 ans après, presque jour pour jour à quelques heures près, on remet ça...


de 1 jusque 20, c'est Moi !

CKwaDonk ??

Last.Photo.En.Ligne


Twits again

    wtf ?

    Avertissements d'usage, parce que vous le valez bien. Je, Vicnent, suis propriétaire et Auteur de ce Blog. En tant que propriétaire des lieux, je m'autorise à y mettre ce que je veux, mensonges éhontés ou par omission si je veux. En tant qu'Auteur, sachez que les droits d'auteur s'appliquent à toute oeuvre de l'esprit, quels qu'en soient le genre, la forme d'expression, le mérite ou la destination. Tout lecteur de ce blog doit en respecter les droits de propriété intellectuelle. Il doit notamment veiller à ne pas reproduire et diffuser les articles et contributions publiées sur ce blog sur d'autres blogs, forums ou d'autres supports sans mon accord. Tout lecteur peut néanmoins reproduire le contenu de ce blog à des fins de consultations privées ou reproduire et diffuser de courts extraits d'un article ou d'un message, à des fins d'information ou de recherches, en citant Blog de Vicnent (.|) comme Auteur de l'article ou du message. Une fonction spéciale permet même de faire des trackback vers chaque article. Vous allez rire, mais la fonction Trackback porte le nom Trackback. Déni de responsabilité : Les articles de ce blog résultent en général ou en particulier de la compilation d'informations en provenance de plusieurs sources et/ou d'expériences personnelles. Dans la mesure du possible, ils tentent de compiler une documentation exhaustive ou non dont les sources sont citées dans la mesure du possible ou non. Toute personne mettant en application ces renseignements le fait à ses propres risques. Je, Vicnent, n'assume aucune responsabilité des dommages susceptibles de résulter de l'usage de ces renseignements. En particulier toute décision concernant un traitement médical devrait toujours se prendre en consultation avec un professionnel de la santé qualifié, diplomé et compétent. Vous devriez également arrêter de fumer, passer votre permis moto, faire de parachutisme et ne jamais arrêtez de vous cultiver sinon, vous deviendrez xénophobe. Que vous ayez 18 ans ou plus m'est totalement égal, vous pouvez de toute façon sortir et/ou arrêter la lecture de ce blog quand bon vous semble. Votre avis reste de toute façon votre avis et quand parfois, je vois ce que je vois et j'entends ce que j'entends, je me dis que j'ai raison de penser ce que je pense. En dernier recours, vous pouvez aussi aller vous faire foutre. Bonnes lectures.

    Aller au contenu | Aller au menu | Aller à la recherche

    topTen3

    Ici !

    Calendrier

    « juillet 2009 »
    lunmarmerjeuvensamdim
    12345
    6789101112
    13141516171819
    20212223242526
    2728293031