Triturer des très grands fichiers était de fantasme ultime du data miner a-t-on coutume de dire. etant passé récemment à un système 64 bits (mieux vaut tard que jamais), je me propose d’étudier le comportement des outils spécifiquement dédiés à ce système, principalement knime 2.4.2 et rapidminer 5.1.011. ce document vient compléter
Sipina
S
Sipina
Ses blogs
Articles :
57
Depuis :
11/03/2008
Categorie :
Technologie & Science
Articles à découvrir
Le transfert entre le tableur excel et sipina a été fiabilisé sur les bases de taille modérée (sur les grandes bases, plusieurs centaines de milliers d’observations, mieux vaut toujours passer par l’importation directe de fichier au format texte .txt). la gestion du point décimal a été améliorée. la transformation automatique est main
Le site sipina a été transféré à cette adresse : http://sipina-arbres-de-decision.blogspot.fr/
L'add-on « sipinalibrary.oxt » a été rajouté à la distribution. a partir d'un menu additionnel intégrée au tableur calc, il permet de lancer directement le logiciel sipina sur une sélection de données. l'add-on fonctionne pour les suites bureautiques open office (testée pour la version 3.3.0) et libre office (version 3.5.1.2). rappelons
Les logiciels (sipina research, regress et assocation rule software) associés à la distribution sipina ont été mis à jour avec plusieurs améliorations. sipina.xla. la macro complémentaire fonctionne indifféremment les versions 32 et 64 bits d’excel (testée jusqu’à excel 2010). importation des fichiers textes. le temps de traitement a
S’endormir sur ses lauriers est impossible en informatique. tout évolue très vite : matériel, système, logiciel. c’est un de ses principaux attraits d’ailleurs. la vérité d’aujourd’hui n’est pas celle d’hier, elle sera peut être différente demain, il faut être sur le qui-vive. ayant changé de système, je suis passé à wind
L’analyse discriminante linéaire a été améliorée. toutes les opérations sont réalisées en une seule passe sur les données. une version multithreadée de l’analyse discriminante linéaire a été ajoutée. elle améliore la rapidité d’exécution en répartissant les calculs sur les éventuels coeurs (ordinateur avec un processeur mul
Peu de personnes le savent. en réalité, plusieurs logiciels sont installés lorsque l'on récupère et que l'on exécute le setup de sipina (cf. liens - télécharger sipina). je n'en parle pas beaucoup parce que les autres techniques proposées (régression linéaire multiple et règles d'association) sont déjà intégrées dans tanagra qui est
Outre les arbres de décision qui restent quand même son véritable terrain de prédilection, le logiciel sipina intègre d’autres méthodes supervisées. certes, les mêmes sont disponibles dans tanagra (qui – lui - ne propose pas les arbres graphiques interactifs), elles y sont mieux mises en valeur, nous pouvons les enchaîner (ex. réalise
Une nouvelle version multithread de l’analyse discriminante linéaire est ajoutée dans sipina 3.11. par rapport à la précédente, elle présente le double avantage (1) de pouvoir utiliser tous les ressources disponibles sur les machines à processeurs multi-cœurs ou multiprocesseur ; (2) de mieux équilibrer la répartition des charges. elle