OpenRefine : quelques ressources en français

21 septembre 2016

Vous le savez, je ne taris pas d’éloges à l’égard d’OpenRefine.  Le malheur, c’est que ce puissant outil a peu de vitrine dans la communauté informatique francophone.  Qu’à celà ne tienne, voici une courte liste de ressources en français sur le web!

 

 


OpenRefine

12 août 2016

A long long while ago, I had a close look at GoogleRefine.  This tool’s sole purpose is to extract, clean, transform and reconcile data.  And  the more the messy is your data, the better you’ll like this tool!

At first glance GoogleRefine was very interesting but, at the time, the whole thing was more promising than useful.  But recently, while looking for GoogleRefine again (I just could not remember the name!), I found its successor: OpenRefine!

Since then, Java has matured, web services are more robust, the tool has progressed quite a lot and OpenRefine uses everything in it’s power to facilitate your job!  More ways to reconcile the data, many different ways to transform your data, more predefined functions and functionalities!

Custom transformations can be done in 3 ways with some easy coding : with GREL (Google Refine Expression Language), Jython (a Python implementation that runs on Java) or Clojure.  Many many many ways to reconcile the data are now available, more import formats (TSV, CSV, Excel, JSON, XML, etc), more ways to reconcile data from webservices and the list goes on.  I must say OpenRefine has lots to offer!

So instead of writing a novel about how cool this tool is, I’ll leave you with a list/compilation of videos, tutorials, documents and websites that demonstrate what OpenRefine do for you!

School of data

Enipedia Tutorial

OpenRefine.org

Hope this help!

In the I-have-to-clean-up-this-mess department, DataCleaner is another useful tool.  But that’s going to be the topic of another post!

Save

Save


GitHub

28 février 2016

Git

Le temps aura finalement eu raison de moi!

Il y a longtemps, j’avais abandonné avec peine CVS (avec WinCVS) pour passer à SVN (avec TortoiseSVN).  Après des années de loyaux services, il semble bien que comme toute la planète utilise Git et plus particulièrement GitHub, je n’avais d’autre choix que de me convertir!

De plus, comme tout le développement de Squeak, Pharo et Dolphin (ainsi que plusieurs contributions/projets pour ces divers environnements) est maintenant sur GitHub, avais-je le choix?

La première chose qui saute aux yeux pour un développeur Smalltalk, c’est la facilité avec laquelle il est facile de gérer les artefacts d’un projet.  Alors qu’il est souvent impossible de gérer le code Smalltalk en même temps que toutes les ressources « extérieures » d’un projet (scripts SQL, icônes, images, fichiers de configuration, etc) dans les outils de contrôle de version intégrés aux divers environnement Smalltalk, rien n’est plus facile avec GitHub!

En plus, GitHub ce n’est pas que pour gérer du code!  Que ce soit pour de la documentation ou l’écriture d’un roman, aucune différence!

Pour un excellent tutoriel sur Git, je recommande fortement celui de TutorialsPoint (en anglais) ou celui de ProGit en français. Après vos premiers pas, cette cheat sheet vous sera utile.

Pendant que j’y pense, je suis ici!

WinMerge

Tandis qu’on parle de gérer le changements, je ne peux me séparer du logiciel de comparaison de fichiers WinMerge. Si vous avez souvent à comparer différentes versions de fichiers, c’est de loin l’outil qu’il vous faut!

 

 


2 petits outils pratiques pour MySQL

2 décembre 2012

Je suis tombé par hasard sur un excellent blogue (en anglais malheureusement), Fatal Exception, principalement dédié à MySQL et qui explique en détail 2 procédures stockées qui pourraient grandement vous faciliter la tâche.

La première sert d’alternative à la commande SHOW TABLE STATUS en étant plus détaillé et plus lisible.

La seconde  permet d’avoir une vue d’ensemble de toutes les bases de données et de l’espace disque de chacune sur votre serveur.