Overblog
Suivre ce blog
Editer l'article Administration Créer mon blog
30 juin 2010 3 30 /06 /juin /2010 16:55

Analyse-semantique-e-reputation.jpgTagCrowd est un générateur de nuages de mots-clés. Concrètement cet outil permet de faire une analyse sémantique d'une page web ou d'un texte, c'est à dire mettre en exergue la fréquence d'usage d'un mot-clé dans ce même texte ou page. Ce qui, en analyse d'une veille et spécialement pour l'e-réputation, s'avère pratique.

 

 

 

 

 

 


Pourquoi faire une analyse "sémantique" ?



Pour plusieurs raisons :



==> Balayer très rapidement un corpus de textes ou un site web afin d'en extraire les thématique principales


==> Repérer à l'intérieur de ce corpus ou site si l'organisation que l'on surveille est souvent citée


==> « Décontextualiser » son analyse en ne s'intéressant qu'aux termes employés et non pas à leurs interrelations


==> Améliorer son référencement naturel (par rapport à son propre site ou à celui d'un concurrent)


==> Accessoirement, générer de beaux nuages de mots-clés pour résumer un concept lors d'une présentation ou autre



Dans tous les cas, un tel outil n'est que la base d'une bonne analyse sémantique (il serait d'ailleurs plus adéquat de parler d'analyse lexicale, le terme sémantique étant devenu courant). Il ne doit en rien supplanter une analyse humaine contextualisée, et encore moins une analyse de sentiments et d'opinions (mais j'y reviendrai beaucoup plus en détail dans un prochain article).

 



TagCrowd : fonctionnement


 

L'outil vous propose tout d'abord, soit d'entrer l'URL d'une page ou d'un site (très pratique pour analyser un article depuis sons agrégateur), de télécharger le document que vous souhaitez analyser (6 mégas maximum, pdf, .doc, .ppt, etc. acceptés), ou encore de coller directement une partie du texte à analyser.


 

TagCrowd1.jpg



Vous pouvez ensuite, soit directement générer votre nuage de mots-clés, soit (et c'est conseiller) configurer votre analyse afin de l'affiner au maximum.


TagCrowd propose pour cela différentes options qui font tout son intérêt (par rapport à d'autres outils du même type) :

 


==> Choisir la langue du texte à analyser


==> Le nombre maximum d'occurrences à faire apparaître dans le nuage de mots-clés


==> La fréquence des mots-clés : l'outil doit-il faire apparaître les mots-clés présents une fois dans le texte ? 5 fois, 10 fois, etc.


==> L'outil vous propose aussi de faire apparaître à côté de chaque mots-clés la fréquence d'apparition de celui-ci


==> Ignorer certains mots-clés. Sûrement l'option la plus intéressante : vous pouvez créer votre propre liste de mots-clés à ignorer. Un conseil, servez vous en pour ignorer les mots de liaisons et autres pronoms présents dans la langue française : le, la, les, mais, où, est, et, donc, ni, car, il, etc. Vous pouvez ainsi affiner au maximum votre analyse.


==> Enfin une dernière option valable seulement pour les textes en anglais et qui permet de regrouper les mots ayant la même racine.


 

 

TagCrowd2.jpg



Voici ce que donne un nuage de mots-clés concernant un des articles de ce blog :


 

TagCrowd3.jpg



 

D'autres outils pour aller plus loin



Un autre outil « classique » pour générer des nuages de mots-clés est Wordle. Contrairement à TagCrowd cet outil est beaucoup moins précis quant à l'analyse sémantique qu'il propose. Mais, au contraire de son concurrent, il permet une meilleure mise en forme du nuage, beaucoup plus « artistique » et agréable à lire.


Il peut donc être intéressant, pour une présentation ou autre, d'intégrer les mots-clés générer par TagCrowd dans Wordle afin d'obtenir une mise en forme plus attrayante. Pour exemple, le même nuage de mots-clés que ci-dessus, mais mis en forme avec Wordle :


 

TagCrowd4.jpg

 




Un autre outil, un peu plus technique à utiliser, est Tropes Zoom. Cet outil, dont le producteur propose une version gratuite sur son site, s'adresse déjà plus à des analystes avertis (ou alors il peut servir d'introduction pour la prise en main de ce type d'outils). Et qui, surtout, ont une réelle nécessité à mettre en place une analyse sémantique approfondie d'un texte.


Globalement, en plus d'une analyse basique des occurrences de termes précis, la version gratuite de Trope vous permet de passer de l'analyse sémantique (enfin lexicale) à l'analyse syntaxique. L'outil vous propose de chercher directement dans le texte en fonction de thématiques prédéterminées (des « scénarios »), ou que vous pouvez vous même créer...

 

 

TagCrowd5.jpg



De même, Tropes fait apparaître les « références » (mots-clés) sous une forme cartographique toujours intéressante pour mieux appréhender un texte long et emplie de concepts divers. La taille des bulles est générée en fonction du nombre d'occurrences, et la distance entre celles-ci est fonction du nombre de relations qui les lient (sont-elles proches ou pas dans le texte ?) :


 

TagCrowd6.jpg



Bref, un premier pas vers une vraie analyse sémantique, concept et outils sur lesquels je reviendrai donc plus en détails prochainement.



Pour finir, voici (en vrac) une liste d'autres outils similaires à TagCrowd ou Wordle : www.tag-cloud.de, www.tocloud.com, www.makecloud.com, www.tagcloud.com, www.artviper.net/texttagcloud...



Et vous, comment utilisez vous ce type d'outils ?! Et plus largement, quel est pour vous l'intérêt d'une analyse sémantique en veille ?!


Partager cet article

commentaires

Hugues 15/07/2010 15:35


Pour plus de précisions je testerais à l'occasion tropes et donnerais mes impressions ici. Espérons que la période estivale soit propice à ce genre de test !


ThibaudBrunet 09/07/2010 16:05


Bonjour Camille, j'ai pu tester Tagcrowd et je le trouve très simple et utile pour la génération de mots-clés sur des url simples ou blogs (surtout la partie qui permet de choisir les mots-clés à
ne pas faire ressortir, qui est très utile pour la précision). J'ai essayé aussi de tester plusieurs de ces logiciels sur les réseaux sociaux type facebook, linkedin,... et malheureusement ceux ci
ne génère rien. Par exemple, pour une url facebook, connais tu des logiciels de génération de mots-clés adaptés à ce type de page? Cordialement.


Hugues 01/07/2010 15:00


Après un très court test de Tagcrowd, je conseille de mettre le "minimum frequency" à "2", ce qui permet d'éviter certains termes ou coupures mal gérées par le logiciel. Pour info, le test a été
fait à partir de l'url suivante :
http://carrefourartdigital.blogspot.com/
et ne me donnait pas satisfaction même en supprimant les mots de liaisons comme tu le conseil ;)

Pour le reste, je cherchais un outil aussi propre et efficace que TagCrowd, alors MERCI ! :D


Alloing - Matmati - Taharifera 01/07/2010 17:21

Effectivement Tagcrowd n'est pas d'une précision chirurgicale :-) Pour aller plus loin il y a Tropes qui commence déjà à être plus précis ! Merci en tout cas pour ce retour d'expérience et cette mise en pratique :-)

Le nouveau blog!

Le nouveau blog : cadderep.hypotheses.org

 

Rechercher

Gazouillis