Rechercher dans ce blog

dimanche 1 juin 2014

Mélenchon et Les Le Pen dans la PQN française en ligne : les thématiques associées en 2011-2014

Comme je vous l'ai promis dans l'article précédent concernant Mélenchon et les Le Pen, vous trouverez ci-après la configuration des quinze références thématiques les plus associées à l'évocation dans les titres de la presse quotidienne nationale française (PQN) en ligne de Mélenchon et des Le Pen. Les taux d'occurrence (en %) présentés sur le graphique sont en fait des taux moyens des fréquences d'occurrence des références en 2011-2012 et 2013-2014. (Il aurait été intéressant de voir les évolutions dans le temps, mais vous pourrez toujours me les demander via le formulaire de contact).


Comparé au corpus "Mélenchon2011-2014", le corpus "LesLePen2011-2014" présente les références thématiques saillantes suivantes : l'accent mis sur la "France et les Français"; "l'Europe" (entendons Union Européenne, et on connaît le résultat depuis peu); la problématique des "Roms, des Musulmans et de l'immigration" en général; le "parlement" (le français, bien sûr, mais aussi l'européen); les problématiques du "droit et de la justice"; la question du "racisme, des insultes racistes et de la haine", la question de "la famille, du mariage (gay notamment), des enfants" (références aux débats sur la GPA ou la PMA), l'allusion aux "affaires" (l'affaire Cahuzac par exemple) et enfin la question de la "sécurité". Résumons la mise en scène médiatico-discursive quand on évoque les Le Pen : "La France et les Français sont exposés à des enjeux identitaires et sécuritaires, l'Union Européenne en porte une bonne part de responsabilité". 

Comparé au corpus "LesLePen2011-2014", le corpus "Mélenchon2011-2014", quant à lui, présente les références thématiques saillantes suivantes : les "critiques, polémiques, manifestations", l'évocation des "entreprises et industries", la question de la "finance et de l'investissement" ; la question des "impôts, taxes, cotisations, fiscalité en général". Pour résumer à notre façon la scène médiatico-discursive, quand c'est Mélenchon qui est évoqué on entend : "des critiques, des mécontentements exprimés au regard des enjeux économiques et financiers auxquels on fait face et des choix qui sont faits ou qui ne sont pas faits en la matière".

Des deux mises en scène et au regard des résultats des élections législatives, municipales, et européennes depuis 2012, une semble avoir plus "impacté" (comme disent nos chers journalistes et les communicants), celle centrée sur les Le Pen. Pourquoi ? Je vous laisse y réfléchir.

L'éducation pour tous en Afrique passe aussi par une lumière saine pour pour tous :
OSA soutient un projet "Lampes Solaires" pour des élèves ruraux du Burkina Faso sur ULULE. Je serais heureux que vous y apportiez votre contribution.

dimanche 25 mai 2014

Mélenchon et les Le Pen dans les titres de la PQN française en ligne : quelles personnalités cooccurrentes ?

Deux éminentes figures politiques de la scène politique française dans mon viseur aujourd'hui. Deux figures diamétralement opposées sur l'échelle des valeurs et des positionnements socio-politiques : "Les Le Pen"  (un trio formé par : Jean-Marie Le Pen, président du Front National de 1972 à 2011 ; Marine Le Pen, présidente du Front National de 2011 à nos jours, candidate du FN à l'élection présidentielle française de 2012 et Marion Maréchal-Le Pen, membre du Front National, élue le 17 juin 2012, à 22 ans, plus jeune députée de l'histoire de la République française) d'un côté et de l'autre, Jean-Luc Mélenchon (fondateur du Parti de Gauche en 2009, candidat du Front de Gauche à l'éléction présidentielle française de 2012).

Question : quand la presse quotidienne nationale (PQN) française en ligne (lemonde.fr, lefigaro.fr, liberation.fr, lepoint.fr, lexpress.fr, tempreel.nouveobs.com... une dizaine)  titre sur "Le Pen" (peu importe lequel ou laquelle : le père, la fille ou la petite-fille) ou sur "Mélenchon" en 2011-2012 et 2013-2014 quelles autres personnalités politiques ou civiles co-apparaissent?

lundi 19 mai 2014

Quelles représentations de la confiance dans les publications des sites web français entre 2008-2013 ?

Parmi les mots qui nous reviennent souvent souvent dans la bouche il y a le mot "confiance". La confiance, une notion sur laquelle divers philosophes, psychologues et chercheurs en sciences sociales se sont penchés. Mais il ne s'agira pas dans la présente note d'en faire une revue de l'abondante littérature. Non, il s'agira simplement d'essayer de capter, à l'approchant, ce que les résultats de GOOGLE FRANCE permet de savoir sur la représentation sociale - si j'ose dire - de la "confiance". 

Les résultats - Google, pertinents et significatifs, qui ont été analysés couvrent deux périodes : 2008 à 2010 et 2011 à 2013. Le tableau ci-après présente les taux moyens d'occurrence de 20 références thématiques les plus importantes associées à la requête "confiance" dans les résultats de recherche sur GOOGLE FRANCE (la recherche a été focalisée sur les titres de publications de site web d'origine française). A noter que j'ai volontairement écarté la référence à la notion mathématique "d'intervalle de confiance". Les taux d'occurrence ont été calculés en fonction de la fréquence d'occurrence du terme-requête "confiance" sur chacune des deux périodes visées.

jeudi 15 mai 2014

"L'Union européenne veut/souhaite..." dans quels domaines en 2011-2013 ?

Si vous êtes intéressés par la question européenne, comme moi il vous est certainement arrivé de lire ici ou là sur Internet des propos du type "L'Union européenne veut..." ou "L'Union européenne souhaite...". Eh bien, la question qui a motivé la recherche et l'analyse en vue de la rédaction de la présente note est celle-ci : dans quels domaines thématiques s'ancrent ce genre de propos-types que l'on peut lire sur la toile mondiale, lesquels sont censés traduire la volonté et le souhait d'action et d'être de l'Union européenne ? Plus précisément, j'ai voulu me faire une idée de la configuration des références thématiques associées à ces propos-types au cours des trois dernières années (2011, 2012 et 2013). Pour ce faire j'ai constitué - à l'approchant évidemment et grâce aux outils avancés de Google francophone - trois corpus pertinents et significatifs de textes correspondant au trois périodes visées. 

lundi 12 mai 2014

Autour du qualificatif "écologique(s)", quels enjeux thématiques émergents ?

Que qualifie le qualificatif "écologique" (au singulier ou au pluriel) dans les résultats de recherche de Google francophone en 2011, 2012 et 2013 ? Dit autrement, quels enjeux thématiques apparaissent comme préférentiellement associés à ce qualificatif au cours de ces trois dernières années ?

L'analyse des pages de résultats de recherche pertinents de Google francophone, centrés sur la requête "écologique(s)" concernant les trois périodes visées (2011, 2012, 2013), permet de dévoiler les enjeux thématiques associées. Voir le tableau ci-après des 20 références thématiques les plus importantes. Les taux d'occurrence des références thématiques associées ont été calculés en fonction de la fréquence d'occurrence du terme-requête "durable(s)" dans chacun des trois corpus de résultats de recherche de Google Search francophone. N.B. Je ne vous ennuierai pas avec la cuisine technique, mais sachez qu'ici l'analyse a été faite en élargissant un peu le "rayon de pertinence" relatif au terme-requête.

jeudi 8 mai 2014

Autour du qualificatif durable, quels enjeux thématiques émergents ?

Que qualifie le qualificatif "durable" (au singulier ou au pluriel) dans les résultats de recherche de Google francophone en 2011, 2012 et 2013 ? Dit autrement, quels enjeux thématiques apparaissent comme clairement associés à la problématique de la durabilité au cours de ces trois dernières années ?

A ce propos, j'ouvre une petite parenthèse pour dire que la durabilité, notamment à travers le concept de "développement durable" (que nous ne prenons pas en compte ici parce que trop large, pas assez concret), est désormais une idée puissante qui irrigue la société mondiale. Mais, parce qu'elle apparaît comme une "valeur nouvelle", un "nouveau paradigme" de pensée et d'action, il fait l'objet d'une diversité d'interprétations, d'investissements de sens, de positionnements et de traductions dans des comportements, des choix d'actions et/ou de projets d'actions. Fin de parenthèse...

lundi 5 mai 2014

François Hollande dans les titres de la presse française en ligne : quelques indicateurs sémantiques associés

Alors que François Hollande s'apprête à donner une interview BFMTV/RMC demain 06/05/2014, j'ai voulu me faire une idée de comment il est mis en scène dans les titres de la presse française en ligne.

Une première analyse que j'ai réalisée permet de cerner l'évolution (2012, 2013 et 2014) de quatre indicateurs sémantiques associés à l'évocation de François Hollande dans les titres de six importants sites web de la presse française  (voir graphique ci-après) : trois sites web d'actualités marqués plutôt à Gauche : lemonde.fr, liberation.fr et tempsreel.nouvelobs.com et trois autres marqués plutôt à Droite : lefigaro.fr, lepoint.fr et lexpress.fr. Ces quatre indicateurs sémantiques concernent d'une part, deux références sémantiques : les "sondages de popularité et d'opinion" et la thématique de "l'emploi et du chômage" et deux verbes dits modaux : "vouloir" et "devoir" (typiquement : "François Hollande veut/ne veut pas ou François Hollande doit/ne doit pas"). Les taux d'occurrence ont été calculé en fonction de la fréquence d'occurrence de la référence "François Hollande" dans les trois corpus correspondant aux périodes retenues (2012, 2013 et 2014).

mardi 22 avril 2014

Iphone d'Apple, Samsung et Nokia dans les blogs francophones en 2011-2013 : quelles enjeux thématiques associées ?

A quelles références thématiques associe-t-on aux termes-référents "Iphone", "Samsung" et "Nokia" dans les titres des articles publiés dans les blogs francophone en 2011-2013 ? 

Pour en avoir une idée, j'ai analysé le contenu de trois corpus significatifs de titres d'articles de blogs référant à cette période et centrés sur les trois grandes marques de téléphones mobiles que sont "Iphone" (d'Apple), "Samsung" et "Nokia". Les corpus ont été constitués, à l'approchant comme toujours, grâce à Google BlogSearch.

Le graphique ci-après présente les taux d'occurrence de quelques références que j'ai jugées intéressantes à observer. Ces taux ont été calculés en fonction de la fréquence d'occurrence du terme-requête dans chaque cas ("iphone", "samsung", "nokia").

vendredi 18 avril 2014

Autour du bio quelles références dans les blogs français en 2008-2010 et 2011-2013 ?

Quand le mot "bio" est employé dans les publications des blogs français en 2008-2010 et 2011-2013 de quoi parle-t-on ? Pour en avoir une idée, grâce à Google BlogSearch et à l'approchant bien entendu, j'ai constitué deux corpus de titres des publications dans les blogs français. 

Le graphique ci-après présente les taux d'occurrence des principaux groupes de références sémantiques associés au terme-requête "bio" dans les titres en question.  Les taux ont été simplement calculés en fonction de la fréquence d'occurrence du mot-référent "bio" dans chaque corpus.

dimanche 6 avril 2014

L'image de la femme burkinabè, malienne, sénégalaise, ivoirienne dans les résultats de google

Quelle est l'image de la femme burkinabè (du Burkina Faso), malienne, sénégalaise, ivoirienne sur Google. Dit autrement, dans l'ensemble des résultats de recherche visibles de Google français répondant à des requêtes centrées précisément sur ces femmes-là que trouve-on comme références thématiques qui leur sont associées ?

Eh bien, l'analyse sémantique de quatre corpus de résultats pertinents y référant permet d'apporter quelques éléments de réponse : corpus "femme(s) burkinabè", corpus "femme(s) malienne(s), corpus "femme(s) sénégalaise(s) et corpus "femme(s) ivoirienne(s)

Le graphique ci-après présente le poids relatif des principales références thématiques associées à l'évocation de ces quatre "identités" de femme dans les résultats de Google. Les taux d'occurrence ont été calculé en fonction du total des occurrences du terme "femme" et "femmes" dans chaque corpus.

dimanche 23 mars 2014

Le PS, l'UMP et le FN dans les titres de la PQN française en ligne : des cooccurrences à questionner ?

Quels autres partis français invoque-t-on quand, dans la presse quotidienne nationale (PQN) française en ligne, on titre sur le PS (le Parti Socialiste), l'UMP (l'Union pour un Mouvement Populaire) ou le FN (Front National) ? 

Pour y répondre, j'ai constitué, grâce aux outils de recherche avancée de Google et à l'approchant, trois corpus significatif de titres d'articles de la PQN en ligne (une douzaine : lemonde.fr, lefigaro.fr, liberation.fr, lepoint.fr, etc.) répondant aux requêtes centrées respectivement sur le "PS", l'"UMP" et le "FN"et concernant l'année 2013. Ces corpus ont ensuite été soumis à une analyse automatique de contenu.

Le graphique ci-après présente les taux d'occurrence des principaux partis politiques français tels qu'ils apparaissent dans les trois corpus de titres de la PQN française en ligne :  le "corpus_PS", le "corpus_UMP" et le "corpus_FN". Ces taux ont été calculés en fonction du total des occurrences des termes-référents "PS", "UMP" OU "FN"' dans chacun des trois corpus.

mercredi 19 mars 2014

Les jeunes dans la presse quotidienne française en ligne en 2013

A quoi pense-t-on quand on parle des "jeunes" dans la presse quotidienne française en ligne (nationale-PQNL et régionale-PQRL) en 2013? Plus précisément, quelles références thématiques sont activées à l'évocation du terme-référent "jeunes" dans les titres de ces deux types de presse durant l'année 2013 ?

Pour y répondre, grâce aux outils de recherche avancée de Google, j'ai pu constituer et analyser (analyse de contenu sémantique) deux corpus significatifs de textes regroupant les titres d'articles des principaux titres de la PQN en ligne (une douzaine : lemonde.fr, lefigaro.fr, liberation.fr, lexpress.fr, lesechos.fr,  etc.) et de la PQR en ligne (une douzaine également : ouest-france.fr, lavoixdunord.fr, ledauphine.com, leprogres.fr, etc.) et centrés sur le mot-référent "jeunes".

Le graphique ci-après présente la répartition des taux d'occurrence de 17 principales références thématiques dans les deux corpus : corpus "Jeunes_PQRL2013" et corpus "Jeunes_PQNL2013". Les taux sont calculés en fonction du nombre d'occurrences du terme-référent "jeunes" dans chaque corpus.

lundi 17 mars 2014

Quand les blogueurs français expriment leurs satisfactions et leurs déceptions en 2012-2014

La satisfaction (ou la non satisfaction) désigne l'appréciation que l'on peut peut avoir à l'égard d'objets, de produits, de services, de relations interpersonnelles ou institutionnelles qui répondent plus ou moins à ses désirs, à ses attentes. Quant à la déception (ou à la non déception) elle n'est pas sans attentes préalables, explicites ou non et donc sans constat d'écart entre l'attendu et le réalisé.

Dans cet article, je veux savoir de quoi parlent les blogueurs français quand ils expriment sur leurs blogs leurs satisfactions et leurs déceptions en 2012-2014. Plus précisément, je veux savoir dans quels univers de référence sémantiques ils inscrivent leurs satisfactions et leurs déceptions.

Pour tenter d'y répondre, grâce à Google BlogSearch et à l'approchant bien sûr, j'ai constitué deux corpus pertinents et représentatifs d'énoncés-titres de blogueurs français centrés d'une part sur l'expression de leur "satisfaction/non satisfaction", d'autre part sur l'expression de leur "déception/non déception" concernant la période visée. Ces corpus ont été soumis à une analyse sémantique rigoureuse assistée par ordinateur.

Le graphique ci-après présente la répartition des taux d'occurrence des principaux univers de référence associés à l'expression de ces états psychologiques dans les deux corpus.

samedi 8 mars 2014

Quand hommes et femmes co-apparaissent dans les titres sur Google francophone en 2005-2014

Quand les mots "homme(s)" et "femme(s)" sont cooccurrents dans les titres de publications francophone en ligne sur Internet : quelles références sémantiques associées ? Quelles évolutions notables en 2005-2014 ? (La cooccurrence désigne ici la présence simultanée des deux termes "homme(s)" et "femme(s)" dans le même énoncé textuel de titre.)

Vous l'aurez compris, il s'agit d'un clin d'oeil adressé aux femmes, à l'occasion de leur Journée Internationale du 8 mars.

Comme d'habitude sur ce blog, j'ai fait appel à Google francophone pour constituer, à l'approchant, des corpus pertinents et représentatifs centrés sur la requête "homme(s) femme(s)" dans les titres et relatifs aux périodes suivantes : "2005 & 2006", "2007 & 2008", "2009 & 2010", "2011 & 2012" et enfin "2013 & 2014". Les corpus correspondants ont été soumis à une analyse sémantique rigoureuse assistée par ordinateur.

Pour cet article, j'ai choisi de vous présenter les résultats concernant l'évolution dans le temps des taux d'occurrence de six références thématiques associées : "égalité", "parité", "droit-justice-loi", "religion" et "différence-identité". Les taux ont été calculé en fonction du total des occurrences des termes "hommes-femmes" dans chaque corpus.

Le graphique ci-après concerne le référent "Egalité" (voir aussi mon précédent article centré sur l'égalité). Des cinq référents associés ici retenus, c'est de loin le plus saillant.

dimanche 2 mars 2014

Les mots "hausse" et "baisse" dans les titres de la PQN et de la PQR françaises en ligne en 2013 : quelles références associées ?

Dans les titres de la presse quotidienne nationale française en ligne (PQN) et de la presse quotidienne régionale française en ligne (PQR), à quoi a-t-on eu tendance à associer aux mots "Hausse" et "Baisse" en 2013 ? Autrement dit, quels ont été les univers de références sémantiques associés à ces deux indicateurs langagiers des phénomènes de fluctuation de grandeurs.

Grâce à des requêtes appropriées soumises à Google, j'ai pu constituer deux corpus pertinents et représentatifs de titres d'articles émanant d'une part,  des plus importants sites Web de la PQN française en ligne, d'autre part des plus importants sites Web de la PQR française en ligne. Ces corpus ont ensuite été soumis à une analyse de contenu sémantique assistée par ordinateur.

Le tableau ci-après présente les taux d'occurrence des 15 références sémantiques les plus importantes dans chaque corpus de titres.

mardi 25 février 2014

Laïcité : de quoi es-tu le nom sur les blogs français en 2013-2014 ?

Pour boucler la boucle sur les thématiques-valeurs de la République française , je me suis penché sur les références sémantiques que les blogueurs français associent à la "laïcité" dans leurs prises de parole sur le Web. Pour ce faire, un corpus pertinent et représentatif a été constitué grâce à Google BlogSearch. 

De l'analyse text-mining de ce corpus centré sur le mot-requête "laïcité" nous a avons retenu les 15 références associées les plus saillantes représentées sur le graphique ci-après :

mardi 18 février 2014

Fraternité : comment s'énonces-tu dans les blogs français en 2013-2014 ?

"Fraternité", comment s'énonces-tu dans les blogs français en 2013-2014 ? Quelle configuration structurante de sens ?

Pour y répondre, à l'approchant comme toujours dans cet exercice, nous avons analysé le contenu sémantique d'un corpus pertinent de titres de billets de blogs français publiés en 2013-2014 centrés sur le mot-requête "fraternité". Merci à Google BlogSearch pour la récolte des données.

Le graphique ci-après présente le poids relatif des 15 références thématiques les plus importantes qui structurent le corpus "Fraternité". Les taux ont été calculés en fonction du total des occurrences de l'ensemble des 15 références principales retenues.

lundi 17 février 2014

L'égalité : quelle configuration de sens dans les blogs français en 2013 - 2014 ?

Après l'article sur la "Liberté", voyons de quoi le mot "Egalité"  est le nom dans les publications des blogs français durant la période 2013 à nos jours.

Pour s'en faire une idée, toujours à l'approchant et grâce à Google BlogSearch, j'ai constitué un corpus pertinent de titres de publications autour du mot-requête "égalité", couvrant la période 2013 à nos jours. Puis, j'ai soumis ce corpus à une analyse sémantique fine assistée par ordinateur.

Le graphique ci-après présente le poids relatif des 15 références sémantiques les plus importantes, associées au mot-requête "égalité'" dans les titres des publications sur les blogs français. Les taux ont été calculés en fonction du total des occurrences de l'ensemble de ces 15 références ici retenues.

samedi 15 février 2014

Liberté : quelle configuration de sens dans les blogs français (2013-2014) ?

Quelle configuration de sens se dégage des titres des publications sur les blogs français (2013-2014) autour du mot "Liberté" ? 

Pour répondre à cette question j'ai analysé le contenu d'un corpus pertinent obtenu grâce à l'outil "Blogsearch" de Google.

De cette analyse, je ne présente ici que les 15 premières références sémantiques associées au mot "Liberté" dans les titres des publications. Le graphique ci-dessous présente le poids de chaque référence associée. Les taux sont calculés en fonction du total des occurrences de l'ensemble de ces 15 premières références dans le corpus "Liberté".

mardi 11 février 2014

Les internautes disent (re)chercher quoi dans les blogs et fora ?

Que disent (re)chercher les internautes  sur les blogs et fora français sur Internet ? Comment les références thématiques de ces dires ont évolué au cours de ces trois dernières années (2011, 2012 et 2013) ?

Pour répondre à ces questions, nous avons d'abord fait appel au moteur de recherche de blogs de Google pour constituer des corpus de textes autour des requêtes "je (re)cherche" et "nous (re)cherchons". Ensuite, l'analyse sémantique assistée par ordinateur de ces corpus nous a permis d'identifier les références thématiques associées.

Le graphique ci-après nous donne l'évolution des 15 références thématiques les plus importantes au cours de ces trois dernières années 2011, 2012 et 2013. Les taux d'occurrence de ces références ont été calculées en fonction de la fréquence d'occurrence de "Je" et "Nous" dans chaque corpus de texte : soit 3345 occurrences pour le "corpus 2011", 3247 occurrences pour le "corpus 2012" et 3178 occurrences pour le "corpus 2013".

jeudi 6 février 2014

Valls versus Taubira dans la presse française en ligne

Pour ce premier article de mon blog, je vous propose une analyse "text mining" de ce que la presse quotidienne nationale (PQN) française en ligne (une douzaine retenue) donne à voir de deux grandes figures politiques françaises : Manuel Valls (ministre de l'intérieur) et Christiane Taubira (ministre de la justice, garde des sceaux).

Grâce à Google, j'ai constitué, à l'approchant si j'ose dire, deux corpus de textes regroupant les titres d'articles de la PQN française en ligne centrés d'une part sur Manuel Valls et d'autre part sur Christiane Taubira. Ces corpus couvrent pour chacun les années 2012 et 2013, du moins ce que Google permet d'en obtenir et c'est déjà beaucoup.

Les graphiques ci-après présentent la répartition des taux d'occurrence de références thématiques significatives dans le "corpus Valls" et dans le "corpus Taubira".