Deux cents soixante dix ! Eh oui, c'est bien 270 articles qui ont été publiés dans la section métier du blog de Makina Corpus depuis 2013. Quelles sont les thématiques et les technologies les plus traitées dans nos articles ? Sont-elles représentatives de nos activités au cours du temps ?
Nous nous sommes demandés si l'on pouvait observer une tendance similaire entre l'évolution des tags et de nos pratiques.
Tout au long de ces années, ce sont aussi des arrivées et des départs qui ont rythmé la vie du blog. Avons-nous des auteurices phares ? Est-ce que ce sont elleux qui portent la dynamique de publication ? Ou alors, est-ce que cela vient de la diversité des contributeur·trice·s ponctuel·les ? Autant de questions à explorer ici !
Une vue d'ensemble de tous les articles métiers du blog
Dans un premier temps, prenons un peu de recul et essayons d'avoir une vue d'ensemble de tous les articles publiés dans le blog métier. Voyageons au travers de quelques caractéristiques de ceux-ci avant d'étudier des tendances plus en détails.
Chaque article est représenté ici par un cercle. Sa taille et sa couleur sont fonction du nombre de caractères, c'est à dire de sa longeur. Vous pouvez voir le nom de l'article au survol et cliquer dessus pour le lire dans un autre onglet.
Voyons voir leur répartition au cours du temps. Nous avons un pic en 2016 et plusieurs fluctuations au cours des années dans la dynamique de publication.
Nous avons 6 tags prépondérants représentant les technologies citées, et une bonne partie d'articles plus génériques.
Si on regarde l'évolution de la longueur des articles au cours du temps, on voit une montée en puissance de 2013 à 2020.
Après cette première vue d'ensemble, allons voir un peu plus en détails ce que l'on peut apprendre de l'évolution des tags au cours du temps, puis de la dynamique de publication et du nombre d'auteur·e·s.
L'évolution des tags utilisés au cours du temps
Les articles écrits traitent d'une quinzaine de tags principaux qui peuvent correspondre à un thème particulier (SIG, projet, IA, front-end ...) ou à une technologie particulière (Python, Djando, Drupal ...).
Nous avons regroupé ici le nombre d'articles et la répartition de leur tag associé par mois pour les 6 tags prépondérants depuis 2013. Est-ce que l'on peut observer des tendances de répartitions des tags au cours du temps ?
Le tag le plus représenté est la catégorie SIG / Webmapping. Sa prépondérance a été la plus forte de 2013 à 2015 et plus récemment depuis fin 2019.
Viennent ensuite les articles traitant de Drupal. C'est un sujet qui revient régulièrement, quoiqu'un peu moins récemment depuis 2019.
La thématique de l'IA et de la Data Science fait sont entrée mi 2017 et se fraye un chemin depuis en représentant de plus en plus d'articles du blog.
La technologie Django est le 4e thème le plus représenté depuis 2013, mais relativement peu depuis fin 2016.
Nous avons ensuite les articles traitant de front-end qui sont assez réguliers depuis 2014.
C'est aussi le cas pour le sujet Python.
tous les articles
En choissant de faire le focus tag par tag, on a pu visualiser l'évolution de l'usage des tags principaux au cours du temps. Mais comme le volume d'articles par mois est assez fluctuant, essayons de mieux visualiser leur répartition relative en regroupant le total d'articles par catégorie et en la représentant comme pourcentage des articles écrits cette année là.
On retrouve globalement les évolutions citées plus haut. On voit encore mieux l'arrivée et la progression des sujet IA / Data Science au cours du temps ainsi que le retour des articles SIG / Webmapping depuis 2019. Deux thèmes sont des habitués : front-end et Python, on les retrouve plus ou moins au cours du temps mais toujours régulièrement. Concernant les technologies Django et Drupal, le pourcentage de leur représentation a tendance à diminuer au cours du temps, mais avec un retour de Django sur le devant de la scène en 2020.
Est-ce que ces tendances sont représentatives de l'évolution des sujets que l'on traite chez Makina Corpus ?
Cela dépend à la fois des personnes intéressées pour rédiger des articles ainsi que leur disponibilité. Nous allons voir dans le chapitre suivant que certain·e·s auteur·e·s ont leur sujet favoris. Quand ces personnes ne contribuent pas par manque de temps, on peut voir une baisse des articles publiés sur ce thème et pourtant nous travaillons toujours sur ce sujet. C'est le cas par exemple des sujets Django et SIG / Webmapping quit sont toujours au coeur de nos activités mais où nous avons eu relativement peu de contributeur·trice·s durant certaines certaines périodes. Pour les sujets IA / Data Science, la tendance observée est pour le coup une traduction assez fidèle de l'évolution des activités de Makina Corpus dans ce domaine, grâce à des personnes qui ont contribuées activement au blog en plus de leur activités.
Pour résumer, l'évolution des thèmes traités dans les articles de blog dépendent beaucoup de la disponibilités des auteur·e·s sur un sujet donnée.
La dynamique de publication et du nombre d'auteur·e·s
Nous avons vu que le nombre de personnes contribuant au blog est un élément important. Intéressons-nous à cet aspect de la vie du blog. Afin de dégager d'éventuelles tendances, nous allons ici compter les articles par contributeur·trice·s et par années.
Est-ce que le nombre de personnes évolue beaucoup au fil du temps ? As-t-on des personnes qui contribuent plus ? Sur les mêmes sujets ? Est-ce que les autres apportent plus de diversité dans les sujets traités ? Explorons cela ensemble.
D'abord, listons le nombre de personnes contribuant au blog par année. Un rectangle représente un·e auteur·e. C'est en 2016 que le plus grand nombre de personnes a contribué au blog.
Regardons ensuite comment les auteur·e·s ont contribués dans le temps. Plus un rectangle est foncé, plus le nombre d'articles écrits cette année est grand. Nous avons des contributeur·trice·s toujours présent·e·s depuis 2013 et d'autres qui se sont joins à l'aventure du blog à leur arrivée à Makina Corpus.
Quel est le top 5 des personnes ayant contribué au blog depuis 2013 ? On retrouve des auteurs contribuant chaque année ou presque depuis 2013, mais aussi d'autres qui ont écrit activement avant leur départ ou après leur arrivée.
Comptons maintenant le nombre d'auteur·e·s par année appartenant à ce top 5. Jusqu'à quatre d'entre eux ont contribué lors d'une même année (2019). C'est par contre en 2016 que le nombre d'autres d'auteur·e·s a été le plus important.
Année par année, découpons les auteur·e·s en groupe en fonction du nombre d'articles écrits.
Voyons groupe par groupe le nombre total d'articles écrits par an ainsi que le nombre de personnes uniques ayant contribuées depuis 2013.
Les cinq auteurs qui contribuent le plus sont en effet des fournisseurs conséquents d'articles avec 116 articles sur 270 écrits sur le blog. Le second groupe qui en apporte sont les 10 personnes ayant écrits entre 5 et 10 articles. Le nombre d'auteur·e·s par an a tendance à diminuer depuis 2016. À l'inverse, le nombre de personnes ayant écrit entre 2 et 4 articles par an augmente depuis.
Même si ce sont les cinq auteurs du top 5 qui ont produits le plus d'articles, on peut se demander si ce sont eux et / ou les autres qui apportent de la diversité au blog ? Est-ce les contributeur·trice·s ont des sujets favoris ou non ? Est-ce lié au nombre d'articles écrits ?
Par étudier cela, nous allons ici représenter l'ensemble des tags utilisés et analyser leur liens avec les différentes catégories d'auteur·e·s. Un lien représente le nombre de fois où la personne a écrit un article à ce sujet, son épaisseur va refléter cette importance.
Nos auteurs du top 5 se trouvent sur la gauche. On voit qu'ils ont traité presque tout les sujets à eux cinq depuis le lancement du blog, à part les thématiques mobile et dataviz.
Cependant, comme on considère ici toute la vie du blog depuis 2013, mettons de côté les tags pour lesquels l'auteur n'a écrit qu'une seule fois, pour mieux voir les thèmes majoritairement traités par ces cinq auteurs. Il y en a déjà moins qui sont représentés.
Pour les autres auteur·e·s, procédons par catégorie. À propos de quoi écrivent les personnes qui ont écrit un seul article ?
Et les contributeur·trice·s ponctuel·le·s, entre deux et cinq articles ?
Comme pour les cas précédents, on voit que les auteur·e·s ayant écrit plus de 5 articles contribuent grandement à la diversité des thématiques traités dans le blog.
Regardons aussi quels sont les personnes qui ont écrit plus de 50% de leurs contributions sur le même sujet (pour celles·ceux qui ont écrit plus de quatre articles), ce sont majoritairement les plus grand·e·s contributeur·trice·s que ce soit dans le top 5 ou non.
Nous avons vu ici que les auteurs du top 5 apportent effectivement beaucoup d'articles, mais que les autres contributeurs et contributrices apportent aussi beaucoup de diversité dans les sujets traités.
Il est aussi intéressant de voir que plusieurs auteur·e·s ont des thèmes de prédilections et c'est particulièrement le cas pour les personnes qui contribuent beaucoup. Quatres auteurs du top 5 ont écrit plus de 50% de leurs articles sur le même sujet (deux personnes alimentent le thème SIG / Webmapping, une personne le sujet drupal et l'autre django). Nous avons aussi 6 personnes parmis les 13 ayants écrits au moins cinqs articles qui ont aussi un thème favori.
Les limites de l'exercice
Nous avons ici choisit d'explorer visuellement les articles publiés entre 2013 et 2020 sur notre blog métier. Nous avons pu décrire plusieurs aspects de nos publications mais nous avons vu que cela ne retranscrit pas forcément telle quelle l'activité de Makina Corpus sur les sujets traités. La dynamique du blog est forement liée aux auteur·e·s qui le font vivre.
Nous avons aussi fait des choix de présentation et de graphiques qui permettent de mettre en avant certains aspects des données, mais d'autres choix auraient pu être fait pour mettre en avant d'autres aspects des tendances observées ou les expliquer différement. Vous pourrez retrouver dans la section Méthodologie un peu plus de détail sur le processus et les technologies utilisées.
Nous vous invitons à retrouvez tous les articles du blog de Makina Corpus !