{"id":353957,"date":"2021-04-06T14:46:00","date_gmt":"2021-04-06T18:46:00","guid":{"rendered":"https:\/\/www.cia-ica.ca\/news\/analytique-du-texte-etude-du-cas-de-twitter\/"},"modified":"2024-10-02T09:08:36","modified_gmt":"2024-10-02T13:08:36","slug":"analytique-du-texte-etude-du-cas-de-twitter","status":"publish","type":"news","link":"https:\/\/www.cia-ica.ca\/fr\/news\/analytique-du-texte-etude-du-cas-de-twitter\/","title":{"rendered":"Analytique du texte : \u00e9tude du cas de Twitter"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><em><strong>Par Harrison Jones, ASA<\/strong><\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La disponibilit\u00e9 croissante des m\u00e9gadonn\u00e9es et le recours \u00e0 l\u2019analyse pr\u00e9dictive sont en train de changer le mode de fonctionnement des assureurs et des actuaires. Dans bien des cas, la question de savoir comment exploiter cette mati\u00e8re premi\u00e8re complexe est devenue un d\u00e9fi organisationnel important.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Dans un contexte o\u00f9 les entreprises font face \u00e0 des pressions concurrentielles croissantes, l\u2019exploitation judicieuse des donn\u00e9es et la reconnaissance de leur importance constituent un avantage de premier ordre.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Obtenir de l\u2019information par l\u2019interm\u00e9diaire des m\u00e9dias sociaux<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Les plateformes de m\u00e9dias sociaux telles que Twitter, Facebook et Instagram sont utilis\u00e9es partout dans le monde \u00e0 plusieurs fins. Ce ph\u00e9nom\u00e8ne a pour effet secondaire de fournir d\u2019importantes quantit\u00e9s de donn\u00e9es \u00e0 analyser.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Pour illustrer la fa\u00e7on d\u2019utiliser ces donn\u00e9es, nous avons \u00e9tudi\u00e9 l\u2019exemple du fil Twitter anglais de l\u2019ICA pour montrer la mesure dans laquelle l\u2019analytique du texte la plus basique peut fournir des renseignements utiles. On a extrait tous les tweets de <a href=\"https:\/\/twitter.com\/CIA_Actuaries\" data-type=\"URL\" data-id=\"https:\/\/twitter.com\/CIA_Actuaries\" target=\"_blank\" rel=\"noreferrer noopener\">@CIA_Actuaries<\/a> au moyen du paquetage rtweet R, puis les avons analys\u00e9s au moyen des paquetages dplyr, ggplot2 et quanteda.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Avertissement : cet article n\u2019aborde pas l\u2019utilisation \u00e9thique des donn\u00e9es, mais cet \u00e9l\u00e9ment devrait assur\u00e9ment \u00eatre pris en consid\u00e9ration par les entreprises qui choisissent d\u2019exploiter des sources de donn\u00e9es publiques ou priv\u00e9es, y compris des donn\u00e9es provenant de Twitter.<\/em><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Fr\u00e9quence de publication<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Le 24 f\u00e9vrier 2012, @CIA_Actuaries a publi\u00e9 son tout premier tweet qui se lisait \u00ab @ICA_Actuaires Welcome to Twitter! \u00bb, souhaitant ainsi la bienvenue \u00e0 son \u00e9quivalent fran\u00e7ais. Depuis ce temps, soit au 1er mars 2021, @ICA_Actuaries a publi\u00e9 2 801 autres tweets. La figure 1 montre le nombre de tweets publi\u00e9s selon l\u2019ann\u00e9e et le mois.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 1 : Nombre de tweets de @CIA_Actuaries selon l\u2019ann\u00e9e et le mois<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-1.png\" alt=\"\" class=\"wp-image-600\"\/><\/figure><\/div>\n\n\n\n<p class=\"wp-block-paragraph\">Le nombre de tweets par ann\u00e9e affiche une courbe croissante et atteint un sommet en 2019, puis une chute marqu\u00e9e en 2020. La COVID-19 pourrait avoir jou\u00e9 un r\u00f4le dans la diminution de la fr\u00e9quence de publication en 2020, s\u2019ajoutant aux changements apport\u00e9s \u00e0 la strat\u00e9gie de l\u2019Institut relative aux m\u00e9dias sociaux. Dans le premier mois de 2021, @CIA_Actuaries a publi\u00e9 30 tweets (soit un nombre annualis\u00e9 de 180), ce qui indique que la tendance vers une fr\u00e9quence plus faible devrait se poursuivre.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L\u2019examen de mois en mois r\u00e9v\u00e8le une baisse de l\u2019activit\u00e9 au mois de d\u00e9cembre et pendant les mois d\u2019\u00e9t\u00e9, ce qui est logique puisque ceux-ci co\u00efncident avec les vacances et les F\u00eates. On observe \u00e9galement une augmentation consid\u00e9rable de la fr\u00e9quence de publication en juin, ce qui s\u2019explique du fait que le congr\u00e8s annuel de l\u2019ICA se tient habituellement en juin.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Partages de tweets<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">De toutes les publications de @CIA_Actuaries, 1 230 ont fait l\u2019objet de partages (moins de la moiti\u00e9 des publications). Par ailleurs, les publications partag\u00e9es l\u2019ont \u00e9t\u00e9 en moyenne 24 fois, ce qui est particuli\u00e8rement \u00e9lev\u00e9. Deux tweets font augmenter la moyenne : tous les deux publi\u00e9s lors de la journ\u00e9e Bell cause pour la cause, dans le cadre de laquelle les dons sont fond\u00e9s sur le nombre de publications et de partages. Outre ces deux valeurs hors normes, il serait int\u00e9ressant pour l\u2019\u00e9quipe de l\u2019ICA de d\u00e9terminer quels sont les tweets qui sont partag\u00e9s et pourquoi.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 2 : Nombre de partages par publication de @CIA_Actuaries<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-2.png\" alt=\"\" class=\"wp-image-601\"\/><\/figure><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Fr\u00e9quence des mots-clics<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La figure 3 pr\u00e9sente les mots-clics que @CIA_Actuaries utilise le plus souvent. Sans surprise, les deux mots-clics les plus courants sont #actuary et #actuaries. Autres tendances int\u00e9ressantes observ\u00e9es :<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>#pension est utilis\u00e9 plus souvent que #insurance, et trois des mots-clics les plus fr\u00e9quents semblent se rapporter \u00e0 l\u2019actuariat relatif aux r\u00e9gimes de retraite (#pension, #cpp et #retirement).<\/li><li>#toronto est le mot-clic le plus courant concernant les villes.<\/li><li>#climatechange et #bigdata, qui se rapportent \u00e0 des domaines en \u00e9mergence, sont au nombre de 25 mots-clics les plus fr\u00e9quents.<\/li><\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 3 : Les 25 mots-clics les plus souvent utilis\u00e9s par @CIA_Actuaries<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-3.png\" alt=\"\" class=\"wp-image-602\"\/><\/figure><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Nuages de mots-cl\u00e9s<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Les figures 4 et 5 pr\u00e9sentent les mots (qui ne sont pas des mots-clics) utilis\u00e9s le plus couramment par @CIA_Actuaries. Les nuages de mots-cl\u00e9s montrent que les mots qui ne sont pas des mots-clics utilis\u00e9s sont tr\u00e8s semblables aux mots-clics utilis\u00e9s. Par exemple, #actuary et \u00ab actuarial \u00bb. Il est \u00e9galement \u00e9vident que @CIA_Actuaries fait r\u00e9f\u00e9rence \u00e0 d\u2019autres organismes dans ses tweets (p. ex, SOA, ASNA).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 4 : Mots les plus couramment utilis\u00e9s par @CIA_Actuaries<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-4.png\" alt=\"\" class=\"wp-image-603\"\/><\/figure><\/div>\n\n\n\n<p class=\"wp-block-paragraph\">La figure 5 est divis\u00e9e selon les mots les plus courants dans les publications partag\u00e9es (en bleu p\u00e2le) et les mots les plus courants dans les publications qui ne sont pas partag\u00e9es (en bleu fonc\u00e9). La tendance la plus \u00e9vidente observ\u00e9e indique que les mots \u00ab job \u00bb, \u00ab posting \u00bb et \u00ab bank \u00bb (peut-\u00eatre pour faire r\u00e9f\u00e9rence aux \u00ab banques \u00bb d\u2019emploi) ne font souvent l\u2019objet d\u2019aucun partage.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 5 : Mots les plus couramment utilis\u00e9s par @CIA_Actuaries selon les publications partag\u00e9es et non partag\u00e9es<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-5.png\" alt=\"\" class=\"wp-image-604\"\/><\/figure><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Sentiments<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La technique d\u2019analyse de sentiments consiste \u00e0 attribuer une note \u00e0 un groupe de mots, par exemple un tweet, et sert \u00e0 d\u00e9terminer si celui-ci est plut\u00f4t positif ou n\u00e9gatif. Par exemple, la phrase \u00ab Les r\u00e9gimes de retraite aident les Canadiens \u00bb d\u00e9gage un sentiment positif. La phrase \u00ab Les r\u00e9gimes de retraite n\u2019aident pas les Canadiens \u00bb d\u00e9gage un sentiment n\u00e9gatif.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">On recourt au <em>Lexicoder Sentiment Dictionary<\/em> pour d\u00e9finir le sentiment rattach\u00e9 aux mots dans tous les tweets de @CIA_Actuaries. On compte ensuite pour chaque mois le nombre de mots positifs et n\u00e9gatifs. Les r\u00e9sultats sont pr\u00e9sent\u00e9s aux figures 6 et 7.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 6 : Note relative au sentiment pour @CIA_Actuaries par mois<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-6.png\" alt=\"\" class=\"wp-image-605\"\/><\/figure><\/div>\n\n\n\n<p class=\"wp-block-paragraph\">En r\u00e8gle g\u00e9n\u00e9rale, les textes publi\u00e9s par @CIA_Actuaries sont plut\u00f4t positifs. On n\u2019observe que quelques mois o\u00f9 le sentiment est n\u00e9gatif, mais la note est plut\u00f4t faible.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Figure 7 : Compte des mots positifs et n\u00e9gatifs pour @CIA_Actuaries par mois<\/strong><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/www.cia-ica.ca\/app\/uploads\/2024\/10\/FR-Pic-7.png\" alt=\"\" class=\"wp-image-606\"\/><\/figure><\/div>\n\n\n\n<p class=\"wp-block-paragraph\">La figure 7 montre les m\u00eames r\u00e9sultats que la figure 6, mais sous une forme diff\u00e9rente. Dans la figure 6, la note relative au sentiment \u00e9quivaut au compte de mots positifs dont on a soustrait le compte de mots n\u00e9gatifs.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">En conclusion<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Ce petit ensemble de donn\u00e9es nous permet :<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>De d\u00e9terminer le sentiment qui se d\u00e9gage des tweets de l\u2019Institut (et les tendances \u00e0 cet \u00e9gard au fil du temps) \u00e0 l\u2019\u00e9gard de certains sujets ou enjeux;<\/li><li>D\u2019\u00e9valuer l\u2019accueil que re\u00e7oivent les mots-clics souvent utilis\u00e9s de la part de l\u2019auditoire;<\/li><li>De d\u00e9terminer si certains mots ou mots-clics d\u00e9clenchent des r\u00e9actions positives ou virales chez les abonn\u00e9s.<\/li><\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">L\u2019exemple de @CIA_Actuaries est un exercice productif. Bien qu\u2019il ne vise pas \u00e0 apporter une valeur particuli\u00e8re \u00e0 la profession actuarielle, il montre ce que les m\u00e9dias sociaux sont en mesure de nous apprendre. Les soci\u00e9t\u00e9s d\u2019assurance pourraient \u00e9galement tirer profit d\u2019une telle d\u00e9marche.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La possibilit\u00e9 de recueillir, de quantifier et d\u2019analyser les donn\u00e9es de mani\u00e8re utile contribue \u00e0 pr\u00e9dire plus efficacement les r\u00e9sultats et d\u2019exercer plus rapidement un jugement plus judicieux et pratique. Alors que les donn\u00e9es deviennent un moteur de croissance \u00e9conomique essentiel, les m\u00e9dias sociaux, qui n\u2019ont d\u00e9j\u00e0 \u00e9t\u00e9 qu\u2019une vague id\u00e9e secondaire pour stimuler les affaires, offrent aujourd\u2019hui une mine de possibilit\u00e9s.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Autres lectures<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>package quanteda R : <a rel=\"noreferrer noopener\" href=\"https:\/\/tutorials.quanteda.io\/\" target=\"_blank\">https:\/\/tutorials.quanteda.io\/<\/a><\/li><li>Package rtweet R : <a rel=\"noreferrer noopener\" href=\"https:\/\/github.com\/ropensci\/rtweet\" target=\"_blank\">https:\/\/github.com\/ropensci\/rtweet<\/a><\/li><li>R for Data Science : <a rel=\"noreferrer noopener\" href=\"https:\/\/r4ds.had.co.nz\/\" target=\"_blank\">https:\/\/r4ds.had.co.nz\/<\/a><\/li><\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>N\u2019oubliez pas de garder le contact avec l\u2019ICA sur les r\u00e9seaux sociaux!<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a rel=\"noreferrer noopener\" href=\"https:\/\/www.facebook.com\/CanadianInstituteofActuaries\" data-type=\"URL\" data-id=\"https:\/\/www.facebook.com\/CanadianInstituteofActuaries\" target=\"_blank\">Facebook<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/www.linkedin.com\/company\/canadian-institute-of-actuaries\" data-type=\"URL\" data-id=\"https:\/\/www.linkedin.com\/company\/canadian-institute-of-actuaries\" target=\"_blank\">LinkedIn<\/a><\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/twitter.com\/CIA_Actuaries\" data-type=\"URL\" data-id=\"https:\/\/twitter.com\/CIA_Actuaries\" target=\"_blank\">Twitter<\/a> (en anglais)<\/li><li><a rel=\"noreferrer noopener\" href=\"https:\/\/twitter.com\/ICA_Actuaires\" data-type=\"URL\" data-id=\"https:\/\/twitter.com\/ICA_Actuaires\" target=\"_blank\">Twitter<\/a> (en fran\u00e7ais)<\/li><\/ul>\n\n\n","protected":false},"excerpt":{"rendered":"<p>Par Harrison Jones, ASA La disponibilit\u00e9 croissante des m\u00e9gadonn\u00e9es et le recours \u00e0 l\u2019analyse pr\u00e9dictive sont en train de changer le mode de fonctionnement des assureurs et des actuaires. Dans bien des cas, la question de savoir comment exploiter cette [&hellip;]<\/p>\n","protected":false},"author":23333,"featured_media":352416,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false,"wicket_organization":""},"news-category":[308],"news-topic":[293],"class_list":["post-353957","news","type-news","status-publish","has-post-thumbnail","hentry","news-category-articles-fr","news-topic-science-des-onnees"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/news\/353957","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/news"}],"about":[{"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/types\/news"}],"author":[{"embeddable":true,"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/users\/23333"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/media\/352416"}],"wp:attachment":[{"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/media?parent=353957"}],"wp:term":[{"taxonomy":"news-category","embeddable":true,"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/news-category?post=353957"},{"taxonomy":"news-topic","embeddable":true,"href":"https:\/\/www.cia-ica.ca\/fr\/wp-json\/wp\/v2\/news-topic?post=353957"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}