vendredi 25 juin 2021

Les tendances 2021 dans l’analyse de données textuelles

 


Edictalis annonce la sortie d'un nouvel outil d'analyse sémantique destiné au marché de l'analyse de données textuelles pour les grandes entreprises, mais aussi pour les PME, ceci afin de les aider à renforcer leur capacité à prendre des décisions avec des niveaux de précision et de pertinence plus élevés. 

La pandémie de COVID-19 a rendu les données historiques obsolètes et exige une accélération rapide dans la façon de traiter ses données, ce qui est désormais crucial pour la survie et la résilience des entreprises. Cela a conduit Gartner à prédire que 70 % des compagnies se détourneront des big data pour se concentrer sur les petites et grandes données d'ici 2025. Étant donné que 80 % des informations commerciales disponibles sont principalement des données textuelles non structurées, cette évolution nécessitera des ajustements importants pour les organisations de toutes tailles. Les entreprises devront traiter des données provenant de périodes plus courtes, mais aussi avec un contenu plus large. Cette nouvelle approche dans la façon de traiter les données permettra aux novices comme aux data scientists compétents de réaliser des analyses de texte par division, voire par département au niveau de l'organisation.

Les entreprises dont les ressources en programmation sont limitées peuvent faire appel à Edictalis pour bénéficier d’une nouvelle démarche dans la visualisation des résultats issus d'un système de catégorisation des données textuelles inégalé. Edictalis améliore également les niveaux d'interactivité grâce à de nouvelles fonctions permettant d'analyser la concurrence ainsi que la relation entre le texte non structuré et les données structurées, ce qui permet d'approfondir l'analyse du texte dans son ensemble.

Nous importons les données de diverses sources avec des fonctions de captage automatisées qui permettent de se concentrer sur les informations significatives. Outre l'importation directe à partir de MS Excel, MS Word, PDF, SPSS, Stata, des médias sociaux, des courriers électroniques et des plates-formes d'enquête en ligne, nous sommes également en mesure d'importer des transcriptions à partir des fichiers de sortie de type Factiva par exemple.

Afin de traiter le texte avec plus de précision, Edictalis dispose également d'un moteur de correction orthographique de dernière génération beaucoup plus rapide et plus précis. Cette fonctionnalité permet la correction automatique de l'orthographe à la volée, particulièrement utile pour l'analyse des médias sociaux et des données d'enquête sur le Web.

Il est également possible de créer des analyses personnalisées sur les données textuelles originales ou transformées, ou sur les résultats quantifiés obtenus par l'analyse de contenu de divers documents. Ce nouveau service offre des possibilités infinies pour étendre nos capacités d’analyse, comme la mise en œuvre de nouveaux algorithmes d'apprentissage automatique, de techniques avancées de modélisation statistique ou de transformation personnalisée des données. Des exemples de scripts sont ainsi inclus pour calculer les paramètres de lisibilité des textes, détecter les langues, appliquer d'autres techniques de modélisation thématique (LDA – Latent dirichlet allocation ou STM – structural topic model), ou créer des modèles prédictifs utilisant l'apprentissage automatique (SVM (Support Vector Machine, réseau neuronal, arbre de décision, etc.).

Auteur : Helen C. (Edictalis)

Aucun commentaire:

Enregistrer un commentaire