40 ZettaOctets, c’est gigantesque, cela représentera en 2020 environ 6 à 7 téraoctets (6 000 000 000 000 octets) par habitant sur l’ensemble de la planète. Et ce nombre est multiplié par 2 tous les 9 mois, ce qui veut dire qu’en 10 ans il sera multiplié par plus de 8 000.
Le plus important, est que plus de 75% de cette information est déstructurée et donc, comme nous l’avons vu, difficilement exploitable. C’est la raison pour laquelle toutes les grandes sociétés travaillent sur le Big-Data, la fouille de données et l’intelligence artificielle, Amazon, Google, Facebook, IBM et Microsoft. Apple, pour ne citer que les plus importantes. De très nombreuses START-UP dans le monde entier s’intéressent également à ce sujet.
Pourquoi tous ces très grands acteurs sont-ils présents dans ce domaine ? Comme nous l’avons déjà mentionné, la possibilité d’utiliser, d’exploiter ou d’enrichir ces données représente un enjeu crucial pour les entreprises. Chaque data non utilisée représente de l’argent qui dort. Restructurer donne une nouvelle vie à ces données et leur restitue toute la valeur qu’elles avaient au moment de la création des documents.
Les données qui dorment dans le fond de nos ordinateurs ou de nos unités de stockage sont très nombreuses, on peut mentionner entre autres :
- Les données présentes dans certaines bases de données, qui, en les reliant avec d’autres informations d’autres bases de données, peuvent représenter une très grande richesse. On parle, dans ce cas, de données semi-structurées
- Les données présentes sur le Net sont également des données semi-structurées
- Les photos, les images, les vidéos, les bandes audio, qui sont des données déstructurées.
- Les fichiers PDF, que nous avons déjà mentionnés, et qui sont présents dans tout l’univers de la bureautique.
- Les capteurs et les IoT qui enregistrent des quantités astronautiques de mesures.
Notre objectif est de restructurer des documents graphiques qui mélangent textes et dessins et qui ont été produits par des logiciels et stockés sous divers formats vectoriels :
- Plans de bâtiments
- Schémas hydrauliques, pneumatiques, électriques
- Schémas d’automatismes
- Schémas des processus industriels
- Schémas de voirie,
- Schémas mécaniques en 2 dimensions
- Notices de montage ou d’assemblage
- Gammes d’usinage
- Fiches méthodologiques