guide-format-et-fichier-informatique
Ordinateur

Types et formats de fichiers : un guide complet

Grâce aux fichiers, les logiciels peuvent avoir des configurations, traiter des informations, stocker des données, etc. Nous utilisons tous quotidiennement une multitude de fichiers de toutes sortes (textes, vidéos, images, binaires exécutables,…). C’est pourquoi, vu leur importance, nous allons consacrer cet article à montrer les types de fichiers et les différences de format et d’extension.

Qu’est-ce qu’un fichier ?

Lorsqu’on parle de fichier ou de fichier informatique, on fait référence à une séquence d’octets d’information qui sont stockés dans un certain type de mémoire, comme un support de stockage secondaire, un CD/DVD, une mémoire USB, une carte SD, etc.

De plus, ces fichiers seront organisés sur un système de fichiers, c’est-à-dire ce que nous appelons des formats (NTFS, ext4, HFS,…). Parallèlement, nous pouvons également disposer de dossiers ou de répertoires dans lesquels les fichiers peuvent être regroupés si nous le souhaitons, ce qui permet de maintenir l’information plus ordonnée et organisée.

Un répertoire ou un dossier n’est pas un fichier, mais un conteneur virtuel. Il peut être considéré comme un fichier spécial qui peut contenir des fichiers ainsi que d’autres dossiers ou sous-répertoires.

Les fichiers possèdent également une série d’éléments de base, tels que le nom du fichier qui l’identifie, l’extension qui identifie le format (par exemple : .jpg, .avi, .zip, .c), les métadonnées (date de création, date de modification, propriétaire, tailles…) et le contenu du fichier lui-même (les octets qui contiennent l’information en tant que telle et qui peuvent représenter du texte, des données binaires,…).

Opérations sur les fichiers

Différentes opérations peuvent être effectuées sur les fichiers, par exemple

  • Créer : les fichiers peuvent être créés par un utilisateur ou par un logiciel. Pour ce faire, un appel système est utilisé, tel que creat().
  • Ouvrir : les fichiers peuvent être ouverts pour accéder aux informations qu’ils contiennent, soit pour les lire, soit pour y écrire. Cela nécessite également un appel système tel que open().
  • Fermer : une fois qu’il n’est plus nécessaire, vous pouvez également fermer le fichier. L’appel système close() est utilisé à cet effet.
  • Modification : comme je l’ai dit, vous pouvez également écrire dans le fichier pour modifier son contenu, ses données, etc.

Types de fichiers

Les fichiers peuvent être classés en fonction de leur contenu ou de leur objectif. Par exemple, voici quelques-uns des types existants :

  • Texte : ce type de fichier contient, comme son nom l’indique, du texte. Il peut s’agir de texte brut ou de texte binaire. Ces fichiers peuvent également contenir, par exemple, le code source, qui est également un fichier texte brut à compiler ou à interpréter, en fonction de la langue.
  • Données : elles contiennent les données d’entrée et de sortie utilisées par les programmes pour le traitement. Les bases de données, qui sont une hiérarchie d’objets ou d’informations ordonnées, peuvent également être incluses dans ce groupe. Il peut même y avoir des fichiers de données appartenant au système d’exploitation lui-même, comme certains fichiers de pilotes, des bibliothèques partagées, etc.
  • Audio : bien entendu, il existe également des fichiers audio, qui contiennent les octets nécessaires à la lecture d’un son.
  • Vidéo : il existe également des fichiers vidéo, qui peuvent être une séquence d’images accompagnées ou non de son.
  • Image
    • Image 3D : contient des images modélisées sous une forme tridimensionnelle.
    • Image matricielle ou bitmap : les images matricielles sont celles qui sont composées d’une série de pixels, avec des couleurs définies pour chacun de ces pixels.
    • Image vectorielle : les images vectorielles sont composées d’objets géométriques dépendants et d’attributs qui définissent leurs propriétés.
  • Exécutable : un type de fichier au format binaire qui contient des instructions et des données définissant un programme. Il peut ainsi être chargé dans la mémoire RAM pour être traité par l’unité centrale. Ce type de fichier peut également contenir d’autres fichiers similaires, bien qu’ils soient généralement plus petits et utilisés par les programmes exécutables, tels que des plugins ou des modules capables d’étendre les capacités de ces programmes.
  • Web : ils contiennent du code pour la création de pages web ou d’applications web, et peuvent être traités par les navigateurs web.
  • Archive : il s’agit de fichiers ou d’ensembles de fichiers qui sont regroupés en un seul fichier. Par exemple, il peut s’agir de tarballs de sauvegarde, d’images de disque, d’instantanés, etc.
  • Chiffré: il s’agit de fichiers qui contiennent un format chiffré ou qui ont été chiffrés afin d’empêcher l’accès au contenu par des tiers non autorisés.
  • Autres : il peut y avoir d’autres types de fichiers, mais les plus connus sont ceux mentionnés ci-dessus.

Formats de fichiers

Parmi les types de fichiers, il existe également différents formats de fichiers. Le format est généralement identifié par une extension de 3 caractères pour les anciens systèmes FAT et les systèmes DOS, ou de plus de 3 caractères tolérés par les systèmes de fichiers et les systèmes d’exploitation actuels. Par exemple, il existe des extensions telles que .jpg, .html, .db, etc.

Grâce aux formats, il est possible d’identifier le type particulier d’informations que les types de fichiers stockent. Par exemple, nous pouvons avoir un format .png ou un format .jpg. Tous deux sont des images, mais ils sont différents. Par exemple, alors que le format .png peut stocker des transparences, le format .jpg ne le peut pas. Cela dépend de la manière dont l’information est codée pour stocker ces données.

Il existe des formats propriétaires, créés par des entreprises et dont le système d’encodage est secret, bien qu’il soit possible de rétroconcevoir des logiciels pour prendre en charge ces formats. Enfin, il existe des formats de fichiers ouverts.

Par exemple, si vous voulez voir quelques formats correspondant aux types de fichiers décrits ci-dessus, nous en avons :

  • Texte : .txt, .docx, .odt, .rtf, .c, .js, .vhdl, .cpp,…
  • Données : .csv, .ppt, .pdf, .xml, .pct, .sql, .db, .mdb, .fnt, .fon, .ttf, .sys, .dll, .a, .ink, msi, .ics,…
  • Audio : .mp3, .ogg, .m4a, .wav,…
  • Vidéo : .flv, .mp4, .avi, .mpg, .mkv, …
  • Image :
    • Image 3D : .obj, .3dm, .max, …
    • Image matricielle ou bitmap : .bmp, .png, .tiff, .psd, .jpg, .gif, …
    • Image vectorielle : .ai, .svg, .spg, .eps,…
  • Exécutable : .apk, .rom, .gam, .exe, .jar, …
  • Web : .html, .php, .aspx, …
  • Archivé : .zip, .rar, .zx, .7z, .gz, .bz2, .tmp, .tar, .bak, .tape, .dmg, .iso, .mdf, …
  • Crypté/chiffré : .hgx, .mim, .uue, .cypher, .cyp, .gpg, .axx, .key, .cha, .kdbx, .epm, …

Comment un format est-il identifié ?

Les formats de fichiers doivent être identifiés afin de savoir avec quel programme ils peuvent être ouverts ou comment ils peuvent être traités. Selon le système d’exploitation, cela peut se faire d’une manière ou d’une autre. Voici les méthodes les plus courantes :

  • Extension : l’extension qui accompagne le nom du fichier peut être utilisée par les systèmes d’exploitation pour identifier de quel type de fichier il s’agit. Par exemple, Windows, DOS et d’autres systèmes peuvent utiliser l’extension comme identifiant. Mais cela pose des problèmes, car si l’extension est modifiée, elle peut être interprétée comme un autre type de fichier.
  • Métadonnées : certains systèmes peuvent également utiliser des métadonnées internes pour identifier le fichier.
  • En-tête : l’en-tête peut également être lu par le système pour tenter d’identifier le format.
  • Magic number : cette méthode utilisée par les systèmes Unix ou Unix Like, tels que Linux, utilise un identifiant stocké dans le fichier lui-même. Il s’agit généralement de 2 octets d’information au début du fichier. Par exemple, il peut s’agir d’un code, d’une balise ou de tout autre chose.
  • Type codes : macOS peut également utiliser certains codes stockés dans le système de fichiers pour identifier les formats. Ces codes sont connus sous le nom de OSTypes et se présentent sous la forme d’une séquence de 4 octets.
  • UTI (Uniform Type Identify) : il s’agit d’un identifiant utilisé dans macOS pour remplacer la méthode précédente.
  • Attributs étendus : certains systèmes, comme IBM OS/2, utilisaient également des attributs étendus pour identifier les formats, comme .TYPE.
  • Type MIME : il s’agit d’une autre manière d’identifier les formats, en particulier sur Internet. Il est utilisé par les navigateurs web, ainsi que par des systèmes tels que AmigaOS, BeOS, MorphOS, Unix et Unix-like, etc.
  • Autres : il existe également d’autres formes moins courantes, telles que PUI, FFID, l’identification basée sur le contenu, etc.

Conversion entre formats et types de fichiers

Enfin, je suis sûr que beaucoup d’entre vous se demandent s’il est possible de convertir des formats ou de remplacer un type de fichier par un autre. Voici les réponses :

  • Conversion entre types : la conversion d’un format à un autre n’a pas beaucoup de sens. Il n’est généralement pas possible de convertir un type de fichier en un autre, car il n’est pas logique de convertir un fichier vidéo en fichier texte, par exemple. Il ne serait pas non plus judicieux de convertir un fichier binaire exécutable en un fichier image. Toutefois, dans certains cas, il est possible de convertir un type de fichier en un autre, et cela a du sens. Par exemple, imaginez la conversion d’un fichier de type vidéo en un fichier de type audio, car vous souhaitez convertir un clip vidéo d’une chanson en un fichier uniquement musical pour la lecture. Un autre exemple serait la conversion d’un fichier .jpg en un document PDF, c’est-à-dire d’une image en un fichier de données.
  • Conversion entre formats : cet autre cas n’est pas aussi limité que le précédent, mais il y a aussi certaines limites. Par exemple, nous pouvons convertir un .png qui est habituellement plus lourd en .jpg afin de réduire sa taille pour le télécharger sur un site web. Ou nous pouvons convertir un .avi en .mp4 pour passer d’un codec à l’autre afin que la vidéo puisse être lue sur un lecteur ou un appareil qui ne prend pas en charge le format .avi. Ou peut-être pouvons-nous convertir un .docx en .odt pour utiliser le format natif des suites bureautiques gratuites ou d’autres logiciels alternatifs…

Dans les deux cas, un logiciel de conversion est généralement nécessaire pour passer d’un type ou d’un format à l’autre.

Laisser un commentaire