Comment choisir le bon format de fichier pour l'eDiscovery ? (PDF, natif, etc.)
À retenir : l’idéal est de disposer d’une production eDiscovery native à partir de fichiers de chargement. Sinon, une production à partir de fichiers de chargement PDF est également une bonne idée. Vous avez encore d’autres options, mais elles ne sont pas idéales.
Les formats de fichiers sont importants pour l’eDiscovery, et voici comment choisir celui qui vous convient le mieux.
Naviguer dans les processus d’eDiscovery signifie prendre des décisions importantes concernant le format de fichier à utiliser. Choisir le bon format rend le processus plus efficace et précis, garantissant que les données vitales soient accessibles et significatives. Voici donc un guide étape par étape pour vous aider à sélectionner le bon format de eDiscovery.
Tout d’abord, comprenez vos options de format de fichier.
Comprendre vos options de format de fichier est crucial pour l’eDiscovery, car différents formats ont leurs propres avantages, limitations et cas d’utilisation. Voici ce que cela signifie pour l’eDiscovery au quotidien.
a. Fichiers natifs.
Les fichiers natifs sont des fichiers dans leur format d’origine, comme .docx pour Word ou .xlsx pour Excel. Ils sont excellents car ils conservent tous les métadonnées (ce qui peut être crucial pour les affaires juridiques), Ils sont excellents car ils conservent tous les métadonnées (ce qui peut être crucial pour les affaires juridiques), conservent le contenu intégré comme les hyperliens et les fichiers intégrés, et sont faciles à indexer et à rechercher (à l’aide d’un moteur de recherche eDiscovery). Mais ils présentent également des inconvénients. Par exemple, vous aurez probablement besoin du logiciel « parent » d’origine pour ouvrir les fichiers natifs (par exemple, vous aurez besoin de Microsoft Word pour ouvrir les fichiers .docx). De plus, la mise en page de vos documents peut changer s’ils sont dans leur forme native et que vous les affichez sur différents appareils et versions de logiciels.
b. Fichiers TIFF.
Les fichiers TIFF sont un format graphique raster qui permet de stocker plusieurs images, y compris des documents multi-pages. (Un graphique raster est constitué de minuscules pixels de taille uniforme disposés dans une grille de colonnes et de lignes.) Les fichiers TIFF sont intéressants car ils ont la même apparence sur tous les appareils, peuvent être facilement annotés et « aplatissent » les images pour minimiser le risque de négliger des données cachées. (Les applications graphiques haut de gamme comme Photoshop proposent un format de fichier multicouches pour que vous puissiez manipuler chaque couche indépendamment. Les fichiers TIFF « aplatissent » ces multiples couches en un seul équivalent facilement partageable.) Mais les tiffs ont aussi leurs faiblesses. Par exemple, vous ne pouvez pas rechercher leur contenu (en utilisant un moteur de recherche Ediscovery) à moins qu’ils aient un fichier texte associé. De plus, comme il s’agit d’« images » d’un document, vous ne pouvez pas interagir avec une image TIFF (par exemple, la mettre en surbrillance) comme vous le feriez avec le document d’origine. De plus, les fichiers TIFF occupent beaucoup d’espace par rapport aux autres formats d’image.
c. Fichiers PDF.
Les PDF sont un format de partage de fichiers qui fige la mise en page de tout document source. Cela signifie que la mise en page d’un PDF reste la même même si vous y accédez sur un autre ordinateur avec de nouveaux paramètres. Vous pouvez également rechercher des mots-clés dans un PDF et protéger son contenu par mot de passe. Le principal inconvénient des PDF est que vous risquez de perdre certaines métadonnées lors de la conversion d’un fichier natif en PDF. Et le contenu « dynamique » comme les formules Excel devient « statique » (c’est-à-dire inchangeable et non réactif) dans un PDF. De plus, les PDF occupent souvent plus d’espace que les fichiers texte classiques.
d. Fichiers PST et OST.
Les PST (Personal Storage Tables) et OST (Offline Storage Tables) sont des formats de stockage d’e-mails utilisés par Microsoft Outlook. Les PST (Personal Storage Tables) et les OST (Offline Storage Tables) sont des formats de stockage de courrier électronique utilisés par Microsoft Outlook. Ils sont excellents car ils conservent la structure hiérarchique d’origine des e-mails et des dossiers dans une boîte de réception. En plus de stocker des e-mails, ils stockent également des pièces jointes, des carnets d’adresses, des événements de calendrier, et plus encore. Le principal problème avec eux est leur facilité de corruption à mesure qu’ils deviennent plus volumineux. De plus, vous aurez besoin d’un logiciel propriétaire spécialisé (par exemple, Microsoft Outlook) pour les afficher. Néanmoins, ils sont utiles si votre cas est un cas où vous devez consulter des fils de discussion et des pièces jointes complets.
Une fois que vous avez examiné vos options de format de fichier, déterminez vos priorités.
Le type de format de fichier que vous choisissez dépendra de ce que vous voulez qu’il fasse pour vous. C’est-à-dire que vous devrez définir vos priorités. En voici quelques-unes à considérer.
a. Capacité de recherche.
Avec quelle rapidité et quelle efficacité souhaitez-vous pouvoir rechercher le contenu et les métadonnées d’un fichier? Si c’est une priorité, choisissez un format qui permet de faire des recherches de manière inhérente ou qui peut être rendu possible grâce à d’autres logiciels facilement disponibles.
b. Conservation des métadonnées.
Si votre cas dépend de détails tels que les horodatages ou la géolocalisation, sélectionnez un format qui ne compromet pas les métadonnées.
c. Accessibilité.
Vous allez collaborer régulièrement avec une équipe ? Si tel est le cas, vous aurez besoin d’un format facilement accessible. Idéalement, un format « ouvert » (non lié à un logiciel propriétaire) avec une large compatibilité.
d. Taille et stockage.
Envisagez les coûts de stockage et l’efficacité. Certains formats, bien que supérieurs à d’autres égards, pourraient être plus volumineux et moins optimaux pour le stockage.
e. Sécurité.
Compte tenu des préoccupations croissantes concernant les violations de données, vous souhaiterez peut-être un format avec cryptage, protection contre les logiciels malveillants et compatibilité avec les outils DRM.
f. Durabilité.
Parfois, vous devrez donner la priorité aux formats qui peuvent résister à l’épreuve du temps, en tenant compte de facteurs tels que le taux d’adoption (c’est-à-dire la popularité d’un logiciel) et la rétrocompatibilité (c’est-à-dire si un format fonctionne avec les logiciels existants).
g. Apparence.
Si maintenir la mise en page et l’apparence d’origine d’un document est crucial, sélectionnez un format qui reste cohérent sur différentes plateformes.
Faites maintenant correspondre ces besoins avec vos options de format de fichier. Pour l’eDiscovery, voici ce que nous suggérons.
Nous recommandons les formats suivants à nos clients, classés par ordre de préférence décroissante :
Idéalement, vous voulez une production de fichiers de charge natifs pour eDiscovery.
Les formats natifs sont excellents car ils protègent plus de métadonnées que les autres formats. Par conséquent, lorsque vous recevez des productions, demandez-les au format natif, dans la mesure du possible. Idéalement, ces productions natives devraient être accompagnées d’un fichier de charge, qui aide votre logiciel à organiser systématiquement les données dans une base de données sous-jacente.
Si les fichiers natifs ne sont pas disponibles, votre meilleure option est une production de fichier de charge PDF.
Les fichiers PDF de charge gagnent du terrain en tant que normes du industrielles, il ne sera donc pas inhabituel de les demander. Cependant, insistez sur le fait que ces PDF sont des documents individuels plutôt qu’un seul PDF massif de tous les documents de l’affaire. (Cette approche PDF consolidée rend les révisions beaucoup plus compliquées. Pensez au temps que vous perdrez si la recherche de mots-clés dans un seul document signifie devoir rechercher, par défaut, tous les autres documents contenus dans ce PDF !)
Si vous ne pouvez pas obtenir de fichiers PDF, demandez une production de fichiers de charge TIFF.
Le format TIFF n’a pas été mis à jour depuis 1992, mais il est toujours utilisable. Cependant, sachez que les productions TIFF peuvent présenter des vulnérabilités de sécurité, une résolution numérique réduite, et ne sont pas aussi riches en fonctionnalités que les fichiers natifs et les PDF.
En dernier recours, vous pouvez travailler avec de grands fichiers PDF consolidés, des assortiments TIFF sans fichiers de charge et des fichiers papier.
Le traitement de ces formats demandera sans doute plus de travail, mais il est réalisable si vous insistez sur certaines normes. Par exemple, vous pouvez demander que les documents physiques soient numérisés à une résolution de 300 PPI (pixels par pouce). Et vous pouvez utiliser la reconnaissance optique de caractères (OCR) pour convertir l’image numérisée en texte que votre ordinateur peut « lire » et rechercher.
Vous avez peur de vous retrouver avec un format « incorrect » ? Ce ne sera pas un problème si vous utilisez le bon logiciel eDiscovery.
Quel que soit le format, un logiciel eDiscovery de premier ordre peut simplifier les choses. Prenez GoldFynch, par exemple. C’est un service par abonnement avec des outils essentiels de révision de documents à un prix abordable. Et il peut gérer tout type de format de fichier eDiscovery ! Voici quelques-uns de ses points forts :
- Il ne coûte que 27 $ par mois pour un boîtier de 3 Go : c’est nettement moins que la plupart des logiciels comparables. Avec GoldFynch, vous savez exactement ce que vous payez : sa tarification est simple etfacilement disponible sur le site Web.
- Il est facile de prévoir un budget. GoldFynch ne facture que le stockage ( le traitement des fichiers est gratuit ). Choisissez donc parmi une gamme de forfaits (de 3 Go à 150 Go et plus) et sachez à l’avance combien vous allez payer. Vous pouvezTéléchargez et récupérez autant de données que vous le souhaitez tant que vous restez en dessous de votre limite de stockage. Et même si vous dépassez la limite, vous pouvez mettre à niveau votre forfait en quelques clics. De plus, la facturation est au prorata : vous ne payez donc que pour le temps que vous passez sur un forfait donné. Avec les logiciels traditionnels, les prix sont beaucoup moins prévisibles.
- Il suffit de quelques minutes pour démarrer. GoldFynchfonctionne dans le Cloud , vous pouvez donc l’utiliser via votre navigateur Web (Google Chrome recommandé). Aucune installation. Pas d’appels commerciaux ni d’e-mails. De plus, vous bénéficiez d’un essai gratuit (0,5 Go de données et une limite de traitement de 1 Go) sans ajouter de carte de crédit.
- Il est simple à utiliser. De nombreuses applications eDiscovery nécessitent des heures de maîtrise. GoldFynch ne prend que quelques minutes. Il gère de nombreux traitements complexes en arrière-plan, mais ce que vous voyez est minimal et intuitif. Il vous suffit de glisser-déposer vos fichiers dans GoldFynch et vous êtes prêt à partir. De plus, vous bénéficiez d’une assistance technique rapide et fiable (notre temps de réponse moyen est de 30 minutes).
- Accédez-y où que vous soyez, 24 heures sur 24, 7 jours sur 7. Tous vos fichiers sont sauvegardés et sécurisés dans le Cloud.
Vous souhaitez en savoir plus sur GoldFynch ?
Pour des articles liés à l’eDiscovery, consultez les liens suivants.
- Un glossaire complet des termes essentiels de l’eDiscovery
- Un aperçu rapide du logiciel eDiscovery de GoldFynch
- Un analyseur PST gratuit pour vérifier si vos fichiers PST eDiscovery sont intacts
- Utilisez cette visionneuse PST intégrée au navigateur pour explorer gratuitement vos e-mails eDiscovery
- Le secret pour choisir le meilleur logiciel de eDiscovery à faible coût pour votre petit cabinet d’avocats
- Comment rendre vos productions eDiscovery moins piratables
- Quelle est la différence entre les fichiers PDF, DOCX, TXT et RTF dans eDiscovery ?
- 6 types de fichiers de découverte électronique par courrier électronique (à connaître absolument) : PST, MSG, EDB, OST, EML et MBOX