BertrandCaron, French
@BertrandCaron@digipres.club avatar

Je ne sais pas si j'ai assez fait de pub (et j'ai pas l'impression que @figoblog en ait fait davantage sur ce réseau) alors je réitère : lundi prochain, 8 avril, il y a une conf sur l'archivage des mails à l'Ecole nationale des chartes.

https://www.chartes.psl.eu/gazette-chartiste/agenda/larchivage-du-courrier-electronique

Avec Peter Chan, digital archivist à Stanford et chef de produit historique du logiciel ePADD (https://fr.wikipedia.org/wiki/EPADD) !

Entrée libre sur inscription.

bortzmeyer,
@bortzmeyer@mastodon.gougere.fr avatar

@BertrandCaron @figoblog L'ADEME ne va pas aimer :-)

@pb

BertrandCaron,
@BertrandCaron@digipres.club avatar

@bortzmeyer @figoblog @pb

😄

Mais plus sérieusement : au contraire ! Il y a un lien très clair entre archivage, tri et sobriété numérique. On ne peut pas préserver ce qu'on ne connaît pas, qu'on ne maîtrise pas, qu'on n'a pas trié. Enfin c'est ce qu'on essaie de défendre...

pb,
@pb@mast.eu.org avatar

@BertrandCaron @bortzmeyer @figoblog avec tout mon respect, j'en ai déjà discuté avec des archivistes-bibliothécaires qui ont effectivement cette façon très "traditionnelle" de voir les choses ; je pense que cette approche qui date de l'époque papier devrait être réévaluée à la lumière des ordres de grandeur totalement différents permis en stockage numérique, où le coût de destruction n'est pas négligeable devant le coût de conservation très minime.

pb,
@pb@mast.eu.org avatar

@BertrandCaron @bortzmeyer @figoblog disproportion qui plus est exacerbée par la chute continuelle du coût par unité de volume stockée, qui doit être prise en compte dans les évaluations de coût d'archivage de très longue durée.

BertrandCaron,
@BertrandCaron@digipres.club avatar

@pb @bortzmeyer @figoblog

En fait c'est moins la question du coût de stockage qui va nous retenir sur le chemin d'une maîtrise idéale des contenus que le temps nécessaire au traitement de ces fonds. Reclasser des vracs numériques, évaluer a priori l'intérêt et la forme des données semble équivaloir à tenter d'anticiper un risque qui peut-être ne se produira pas.

pb,
@pb@mast.eu.org avatar

@BertrandCaron @bortzmeyer @figoblog je comprends bien, je reformule, pourquoi ne pas changer de stratégie et conserver plutôt que détruire ce que l'on n'a pas le temps d'évaluer sur le moment (qui n'est en rien une nécessité), et gérer ça en mode "lazy" : on traitera plus tard si on en éprouve soudain la nécessité, choix qui peut être conjoncturel et non anticipable. Il est plus difficile (voire impossible) de recréer une donnée détruite qui s'avère de valeur, que la conserver dans le doute.

BertrandCaron,
@BertrandCaron@digipres.club avatar

@pb @bortzmeyer @figoblog

Oui, j'avais bien compris votre position, et la partage pour une partie. Le niveau de tri opéré dépendra largement des compétences et du temps de travail disponible. Et de l'efficacité des outils à notre disposition - ePADD, par exemple, permet de la reconnaissance d'entités nommées et de l'identification de données sensibles qu'on ne souhaite pas conserver (ex. : le 06 de Léa Seydoux, par exemple - true story).

bortzmeyer,
@bortzmeyer@mastodon.gougere.fr avatar

@BertrandCaron @pb @figoblog Comme je suis en train de lire ma boite Spam, je me demande si quelqu'un archive les spams ? OK, au quotidien, ils sont horripilants mais, dans le futur, qui sait s'ils ne seront pas une ressource intéressante pour l'historien·ne ?
https://mastodon.gougere.fr/@bortzmeyer/112205944556263161

Je vais proposer ça à la BNF, tiens :-)

pb,
@pb@mast.eu.org avatar

@bortzmeyer @BertrandCaron @figoblog j'ai gardé l'intégralité des miens depuis 1994. Toute ma vie numérique tient d'ailleurs largement (et plusieurs fois) sur un disque actuel.

pb,
@pb@mast.eu.org avatar

@bortzmeyer @BertrandCaron @figoblog les spams seront sans aucun doute une ressource précieuse pour les historiens : il y a eu les phases "refinance now" (coucou la crise des subprimes peu après), "achète chez cdiscount", "la fin du monde est proche, aide Jésus", "j'ai 3 M$ à rapatrier du Nigeria", "gagne 5k€/mois facilement avec le Forex", "médecine par les plantes", "Les NFT c'est énorme", etc (et j'en oublie bien sûr). Toute bonne arnaque à la mode se doit de passer par une phase de spam !

lovisix,
@lovisix@social.zdx.fr avatar

@pb @bortzmeyer @BertrandCaron @figoblog

Oui et non, encore faut-il qu'ils aient été conservés (sinon regarde dans ta boite à spam).

pb,
@pb@mast.eu.org avatar

@lovisix @bortzmeyer @BertrandCaron @figoblog si je le dis c'est parce que les miens sont conservés, mon mail est autohébergé.

beaufils,
@beaufils@mastodon.social avatar

@pb @bortzmeyer @BertrandCaron @figoblog

Pareil.

J'ai conservé tous mes emails (reçus et envoyés spams et attachements compris depuis 1993).

Résultat :

$ du -sh ~/mail/maildir/archives
41G /home/bruno/mail/maildir/archives

beaufils,
@beaufils@mastodon.social avatar

@pb @bortzmeyer @BertrandCaron @figoblog

Le truc le plus chiant a été de convertir mes fichiers mbox en maildir à un moment (en même temps que mon passage de Emacs VM à mutt).

pb,
@pb@mast.eu.org avatar

@beaufils @bortzmeyer @BertrandCaron @figoblog urgh, moi je suis toujours en mbox :)

beaufils,
@beaufils@mastodon.social avatar

@pb @bortzmeyer @BertrandCaron @figoblog ouch, ça doit faire de bien gros fichiers...

Je suis curieux de savoir quel outil de gestion de mail est utilisé.

De mon côté c'est mutt (je suis passé par neomutt pendant 3 ans) sur mes dossiers maildir et Thunderbird (en IMAP seulement).

bortzmeyer,
@bortzmeyer@mastodon.gougere.fr avatar

@beaufils @pb @BertrandCaron @figoblog mbox ne veut pas dire qu'on garde le même fichier depuis 1993 :-)

Personnellement, je les fais tourner tous les mois, ce qui reste gérable (et grepmail se débrouille très bien avec le multi-fichiers.)

beaufils,
@beaufils@mastodon.social avatar

@bortzmeyer @pb @BertrandCaron @figoblog

Oui bien sûr, mais tous les mails restent concaténés dans un fichier, non ?

Ça fait toujours des fichiers plus gros qu'avec maildir.

pb,
@pb@mast.eu.org avatar

@beaufils @bortzmeyer @BertrandCaron @figoblog en taille totale tu vas y perdre en maildir, puisque chaque mail va prendre une taille réelle arrondie à la taille du bloc suivant. Et ça peut aussi réduire les possibilités de compression.

pb,
@pb@mast.eu.org avatar

@beaufils @bortzmeyer @BertrandCaron @figoblog mutt en local, Thunderbird pour lire les trucs à cliquer en HTML, dovecot pour l'accès mobile (+ K9-mail sur le mobile), xz pour compresser les archives quand je fais tourner les boites. dovecot tousse un peu sur les très grosses boites au format mbox (lent), mais ça passe quand même.

beaufils,
@beaufils@mastodon.social avatar

@pb @bortzmeyer @BertrandCaron @figoblog

Sauf dovecot et xz (je ne compresse pas mes mail), on utilise la même chose, je me sens moins seul :-)

Depuis que je n'auto-héberge plus mes emails je dépens des IMAP de mes hébergeurs.

Mais j'ai prévu de re-auto-héberger mes emails assez vite.

Il faut d'abord que je me remette à jour, je suis bien rouillé de ce côté là (je suis en train de relire les premières épreuves de @mwl pour ça).

Je suis preneur de conseils.

pb,
@pb@mast.eu.org avatar

@beaufils @bortzmeyer @BertrandCaron @figoblog @mwl j'ai oublié de citer opendkim (+ config dmarc et spf) pour la signature dkim des mails sortants, ça aide un petit peu à ne pas être refusé ou classé en spam chez Google & al.

ppezziardi,
@ppezziardi@amicale.net avatar

@pb @bortzmeyer @BertrandCaron @figoblog alors que tu pourrais économiser tant de CO2 en les supprimant !

pb,
@pb@mast.eu.org avatar

@ppezziardi @bortzmeyer @BertrandCaron @figoblog j'ai un truc : je traite des fichiers OpenStreetMap, des logs et des boites de mails périodiques système (cron). Un petit rm et ça dégage des Go de données. En quelques fractions de seconde, l'équivalent d'un cybercleanup day de plusieurs grandes métropoles françaises.

BertrandCaron,
@BertrandCaron@digipres.club avatar

@pb @bortzmeyer @figoblog

C'est ce qui amène certaines institutions à collecter largement, avec un effort minimal, et à reporter les efforts au moment de l'accès (voir par exemple la position de D. Rosenthal : https://blog.dshr.org/2007/05/format-obsolescence-prostate-cancer-of.html). Que ce soit la capacité à restituer correctement un contenu dans un format de niche ou, dans le cas des mails, à identifier et protéger les informations sensibles.

BertrandCaron,
@BertrandCaron@digipres.club avatar

@pb @bortzmeyer @figoblog

J'avoue qu'on est encore en train de chercher un juste milieu entre ces deux approches, qui ne sont pas forcément mutuellement exclusives.

BertrandCaron,
@BertrandCaron@digipres.club avatar

@bortzmeyer @figoblog @pb

Par ailleurs, la méthode Capstone (https://www.dpconline.org/blog/capstone-email-appraisal-approach) détermine que le pourcentage d'agents des administrations publiques devant voir leur boîte mail collectée et préservée est très réduit (de l'ordre de 1% - avec tri - et 0,1% - intégralement).

pb,
@pb@mast.eu.org avatar

@BertrandCaron @bortzmeyer @figoblog ce papier US semble plus pragmatique que ce que j'avais pu lire jusqu'ici en France :)

  • All
  • Subscribed
  • Moderated
  • Favorites
  • random
  • ngwrru68w68
  • rosin
  • GTA5RPClips
  • osvaldo12
  • love
  • Youngstown
  • slotface
  • khanakhh
  • everett
  • kavyap
  • mdbf
  • DreamBathrooms
  • thenastyranch
  • magazineikmin
  • megavids
  • InstantRegret
  • normalnudes
  • tacticalgear
  • cubers
  • ethstaker
  • modclub
  • cisconetworking
  • Durango
  • anitta
  • Leos
  • tester
  • provamag3
  • JUstTest
  • All magazines