Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

Tiens, Ă©tant Ă  Paris vendredi, je vais moi mĂȘme et avec des ami.e.s suivre les gens dans la rue avec un petit magnĂ©tophone pour rĂ©cupĂ©rer leurs conversations dans l'espace ~public~, indexer leurs mots et mettre tout ça Ă  disposition dans une grosse archive :thaenkin:​
Je ne saurai pas qui sont les personnes que je suis et j'aurai une transcription de ce qu'ils disent sans leur voix, donc on va dire que c'est anonyme :thastking:​
Et puis bon, si iels voulaient que ça reste privĂ©, iels attendraient d'ĂȘtre dans des espaces ~privĂ©s~ pour discuter :thinkgoing:​

Suivre

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

Je sais mĂȘme pas si c'est lĂ©gal, mais ça n'est pas parce que ça l'est ou que c'est techniquement possible qu'il ~faille~ le faire 😑​

· · Web · 3 · 2 · 5

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

C'est drĂŽle quand mĂȘme que certains milieux soient si attachĂ©s Ă  la protection de donnĂ©es dites "privĂ©es" (et souvent lĂ©galement rĂ©cupĂ©rĂ©es par, au hasard, Microsoft, Facebook...), mais en mĂȘme temps si enclins Ă  accepter que puisque quelque chose est techniquement "accessible" (et parfois "public" avec plein de guillemets), on puisse en faire ce qu'on veut. Ou mĂȘme parfois clairement privĂ©, mais "accessible" (voir les affaires de leaks de certains fichiers d'entreprises pour prouver que ceux-ci Ă©taient mal protĂ©gĂ©s).
Ah, Ă  moins qu'on considĂšre qu'entre ces deux actions ~lĂ©gales~(?) il y ait tout de mĂȘme une diffĂ©rence ~morale~ et des consĂ©quences Ă  ces recueils de donnĂ©es...
Hmm.... :thinking_thanos:​

Afficher le fil de discussion

CarrĂ©ment liĂ© Ă  ces projets de scraping d'instances Masto 

Ah bah :thinkless:​

Afficher le fil de discussion

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro Toi, t'as jamais entendu parler de l'observation participante :D

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria je me renseigne un peu et ça a l'air vachement intéressant, mais ça ne contredit pas
"ça n'est pas parce que ça l'est ou que c'est techniquement possible qu'il ~faille~ le faire"
:D
(enfin, je veux bien que tu développes ce que tu veux dire par cette réponse à mon post ^^)

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro Je répondais plutÎt au thread qu'au toot particulier (ce serai plus accurate pour le premier toot en effet).

Car pour le coup, je trouve que si tu prends des trucs comme l'enquĂȘte de Labov sur les grands magasins Ă  New York, c'est ultra proche de ton exemple.

uoh.concordia.ca/sociolinguist

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria (merchi pour le lien :3)
Justement, ce que je voulais dire (mais le dernier post est arrivĂ© aprĂšs ta rĂ©action), c'est que c'est pas en soi "mal" ce genre d'Ă©tudes, mais ça pose un gros problĂšme de consentement Ă  ce que ces donnĂ©es soient rĂ©cupĂ©rĂ©es, peut ĂȘtre "for a greater good" quand il s'agit de socio... mais pas que.
Je veux dire, on fait déjà une distinction et ça choque beaucoup quand une entreprise publicitaire propose d'enregistrer les positions et autres données audio/vidéo dans un supermarché, à des fins marketing. Quand est-ce que ça devient acceptable, dans quelles conditions, et pour quelles données ? Qui juge ça ?
Et si la justification c'est juste "elles sont publiques", pffff...

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro

Je suis d'accord mais personnellement je part aussi du principe que mon consentement ne me sera pas forcĂ©ment demandĂ© vis-Ă -vis du fait que mes toot publiques peuvent ĂȘtre lu/rĂ©cupĂ©rĂ©s par n'importe qui. Et pour une raison simple : ce n'importe qui qui inclus des facho qui eux ne se gĂȘneront pas __une seconde__ avec des questions d'Ă©thique etc pour retourner une database et extraire n'importe quelle info de celle-ci


re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria bah oui mais et alors ? J'ai envie de dire, justement, est-ce qu'on attend de qqun qui a cette position sociale ("je fais de la recherche socio") d'avoir ce raisonnement lĂ  ("puisque les fachos peuvent le faire, je vais pas me gĂȘner moi non plus") ?
Ouais, c'est techniquement la mĂȘme chose, on rĂ©cupĂšre des toots publics...
En fait (plus gĂ©nĂ©ralement, pas dans ton raisonnement) ça me gonfle ces argumentaires du "techniquement c'est la mĂȘme chose" ou "techniquement on pouvait le faire alors on l'a fait" ou bien "d'autres pourraient le faire, alors autant le faire nous aussi".

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria et si j'ai envie de pousser plus loin, quand tu dis
"des facho qui eux ne se gĂȘneront pas __une seconde__ avec des questions d'Ă©thique etc pour retourner une database et extraire n'importe quelle info de celle-ci"
bah, là, elle a été compilée et publié cette database, par ces chercheurs/chercheuses, dans un format facilement exploitable... D:

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro @vitria

Spa faux et oui, pour les "fachos" indĂ©pendants, c'est une aubaine incroyable. Les gens de Gab et Ă©quivalent ont sĂ»rement dĂ» se faire plaisir, alors qu'ils n'ont pas forcĂ©ment les moyens humains et techniques de faire ça eux-mĂȘmes.
Mais les "fachos" (ou en tous cas les "méchants") structurés et organisés, les plus dangereux donc (#NSA et consorts) ont probablement ça depuis longtemps!

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@LienRag @vitria mais c'est toujours pas une raison pour se dire "oorf, bah ça va alors, perdu pour perdu..." :(

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro @LienRag
En fait, je ne suis pas d'accord, l'Alt-Right a totalement les moyens techniques de faire un scraping comme ça sur masto. Tout comme nous on peux le faire sur Gab & co.
Et personnellement, je n'ai pas attendu qu'iels annoncent fiĂšrement l'avoir fait (si iels le font) pour prendre mes prĂ©cautions et publier en privĂ© ce qui doit ĂȘtre privĂ©.

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria @LienRag ça n'empĂȘche pas de prendre ses prĂ©cautions bien Ă©videmment ; et en terme de moyens, on parle d'alt-right mais on pourrait aussi parler de la nsa...
Est-ce que ce qu'ils font ne doit pas ĂȘtre condamnĂ© ? bien sĂ»r que si.
Et pour en revenir au sujet initial, ça me pose problÚme que des personnes se soient dit "allons compiler et re-publier de façon facilement exploitable des données accessibles de gens sans leur consentement" ("ah bah si, y'a consentement implicite, c'est public ahah")((et aprÚs ça rùle contre le opt-out)), [...]

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria @LienRag [...] mais ça me gĂȘne tout autant que d'autres, sans mĂȘme les condamner pour ce qu'ils font, nous sortent "bah, c'Ă©tait public, normal, fin de la discussion".
Et que ça soit des sociologues qui doivent pourtant bien connaitre les conséquences de ce que pourrait emmener cette compilation et publication... beurk :/

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro @LienRag
-no offense-
Peux-tu me dire en gros les points qui te dĂ©rangent avec cette histoire ?

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria simplement le fait que des personnes pourtant probablement sensibilisĂ©es au concept de vie privĂ©e et au fonctionnement des rĂ©seaux sociaux se soient dit "ces donnĂ©es sont accessibles dont je peux les rĂ©cupĂ©rer et les compiler puis republier" sans rĂ©ellement les rendre anonyme, et sans en informer les personnes desquelles elles sont issues (voir les dĂ©bats sur la recherche de toot vs. le harcĂšlement et sachant que ces instances ont pour certaines indiquĂ© ne pas vouloir ĂȘtre indexĂ©es avec leur robot.txt). [...]

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria également que d'autres personnes qui sont sensées défendre la vie privée et les libertés sur internet te sortent "bah ouais, c'est accessible sur votre profil, c'est public, les gens peuvent en faire ce qu'ils veulent, deal with it" ou alors envoyer ça sur le débat du "c'est légal ou pas" ou "Mastodon c'est de la merde" ou "regardez, vous comprenez pas, internet fonctionne comme--" ou bien encore "j'y arrive facilement, c'est donc normal que d'autres personnes le fassent".
Les mĂȘmes personnes qui quand on rĂ©cupĂšre des donnĂ©es de vidĂ©o surveillance dans l'espace -public-, des donnĂ©es transitant en clair, ou des donnĂ©es privĂ©es mais lĂ©galement rĂ©cupĂ©rĂ©es, s'insurgent. [...]

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria je veux dire, si mĂȘme les grandes entreprises font un foin avec leur cgu et, grĂące Ă  certaines lois, indiquent (pas toujours clairement) que des donnĂ©es vont ĂȘtre rĂ©cupĂ©rĂ©es de tes habitudes ou de tes profils publics (pour te "suggĂšrer de nouveaux amis" yeah :D), j'attends de sociologues peut ĂȘtre un peu mieux. Et pour les exemples que tu cites, ça n'est pas parce-que ça se fait que c'est souhaitable, surtout qu'il s'agit de contextes assez diffĂ©rents (et probablement avec des donnĂ©es vraiment anonymes). Et visiblement j'ai cru comprendre que d'autres mĂ©thodes impliquant l'accord des sujets d'expĂ©rience Ă©taient possibles... Donc c'est pas vraiment une excuse.

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@vitria @shiro C’est exactement ce que je dĂ©fendais hier

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@Sylvhem @vitria (reste de la conv avec ce toot là et les précédents ^^
social.mochi.academy/@shiro/10
je suis pas d'accord avec ça)

re: Plus ou moins liĂ© Ă  ces projets de scraping d'instances Masto 

@shiro Pourtant je suis sĂ»re que si tu scrap tous les articles de presse accessible publiquement pour mes publier autre part je suis Ă  peu prĂšs sure que c'est illĂ©gal đŸ€”đŸ€”đŸ€”đŸ€”

Inscrivez-vous pour prendre part Ă  la conversation
Mochi Academy 🍡

Le réseau social de l'avenir : Pas d'annonces, pas de surveillance institutionnelle, conception éthique et décentralisation ! Possédez vos données avec Mastodon !