Apr
15

Qu’est ce que le datajournalisme?

On m’a posé la question il y a plusieurs semaines, et ce soir suite à une longue discussion avec un de mes amis journalistes, je voudrai dessiner à grand traits ce qui semble constituer pour moi la figure du data journaliste.
Cette réflexion est ouverte et matière, j’en ai bien conscience à un large débat dont je n’ai pas forcément tous les élements mais posons déjà les bases… et puis discutons…

Des milliards de données sont publiées chaque jour dans tous les sens sous tous les formats disponibles. Accessibles mais isolées, l’art du data journalisme serait donc à mon sens:
de collecter ses données
de les réunir
pour rendre visible un fait précis, un motif qui doit être soumis à analyse et à réflexion et puis à extrapolation si besoin est .

Il y a donc pour moi dans le travail du data journaliste quelque chose de complémentaire du journaliste classique:
- de la chasse à la données(même chose que la recherche des infos classique du journaliste mais différentes en ceci que les sources sont différentes
(On ne va pas forcément se nourrir de l’AFP mais plutot creuser dans les données publiques et les informations disponibles en ligne)
- de manipulation (collecter, construire et réunir le set de données) qui était plus traditionnellement du ressort d’organisme spécifique tels que les instituts d’études
- puis de restitution au public qui passe aujourd’hui plus souvent par de la visualisation graphique (tache habituellement réservée aux graphistes dans les rédactions traditionnelles)
- là où le data journaliste acquiert sans doute le terme journaliste, c’est la capacité à analyser et cadrer les résultats de ces résultats. En donnant l’angle de réflexion qui est le métier plus profond du journaliste informer oui, mais faire réfléchir aussi sur les implications de ce fait observé en regard de l’actualité.

La bonne question à se poser est sans doute est ce que ce set de données est matière à faire un papier à ouvrir une réflexion sur les données observées… Cela peut sans doute dépendre des données extraites, ce qui définira si les données en elle même constituent un fait éclairant au regard de l’actualité ou pas.

A vous de me dire…

Jan
09

Dans les entrailles d’une alerte Google

On connait tous le service de Google Alerte très utile pour faire de la veille sur un sujet donner ou un espace paticulier…

C’est en décortiquant le flux RSS généré par Google reader que j’ai découvert que Google utilise le service RSS de Yahoo qui permet la syndication de video, son et image.
En gros Yahoo enrichit pour le compte de google son alerte en rss en ajoutant les images, les sons et les vidéos.
Google alerte profite donc de l’indexation Google et de la robustesse du module RSS Yahoo ajouté à un protocole qui permet de décentraliser la publication et la syndication http://pubsubhubbub.appspot.com/

Nov
17

Les liaisons numériques

J’ai oublié de vous parler de ce livre qui innerve en fait toute ma réflexion sur l’innovation et les sciences sociales. j’ai d’ailleurs raté la conférence du jour sur l’avenir des sciences sociales qui se déroule à l’EHESS. pour me rattraper et vous donner quand même quelles infos dessus . Voici les slides de la présentation de Cassili.

La question des sciences sociales va plus loin qu’un simple débat de chercheurs, il interroge notre rapport à la technique et à l’innovation.

EN complément je vous conseille d’écouter cette émission de Place de la Toile sur France Culture qui m’avait donné envie de lire ce livre que je trouve assez important pour qu’on s’y arrête qu’on le déguste.*

http://www.franceculture.fr/emission-place-de-la-toile-les-liaisons-numeriques-2010-09-26.html

En effet il offre un assez large panorama de l’évolution du web. Peut être que d’ici les prochains jours, je ressortirais ici mes fiches de lecture sur cet ouvrage qui m’a beaucoup appris et qui m’a surtout donné les bonnes pistes pour continuer la réflexion sur les usages…

Un grand merci aussi à sam84 pour cette info et pour son blog sur les humanités numériques à lire, relire et à creuser

Oct
27

Digital humanities : vers un nouvel humanisme?

A l’époque ou le savoir était circonscrit, où la science était neuve, on pouvait croiser des humanistes, garants d’un savoir universel, touchant aussi bien aux Mathématiques qu’à la Poésie. C’était le temps des humanistes fins connaisseurs des lois de l’univers et de la science du langage, des secrets cachés de la nature et des harmonies du luth, sans contradiction et sans lutte intestine.
Aujourd’hui à quelques 5 siècles d’ecart le paysage scientifique s’est éclaté en milliers de framents et spécialités. Et chaque spécialité sont si difficile à réconcilier qu’on promeut aujourd’hui la pluridisciplinarité ou la transdisciplinarité.

Les websciences sant doute nous offre une chance unique de réconcilier les différents pans du savoir humains. Je me rejouis à chaque conférence sur l’Opendata ou le web sémantique, de voir des bibliothécaires au coté de développeurs et de statisticiens au cotés de linguistes. Nous sommes désormais en réseau comme au temps de la République des Lettres, les chercheurs savants et érudits étaient en réseau et débattaient par lettres, par livres ou conférences sur des idées aussi diverses que la Politique, la Géométrie ou la génération des monstres.

Le web offre un champ d’investigation inédit, un nouvel age d’or des pistes à déchiffrer. Cet espace qui lui même est en soi un espace de débat et d’échange, nécessite toutes les expertises tant il boulverse les pratiques de chacun de ses acteurs et usagers. Quand on est optimiste, comme je le suis maintenant y voir une sorte de nouvel humanisme quand d’autres y voit une nouvelle forme de démocratie.

Sep
28

Joshfire Framework

There is a new device every day and a big technology fragmentation
Specialists say that in2020 there will be 50b connected things
Boxes and SDK hard to develop for
Agencies sells N appss for N devices
Here is the complete presentation:

The goal of Joshfire exploit open sources technologies to build a common framework
And a lib of device-specific adapters
So one app, many devices

Joshfire is an Open source framework

The goal:
Offer one source code for all devices.
80% common dev 20% specific to adapt to the ergonomy

Every device will read the joshfire framework in JS
It’s new ecosystem for open application: connect people who makes soft and things developp once make everyware

Create a Data Tree and UI tree:
1. Describe the abstract data first in JSON
var Data (Data Tree)
2. Describe what you want in JSON (UI Tree)
with a connector between the two data dataPath”

Full Javascript
Translated toHTML(5) by node.js (on the server side)
Adapt UI depdending on device
acceot input method
Switch any data source

Just take a look on Github….or in the web site to have a test.

Oh and they are waiting some feedback so… don’t be shy come on!

Aug
18

Pour sa veille tous les flux RSS

Les flux RSS sont indispensable à la veille, heureusement pour la veille sur les blogs,
la veille est facilitée par le fait que les plateformes de blogs les plus usitées utilisent un standard qui permet de déduire le flux RSS du blog alors même que celui ci n’est pas publié sur le blog en questions.

On peut ainsi remonter pour les blogs les articles, les commentaires, ou encore préciser en amont en choisissant de suivre une seule catégorie ou un tag. Il en est de même pour certains forums qui utilise une plateforme, certains sites d’informations qui utilise des CMS ou dont les webmasters ont pensé à bien structurer leur service RSS.

Voici une liste des principales plateformes et de l’adresse des flux rss par défaut en fonction de la plateforme
que je publierai au fur et à mesure

Plateforme de BLOG
WORDPRESS
Articles
- L’adresse du flux RSS des derniers messages publiés sur le blog se présente sous cette forme :

http://identifiantdublog/feed

Commentaires
- L’adresse du flux RSS des derniers commentaires publiés sur le blog se présente sous cette forme :

http://identifiantdublog/comments/feed

- Par catégorie

http://identifiantdublog/category/nomdelacategorie/feed/

- Par tag

http://identifiantdublog/tag/nomdutag/feed/

CANALBLOG
Articles
- L’adresse du flux RSS des derniers messages publiés sur le blog se présente sous cette forme :

http://identifiantdublog.canalblog.com/rss.xml

- Commentaires
L’adresse du flux RSS des derniers commentaires publiés sur votre blog se présente sous cette forme :

http://identifiantdublog.canalblog.com/feeds/rss/comments

Par Catégorie
- Le flux RSS des derniers messages pour chaque catégorie du blog se présente sous cette forme :

http://identifiantdublog.canalblog.com/feeds/rss/posts/category/nom_de_la_categorie

Par Tag
- Le flux RSS des derniers messages pour chaque tag du blog se présente sous cette forme :

http://identifiantdublog.canalblog.com/feeds/rss/posts/tag/nomdutag

Par message

http://identifiantdublog.canalblog.com/feeds/rss/comments/post/iddumessage

Aug
17

Parametrer sa veille sur Youtube

Petites révisions pendant les vacances

Voici un petit tuto pour faire de la veille sur Youtube

    D’abord la recherche:

Taper dans la barre de recherche de youtube équivaut à chercher directement avec une url
http://www.youtube.com/results?search_query=larecherche

à quoi on peut rajouter des options directement dans l’url

- Option de tri
&search_sort=video_date_uploaded  trie les url par date de parution
&search_sort=video_view_count  trie les videos par nbre de vues

- Option de date
&uploaded=d aujourd’hui
&uploaded=m dans le mois
&uploaded=w dans la semaine

Si vous voulez voir toutes les videos mise en ligne ce jour sans doublon et dans la bonne langue
il suffit d’ajouter :
&utm_source=upload_restrict_tip_top

- Option de langue
&aq=f  spécifie que la langue recherchée est le français (mais ca marche pas des masses)

- Option Type de contenu

&search_type=videos : spécifie que le type de recherche ici seulement les vidéos,
Un utilisateur = search_users
Une playlist = playlist

  • Ensuite l’automatisation:

Taper cette adresse + apres q= votre recherche et cela fournir un flux rss automatiséà chaque publi

http://gdata.youtube.com/feeds/base/videos?q=larecherche&alt=rss&client=ytapi-youtube-search&v=2

On peut y rajouter les options qu’on veut

A noter que le filtre de date,(d’ailleurs inutile pour un flux Rss) inverse l’ordre donc ne pas le mettre évite de travail en plus

  • Et enfin pour les bidouilleurs l’API

Elle est par ici et la doc est bien faite (produit de Google donc facile à apprender)
http://gdata.youtube.com/demo/index.html

May
13

Open European Data

L’Europe se lance dans la course de l’Open Data, le début d’une grande aventure initiée par nos collègues Outre Atlantique. Lancement prévu du portail open data européen en 2012 avec pour principale réflexions les applications que l’on peut faire de l’ouverture des données européennes notamment pour la culture, le patrimoine.

Un vaste chantier vient enfin de s’ouvrir et deux appels sont sortis en quinze jours:

  • Hack4Europe
  • propose un grand concours de datamining sur quelques prestigieuses collections européennes… et ça frétille du coté des hackers.

  • Open Data Challenge
  • propose à tout le monde de proposer ses idées, ses applications, ou d’ouvrir des données. Rémunération alléchante à la clé.

    Le but final: des applications à montrer lors de la consultation européenne sur les données ouvertes

    En avant donc datamineurs de tous poils, documentalistes ou développeurs!

    Pour l’API d’Européeana c’est par ici que ca se passe

    May
    10

    Temps réel et mémoire virtuelle

    Waw,

    Ca faisait un bail, mais c’est décidé je vais livrer ma petite pensée du jour.
    Ce Soir (cette nuit) je suis perplexe, et même très perplexe.
    Mais qu’est ce qui se passe? Pourquoi tout le monde veut se mettre au temps réel?
    Informations en temps réel, alertes en temps réel, une véritable obsession pour s’approcher du fatidique S+1 (pas semaine, seconde… ;) ).
    Ok, grapher de l’info vivante , ca doit être en effet très intéressant… techniquement parlant un grand challenge, mais franchement, je me demande si ce n’est pas plutôt une obsession pour le challenge technique que pour être réellement informé de manière intelligente…

    Car si être informé de la fissure d’une centrale en temps réel peut s’avérer crucial, il rest un point à examiner dont on en parle jamais quand on parle de “temps réel”. D’abord le temps n’est pas réel mais relatif (je sais c facile) mais plus sérieusement les milliards de données en temps réel en feront jamais une information: sans étude de la source, filtrage, traitement, analyse de pertinence d’impact et de durée, c’est juste des milliards de données neutres non pertinentes sans traitement.

    Bon et là je me suis dit tu fais ta sale bibliothéciaire aigrie… et puis…

    C’est là que je me suis rendue compte que mon obession à moi est dans l’autre sens, à rebours, à l’envers à Y-5 … Plutôt que le temps réel, ce qui m’intéresse moi et qui me parait un challenge technique beaucoup plus grand et beaucoup plus fort… c’est l’archivage des informations pertinentes.
    En fait c’est comme ca que je vois le web comme une immense bibliothèque… Une immense bibliothèque de Babel vivante qui produit à vitesse impressionnantes des données qui se perdent, se dégradent ou s’oublient…

    Pour l’anecdote, aujourd’hui au boulot on a découvert avec stupeur que pour certaines données qui datent de plus de 3 ans, Google fait parfois barrage au robot avec des captcha…

    Et tout d’un coup, la peur, ma trouille qui grouille dans les tripes. Un scenar catastrophe dans ma tête: Google, mon Friendnemy préféré me fera t il payer un jour l’accès à toutes les données qu’il a tranquillement stocké???

    Mais nooooon je rêve….

    Allez bonne nuit

    Jan
    30

    Clay Shirky (Suite)

    Bonjour à tous,

    Me revoici de ce coté, juste ce petit poste après quelques avancées dans mes réflexions.
    Je serais à la conférence de Clay Shirky chez Microsoft ce lundi 31. J’avais consacré quelques posts à son livre Cognitive Surplus dans ce blog que je vous invite à relire.

    Plus d’info en Français on été publié sur la Toile à cette occasion notamment sur le magazine du Lab de Microsoft
    http://www.rslnmag.fr/blog/2010/12/22/portrait_mais-qui-est-donc-clay-shirky_/

    La suite donc après la conf…!

    Older posts «