BLOG

Comment détecter des flux rss avec 10 astuces

29 Sep 2015, Posté par D. Bocquelet dans A la une, Regard sur l'actualité

Vous aurez à un moment ou à un autre besoin d’accéder à de grandes quantités d’informations sur un sujet particulier, et sur le long terme (Si c’est du court terme, les requêtes sur Google ça aide bien).

Pour faire sa veille sur le long terme pour l’instant il n’y a rien de mieux que de suivre les flux rss issus de sources que vous aurez triées sur le volet, et il conviendra donc de détecter ces flux RSS.

Mais quelles sont les méthodes et outils pour détecter des flux RSS ?

Voici donc un listing des procédés les plus courants et quelques « hacks »…

Le principe des flux rss:

  • – Être prévenu dès que de nouvelles informations sont publiées ou rendues accessibles
  • – Sans avoir à se connecter aux sites eux-mêmes (Push)
  • – Pouvoir consulter en un endroit unique, centralisé
  • – Texte ou fichiers multimédias (podcasts)
  • – Contenu manipulable par l’usager

Commençons par la base: Qu’est-ce qu’un flux RSS ?

De Really Simple Syndication. C’est un protocole d’export (partiel) des articles, généralement affiché format en .atom, .rss, .xml.

screen_rss

Deux exemples bruts de technologie RSS en .xml (format le plus courant)

Que contient un fil RSS ?

  1. Le Titre de l’information
  2. Une Brève description
  3. Lien vers une page avec l’information détaillée

Avantages et inconvénients du RSS

Avantages : 

  1. Gain de temps et surveillance en temps réel
  2. Segmentation – Possibilité de s’abonner à une rubrique spécifique d’un journal
  3. Anonymat et confidentialité – Contrairement à une liste de diffusion, il n’est pas nécessaire de s’identifier
  4. Consultation aisée et information datée

Inconvénients : 

  1. Perte de temps – Si on ne sélectionne pas correctement ses sources
  2. Redondance de l’information – Cherchez la source primaire
  3. Validité de l’information – Publication plus aisée, n’importe qui peut publier n’importe quoi
  4. Non disponibilité – Toutes les sources ne proposent pas directement de flux RSS. Dans ce cas, il faut les créer

Maintenant que nous en avons fait le tour, passons à l’essentiel: Repérer et collecter des flux RSS.

1 – Repérer un flux dans une page web visuellement

C’est la méthode classique. Le petit logo orange avec ses ondes blanches s’est installé dans les usages et figure en général (mais pas toujours) avec les icônes de bookmarking sociaux, près du header (tête du site) ou du footer (pied du site). Parfois l’icône renvoie non au flux même brut mais à une page qui affiche les flux disponibles ou un reader comme feedburner qui est des plus utilisé.

2- Repérer un flux rss par une recherche
Pas de logo ? Cela ne veut pas dire qu’aucun flux n’est présent. Il peut être caché, ou simplement affiché en texte « rss » quelque part sur le site, diecret. Sur la plupart des navigateurs il y a la possibilité d’effectuer des recherches dans la page en cours. Il suffira donc de taper « rss » ou « feed ». On peut aussi afficher le code source (ctr+u) et chercher « alternate », balise annonçant (entre autres) un flux RSS.

3 – Récupérer un fil RSS via le navigateur
Nativement chrome, mozilla, et Internet Explorer 11 ne proposent pas de détecter le flux RSS sur la page en cours.

Sur Chome, le logo n’est pas présent nativement. Il faut le télécharger parmi les applications sous le nom « RSS feed reader ». Une fois installé, il se trouve près du champ URL. Lorsqu’un flux est présent sur la page, le logo s’orne d’un « + » pour l’ajouter à son reader.

Sur Mozilla: Firefox a éliminé l’icone de flux. On peut éventuellement aller à la pêche à partir des informations du site/média mais des addons comme « rss icon in awesomebar » et assimilés sont préférables. Ce dernier change de couleur quand un flux est détecté dans la page et permet de le suivre.

Sur IE: Par forcément natif sur les version récentes « simplifiées ». Il faut aller dans les options internet (roue dentée à droite), onglet contenu, « flux et composants web slice », paramètres, et cocher « Recherche automatiquement… »

Sur Safari: Et pour nos amis croqueurs de pomme, bonne nouvelle, un petit « rss » est présent dans la barre URL par défaut, qui change lui aussi en présence d’un flux.

4 – Récupérer un flux par l’URL:
Résumons: Pas d’icône, pas de texte « rss » ou « feed » dans la page, et votre navigateur ne repère pas le flux. Tout n’est pas perdu. Il reste la solution « CMS ». En effet la plupart des sites web actuels, surtout d’information, blogs, utilisent 2-3 CMS qui fonctionnent de la même manière. Il suffira pour faire apparaître un flux de taper tout simplement dans la barre d’adresse (URL) derrière le site ou la page courante /rss ou /feed. Ex. « http:www.viedoc.fr/feed/ »

Cela marche sur 90% des blogs, dont WordPress qui en constitue la plus grande partie, mais on peut tenter la chose sur la plupart des sites sans même connaître leur architecture.

5 – Google hack: inurl
Il n’y a pas de moyen direct de recherche des flux rss via Google, mais il existe une requête: inurl. Pour être plus précis cette requête se traduit par « mot » inurl:rss.xml

6- Bing hack: feed:
Le moteur de microsoft, peut, lui être utilisé directement pour rechercher des flux via la requête tour simple feed: « mot » (sans les guillements). Attention toutefois les résultats sont tributaires de la langue de recherche du moteur (Français par défaut) ce qui limite les résultats.

Quand à la qualité des résultats elle n’est pas forcément convaincante. Les mêmes sites reviennent plusieurs fois (actualités, commentaires…), certains flux sont inopérant ou datés, etc. Bref dans les deux cas, il conviendrait de les tester et des les affiner avec des opérateurs supplémentaires.

distantsearch

7 – Répertoires des flux rss (annuaires, moteurs…)
Annuaires :

  • Lamoooche, http://www.lamoooche.com/
  • Newsrss, http://www.newsrss.net
  • Fluxrss, http://fluxrss.fr

Métarépertoires:

  • RSS-Tools, http://www.rss-tools.com/rss-directories.htm
  • RSS Sourcing, www.rss-sourcing.com (portail d’annuaires sectoriels)

Moteurs de recherche:

  • InstantSearch, http://ctrlq.org/rss/
  • RSSMicro, http://www.rssmicro.com
  • RSS Search Hub, http://www.rsssearchhub.com

8- Trouver des RSS de réseaux sociaux: 
Nous avons déjà parlé du sujet réseau par réseau abondamment sur cette page. La plupart ont cessé de proposer un API ou l’ont compexifié de telle sorte qu’il devient bien plus difficile de suivre des comptes hors du réseau social. En revanche, ce qui marche:
-Sur facebook: Surveillance de compte uniquement: http://www.facebook.com/feeds/page.php?format=rss20&id=123456789123456
-Pinterest: Egalement: http://pinterest.com/pinterest_nomducompte/feed.rss

9 – Trouver des RSS de vidéos:
Youtube (récemment changé):

  • http://gdata.youtube.com/feeds/base/users/*/uploads
  • https://www.youtube.com/feeds/videos.xml?user=*
  • https://www.youtube.com/feeds/videos.xml?channel_id=UCe2J3cFALUjxa47QD3bA-7g
  • https://www.youtube.com/feeds/videos.xml?user=USERNAME

(Remplaçez le * par le nom du compte)

thesefr

 10- Trouver des RSS pour Suivre les brevets et thèses:

  • Sur espacenet (Inpi)  Brevets : Effectuez une recherche, un icône de flux rss apparaît près du titre.
  • Sur theses.fr: idem: Recherche, un flux rss (bouton s’abonner) apparaît dans les résultats.