16 octobre 2012

Repérer les liens vers son blog : comment faire ? Ou comment faire un joli cahier des charges ?

Quitter le classement machin a des conséquences. Je ne peux plus aller voir les liens qui sont faits vers mes blogs. Chose que j'avais d'ailleurs arrêté de faire sur les conseils de ma psychothérapeute à Boulogne-Billancourt depuis six ou huit mois, à part occasionnellement.
Hé ho ! M'engueulez pas… Tous blogs cumulés, j'avais une quinzaine de liens par jour (peut-être un peu moins), hors week-ends, toujours plus calmes.
Je pose donc la question ici : connaissez-vous une solution ?

Comme je faisais une série de billets à propos des cahiers des charges, je vais me permettre d'en faire un autre avec le cahier des charges.
Prenez des notes.

Principes généraux du back office :
Il faudrait tout d'abord :
-         une base de données des blogs dont au sujet desquels on voudrait savoir qu'ils sont en lien. Appelons-la Roger,
-         une base de données de sites susceptibles de faire des liens avec l'adresse de leurs flux RSS. Appelons-la Marcel,
-         une base de données avec les résultats, à savoir le lien de Roger et l'adresse du billet du flux de Marcel. Appelons-la Josiane.

Tous les jours, il faudrait étudier chacun des liens qui circulent dans les flux RSS de Marcel. Nous allons appeler Lucienne le programme qui explore les flux RSS de Marcel.
Si Lucienne trouve un lien vers un blog de Roger, elle stockerait ce lien dans Josiane.
Si le lien n'est pas dans Roger, Lucienne pourrait le stocker dans une base de données complémentaire qui pourrait être étudiée à la main par des opératrices de saisie avec des jolis nichons. Appelons cette base Monique. Illustration. Pas de Monique, des opératrices de saisie avec des jolis nichons. Nous allons les appeler de manière générique Paulette.

 

Paulette étudierait les liens mémorisés dans Monique tous les soirs plutôt que d'aller au bistro. Elle cliquerait dessus et étudierait à quoi elle correspond. S'il s'agit visiblement d'un blog ou d'un site qui dispose d'un flux RSS, elle pourrait le rajouter dans Marcel. S'il s'agit d'un lien vers un truc qui n'a pas de flux RSS ou n'a rien à voir avec la choucroute (par exemple Wikipedia ou 3.bp.blogspot.com qui est l'adresse du serveur d'images de Blogger), elle pourrait le stocker dans Isidore. Isidore pourrait être utilisé par Lucienne pour mettre des liens à la poubelle lors de son exploration des flux RSS de Marcel de manière à ce qu'elle n'importune plus Paulette.

Je résume :
-         Roger est la liste des blogs pour lesquels on voudrait avoir la liste « des liens entrants »,
-         Marcel est la liste des blogs ou de sites (et des flux RSS) susceptibles de faire des liens vers une liste de blogs (Roger)
-         Isidore est une « liste noire » de liens qu'il ne faut pas traiter lors de l'étude des flux RSS d'une liste de blogs par l'application concernée (Lucienne),
-         Lucienne est une application explorant tous les flux RSS qui nous intéressent (gérés dans Marcel) pour repérer les liens à l'intérieur et les classant en trois catégories, ceux qui sont dans la base des liens qu'on veut étudier, ceux qui sont en liste noire et ceux dont elle ne sait que faire et qu'il conviendrait d'étudier à la main,
-         Josiane est la liste des liens vers les blogs qu'on veut étudier (Roger) repérés par une application (Lucienne) dans une liste de flux à étudier (Marcel),
-         Monique est la liste des liens repérés par une application (Lucienne) dont elle ne sait pas quoi en faire.
-         Paulette est une opératrice à gros nichon dont le travail serait d'étudier une liste de liens pour savoir s'il s'agit d'un blog qui pourrait être intéressant de surveiller au cas où ils contiendraient des liens ou s'il s'agit d'une « liste noire » de sites dont on a que faire. Le cas échéant, elle stockerait les informations nécessaires dans des bases de données respectivement appelées Marcel est Roger. Elle pourrait aussi les foutre à la poubelle si elle n'a pas le temps de gérer.
Un acteur intermédiaire pourrait intervenir : Nicolas qui aurait la possibilité de foutre des machins réactionnaires de Marcel vers Isidore.

Spécifications techniques complémentaires :
  1. Marcel et Roger vont vivre en cohabitation dans la même base de données puisque les liens dans Roger sont aussi susceptibles de faire des liens vers Marcel.
  2. Le couple « Marcel Roger » aurait une date de dernier billet (pour virer les machins qui n'ont rien glandé depuis six mois pour éviter l'engorgement des bases).
  3. Josiane aurait aussi « une date de lien » (de manière à ne conserver que les six derniers mois).

Initialisation
Au départ, Roger et Marcel contiendraient l'ensemble des flux RSS de mon Google Reader (ne faites pas la gueule, il y en a déjà près de 400). Cela devrait permettre de favoriser une certaine diversité mais il est sûr que le machin prendra plusieurs mois avant d'avoir un semblant de représentativité.

Front office grand public
Il s'agirait d'un site web où le grand public pourrait saisir l'adresse d'un blog ou d'un site et d'obtenir la liste des liens qui sont faits vers ce blog ou site ou la liste des liens qui sont faits de ce blog ou site.
Une adresse de contact serait placée sur ce site (voire un formulaire de contact) pour permettre aux braves utilisateurs de signaler les erreurs, notamment si leurs blogs ne sont pas dans Roger ou Marcel.
Paulette aurait en charge de traiter ces mails.

Middle office
Middle office est l'application qui permettra à Paulette de faire son job.

Conclusion
Ce n'est pas un joli cahier des charges, ça ?
Le résultat ne vous rappelle rien ?

19 commentaires:

  1. c'est Paulette ta psy de boulogne billancourt ?
    on comprend que tu aimes aller la voir

    RépondreSupprimer
  2. Il est canon ton cahier des charges, j'adhère !

    RépondreSupprimer
  3. après le jégounotron : le jégounoscope ;)

    non ça n'existe pas

    faut voir

    RépondreSupprimer
    Réponses
    1. Au boulot !

      Le nom me va très bien.

      Supprimer
    2. bon maintenant que 80% du taff marketing est fait (le nom) : au boulot.

      Au fait je veux bien m'occuper de l'hébergement de Paulette.

      Par contre je n'hébergerai ni Marcelle, ni Josiane ni Roger, qui risquent de devenir très vite un peu gros

      ;)

      Supprimer
    3. Si tu veux déposer le nom de domaine tu peux (je te rembourse, évidemment !) ou alors tu peux me dire comment faire.

      Pour l'hébergement final, ce n'est pas un problème, je pense qu'on pourra trouver, notamment grâce à Gilles ou Hyp qui ont des ressources.

      Supprimer
  4. Bon, c'est un billet qui explique avec des mots simples des choses que je ne maitrise pas tellement donc j'archive et je lirais à tête reposée.

    RépondreSupprimer
    Réponses
    1. Tu as compris l'illustration ?

      Supprimer
    2. Comme le sujet m'interesse, je n'ai pas fait attention sur le coup.

      Supprimer
    3. Et puis ce matin j'ai fantasmé sur Valérie T. en feuilletant 800 pages de Google.

      Supprimer
  5. C'est la seule chose que j'ai regretté en quittant le wikio. Ne plus savoir qui a fait des liens vers son blog. Il m'est arrivé de découvrir longtemps après (en regardant google analytics, ce que je ne fais pas régulièrement)qu'un passant, commentateur discret, m'avait consacré un petit billet avec un lien qui m'a envoyé quelques visites. Si le petit billet est vachard, je m'en fiche un peu, mais quand c'ést aimable, c'est bien de le savoir plus tôt.

    RépondreSupprimer
    Réponses
    1. Oui, mais je m'en étais lassé. Mais nos cas sont un peu différents, puisque je "jouais au classement".

      Supprimer

La modération des commentaires s'active automatiquement deux jours après la publication des billets (pour me permettre de tout suivre). N'hésitez pas à commenter pour autant !