In reply to Als antwoord op RSS 20 jaar by Jan Boddez

In theorie inderdaad, vooral ook vanwege de aanname dat die willekeurige homepage alle relevante postings bevat. H-feeds heb ik bijvoorbeeld wel op mijn site, maar dan lees je nog niet de helft uiteindelijk. Wil niet zeggen dat het niet anders kan dan met RSS, maar puur scrapen vooronderstelt bij de scraper eveneens kennis vooraf van de structuur van een site.

Ietwat grappig dat dat nodig was (en is). Semantisch correcte HTML hoort, in theorie, gewoon machineleesbaar te zijn……Random thought: zelfs zonder expliciete microformats, die een stukje RSS-functionaliteit (en meer) terug naar HTML brengen, zou ik, in theorie, alle article-elementen van een willekeurige homepagina kunnen scrapen, en ervan uitgaan dat de eerste heading de titel is en het eerste time-element de publicatiedatum

auteur

One reaction on “

  1. [P]uur scrapen vooronderstelt bij de scraper eveneens kennis vooraf van de structuur van een site.

    Absoluut. Later schoot me nog te binnen dat RSS-Bridge exact zo werkt! Maar het had (puur hypothetisch) ook simpeler kunnen zijn, mochten browsers veel minder flexibel zijn en HTML strikter. (Let op, het is goed dat dat niet zo is, hé. Heeft men geprobeerd, overigens, met XHTML.)

    [O]ok vanwege de aanname dat die willekeurige homepage alle relevante postings bevat.

    Oh, zeker. Was maar ’n voorbeeld.

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.