In reply to
by Jan BoddezIn theorie inderdaad, vooral ook vanwege de aanname dat die willekeurige homepage alle relevante postings bevat. H-feeds heb ik bijvoorbeeld wel op mijn site, maar dan lees je nog niet de helft uiteindelijk. Wil niet zeggen dat het niet anders kan dan met RSS, maar puur scrapen vooronderstelt bij de scraper eveneens kennis vooraf van de structuur van een site.
Ietwat grappig dat dat nodig was (en is). Semantisch correcte HTML hoort, in theorie, gewoon machineleesbaar te zijn……Random thought: zelfs zonder expliciete microformats, die een stukje RSS-functionaliteit (en meer) terug naar HTML brengen, zou ik, in theorie, alle article-elementen van een willekeurige homepagina kunnen scrapen, en ervan uitgaan dat de eerste heading de titel is en het eerste time-element de publicatiedatum
auteur
Absoluut. Later schoot me nog te binnen dat RSS-Bridge exact zo werkt! Maar het had (puur hypothetisch) ook simpeler kunnen zijn, mochten browsers veel minder flexibel zijn en HTML strikter. (Let op, het is goed dat dat niet zo is, hé. Heeft men geprobeerd, overigens, met XHTML.)
Oh, zeker. Was maar ’n voorbeeld.