Discussion:
HTML RSS Feed www.opn.no
(too old to reply)
Thierry Matthey
2005-09-14 12:16:39 UTC
Permalink
Her er konfig for Firefox og infoRSS extension
(http://inforss.mozdev.org/installation.html).
Lage en OPN feed med "New Feed" ( ) xml (x) html

Regular Expression: <span class=\"style6\">([^<]*)<a
href=\"([^\"]*)\"></a>[^']*(?=[0-9]+\.[0-9]+\.[0-9]+)([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"[^\"]*\">([^<]*)

Headline: $1

Body: $4

Published date: $3

Link: http:www.opn.no/$2

NB: Regular Expression skal vaere en linje.
-Thierry
Thierry Matthey
2005-09-15 05:22:22 UTC
Permalink
Post by Thierry Matthey
Regular Expression: <span class=\"style6\">([^<]*)<a
href=\"([^\"]*)\"></a>[^']*(?=[0-9]+\.[0-9]+\.[0-9]+)([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"[^\"]*\">([^<]*)
opps, skal vaere:
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">([^<]*)

-Thierry
Torbjørn Kravdal
2005-09-15 06:57:24 UTC
Permalink
Post by Thierry Matthey
Post by Thierry Matthey
Regular Expression: <span class=\"style6\">([^<]*)<a
href=\"([^\"]*)\"></a>[^']*(?=[0-9]+\.[0-9]+\.[0-9]+)([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"[^\"]*\">([^<]*)
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">([^<]*)
-Thierry
Flott! Dette må jeg prøve. Veit du om noe slikt er mulig i Thunderbird,
som jeg pleier å bruke til RSS feeds?
--
Torbjørn
Thierry Matthey
2005-09-15 08:22:38 UTC
Permalink
Post by Torbjørn Kravdal
Flott! Dette må jeg prøve. Veit du om noe slikt er mulig i Thunderbird,
som jeg pleier å bruke til RSS feeds?
du kan installere infoRSS i selve Thunderbird, men ser ikke noe mulighet
for aa faa det under "News & Blogs".

en mulig kunne jo vaere aa lage noe perlskript som tar en url, regexp,
etc ... og sender tilbake en RSS XML ;-)

-Thierry
Haavard Tveite
2005-09-15 13:38:09 UTC
Permalink
Post by Thierry Matthey
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">([^<]*)
Artig.
Jeg har lite erfaring med bruk av regular expressions, men
jeg lurte på om en kanskje kunne matche "body" bedre med:
"style13\">(.*?)</span>

Modifisert regex:
<span class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
--
Håvard Tveite
Department of Mathematical Sciences and Technology, UMB
Drøbakveien 14, POBox 5003, N-1432 Ås, NORWAY
Phone: +47 64965483 Fax: +47 64965401 http://www.umb.no/imt
Thierry Matthey
2005-09-15 13:58:01 UTC
Permalink
Post by Haavard Tveite
Artig.
Jeg har lite erfaring med bruk av regular expressions, men
"style13\">(.*?)</span>
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
godt poeng, men er nok litt usikker om det gaar gjennom, vet bare at
hvis du forer en XML RSS med <a href= ... el. gaar det ikke.

det jeg vet at det ikke fungerer som jeg er vant fra perl :-)

-Thierry
Haavard Tveite
2005-09-15 14:02:09 UTC
Permalink
Post by Thierry Matthey
Post by Haavard Tveite
Artig.
Jeg har lite erfaring med bruk av regular expressions, men
"style13\">(.*?)</span>
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
godt poeng, men er nok litt usikker om det gaar gjennom, vet bare at
hvis du forer en XML RSS med <a href= ... el. gaar det ikke.
Jeg har bare testet den modifiserte regex'en i min Firefox 1.0.4, og
her gir den meg mer av body på de tilfellene jeg har testet.
--
Håvard Tveite
Department of Mathematical Sciences and Technology, UMB
Drøbakveien 14, POBox 5003, N-1432 Ås, NORWAY
Phone: +47 64965483 Fax: +47 64965401 http://www.umb.no/imt
Thierry Matthey
2005-09-15 14:44:24 UTC
Permalink
skal fungere:
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
Thierry Matthey
2005-09-19 06:28:56 UTC
Permalink
Post by Haavard Tveite
<span
class=\"style6\">([^<]*)[^\"]+\"([^\"]*)\"[^\"]+\"[^\"]+\"[^\"]+\"[^\"]+\"[^0-9]*([0-9]+\.[0-9]+\.[0-9]+)[^\"]*\"style13\">(.*?)</span>
tja, etter noen timer begynte jeg aa bli litt irritert og tro at
"(.*?)</span>" gjoer min nettleser ufattelig treg naar det parses
opn.no, da vil jeg heller ha litt mindre tekst ;-)

-Thierry

Loading...