Hoe te krullen of wget een webpagina?

stemmen
16

Ik wil graag een nachtelijke cron job dat mijn StackOverflow pagina haalt en diffs het van de vorige dag pagina te maken, dus ik kan een verandering samenvatting van mijn vragen, antwoorden, ranking, etc. zien

Helaas kon ik de set van cookies, etc recht, om dit werk te krijgen. Iemand een idee?

Ook wanneer de beta is voltooid, zal mijn statuspagina toegankelijk zijn zonder in te loggen?

De vraag is gesteld op 05/08/2008 om 21:38
bron van user
In andere talen...                            


5 antwoorden

stemmen
9

Uw statuspagina is nu beschikbaar zonder in te loggen (klik logout en probeer het). Wanneer de beta-cookie wordt uitgeschakeld, zal er niets tussen u en uw statuspagina zijn.

Voor wget:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
antwoordde op 05/08/2008 om 21:43
bron van user

stemmen
6

Van Mark Harrison

En hier is wat werkt ...

krul -s --cookie soba =. https://stackoverflow.com/users

En voor wget:

wget --no-cookies --header "Cookie: soba=(LookItUpYourself)" https://stackoverflow.com/users/30/myProfile.html
antwoordde op 05/08/2008 om 23:04
bron van user

stemmen
3

Goed idee :)

Ik neem aan dat je hebt gebruikt wget's

--load-cookies (filename)

misschien een beetje helpen, maar het is misschien makkelijker om iets als Mechanize (in Perl of Python) gebruiken om een ​​browser na te bootsen meer volledig in om een ​​goede spin te krijgen.

antwoordde op 05/08/2008 om 21:43
bron van user

stemmen
2

En hier is wat werkt ...

curl -s --cookie soba=. http://stackoverflow.com/users
antwoordde op 05/08/2008 om 22:22
bron van user

stemmen
2

Ik kon niet achterhalen hoe je de cookies om ofwel werken, maar ik was in staat om mijn statuspagina te krijgen in mijn browser terwijl ik uitgelogd, dus ik neem aan dat dit zal werken zodra stackoverflow gaat naar de beurs.

Dit is een interessant idee, maar zal je niet ook ophalen diffs van de onderliggende html code? Heeft u een strategie om te voorkomen dat eindigt met een diff van de html en niet de feitelijke inhoud?

antwoordde op 05/08/2008 om 21:46
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more